ChatGPT стал полноценным виртуальным ассистентом с распознаванием голоса и изображений

Приготовьтесь услышать, что думает ИИ. ChatGPT получает возможности распознавания голоса и изображений в дополнение к собственному голосу, но за это придется заплатить.

Как мы знаем, диалоги в чат-ботах обычно инициируются текстом, а не голосовыми запросами. Такие сервисы, как Bard, ChatGPT и Bing Chat, следуют этим моделям, и мы только начинали считать все это нормальным.

ChatGPT меняет это благодаря новому обновлению, которое добавляет голосовую функцию продвинутой языковой модели. С ее помощью она может зачитывать свои ответы естественным голосом, который соперничает с любым другим доступным на данный момент виртуальным ассистентом. Вы же, в свою очередь, можете использовать свой человеческий голос для задавания вопросов и ведения диалога, как вы делали это раньше с помощью текста.

По сути, ChatGPT теперь имеет реалистично звучащего виртуального ассистента, который может читать вам сказки на ночь и отвечать на все безумные вещи, которые он делал раньше, но уже успокаивающим тоном. OpenAI опубликовала видео с демонстрацией взаимодействия, и это поразительно видеть в действии. Голос ChatGPT естественный и спокойный, приближаясь к той грани, где виртуальная речь становится неотличимой от той, что исходит из голосовых связок.

OpenAI отмечает, что это достигается с помощью актеров озвучивания, хотя для создания этих синтетических голосов из образцов аудио все равно требуется много усилий.

Помимо голоса, вы сможете делать и загружать фотографии и задавать вопросы, что-то вроде того, как работает Google Lens. Он не только распознает объект на фотографии – вы можете обводить предметы, чтобы сфокусировать его внимание – но и позволит вам делать дополнительные фотографии для предоставления контекста.

Опять же, демо-видео ChatGPT сопровождает эту новую функцию распознавания изображений. В видео человек спрашивает о седле велосипеда и о том, как его отрегулировать. После нескольких фотографий ChatGPT знает, что нужно делать, и говорит об этом. Самое впечатляющее во всем этом то, что ChatGPT смог прочитать скриншот руководства к велосипеду и направить человека к правильному инструменту – шестигранному ключу на 4 мм – из его обычного набора инструментов.

Чтобы получить доступ к этим новым функциям, вам нужно быть участником ChatGPT Plus или Enterprise. К тому же, это начинается от 20 долларов в месяц, и вы окажетесь в очереди на получение этого предстоящего обновления, которое должно выйти в ближайшие пару недель. OpenAI отметила, что «другие группы пользователей» увидят функции вскоре после этого, хотя неясно, относится ли это к бесплатным тарифам.