
Сегодня OpenAI анонсировала несколько крупных обновлений для ChatGPT и своих моделей GPT, причем некоторые из лучших функций ИИ теперь доступны бесплатно всем пользователям, а также значительное обновление, позволяющее использовать видео в реальном времени в запросах.
Сегодня существует два способа доступа к ChatGPT. Есть бесплатный уровень на основе GPT 3.5, который мощный, но ему не хватает расширенных функций, таких как загрузка файлов, пользовательские GPT, доступ к Интернету и многое другое. Затем есть платный уровень, который использует последнюю модель GPT-4.
Сегодня OpenAI открывает доступ к GPT-4o, новой модели, которая работает еще быстрее, чем GPT-4, что позволяет запустить многие премиум-функции для всех бесплатных пользователей. Это включает загрузку изображений и многое другое, а также некоторые новые функции. Сэм Альтман говорит, что GPT-4o «нативно мультимодальный» и может использовать текст, изображения, видео и голос в качестве входных данных для запросов, а также что новая модель будет стоить вдвое дешевле для пользователей API.
Функции, доступные бесплатным пользователям ChatGPT в будущем, будут включать следующее, сообщает OpenAI:
- Испытайте интеллект уровня GPT-4
- Получайте ответы(открывается в новом окне) как от модели, так и из сети
- Анализируйте данные(открывается в новом окне) и создавайте диаграммы
- Обсуждайте фотографии, которые вы делаете
- Загружайте файлы(открывается в новом окне) для помощи в обобщении, написании или анализе
- Открывайте и используйте GPT и GPT Store
- Создавайте более полезный опыт с Памятью
Одним из впечатляющих новых демо-показов обновления GPT 4o для ChatGPT стало использование видео в реальном времени. Это позволяет взаимодействовать с запросами в разговорной манере. Это было продемонстрировано с линейными уравнениями, а также с тем, как ChatGPT смотрел на лицо человека (после того, как ему сказали не использовать предыдущее изображение стола) и использовал это изображение для определения его настроения.
Примечательно, что Google ранее сегодня продемонстрировал аналогичную функциональность для Gemini.
Однако, возможно, еще более впечатляющим стал новый аудиоинтерфейс в ChatGPT. Голосом чат-бота теперь может управлять пользователь, а такие команды, как «будь более драматичным» или «звучи как робот», изменяют звучание голоса ChatGPT.
OpenAI поделилась несколькими другими демонстрационными материалами на своем веб-сайте.
Другим важным анонсом стало приложение ChatGPT для macOS (Windows появится позднее в этом году). Новое приложение может использовать голосовой и текстовый ввод, а также «визуальный» ввод с помощью демонстрации экрана. Веб-интерфейс ChatGPT также получит редизайн.
OpenAI сообщает, что эти новые функции будут развертываться в течение «ближайших нескольких недель».