Google анонсирует Gemini 2.0 с фокусом на агентность, который появится в приложении Gemini

Abner Li | Среда, 11 декабря, 2024, 07:33.

Всего через год после версии 1.0 Google сегодня анонсировала Gemini 2.0 как свою «новую ИИ-модель для эпохи агентности».

Генеральный директор Сундар Пичаи резюмирует это так: «Если Gemini 1.0 был об организации и понимании информации, то Gemini 2.0 — о том, чтобы сделать ее гораздо более полезной». Для Google агенты — это системы, которые делают что-то от вашего имени, будучи способными рассуждать, планировать и обладать памятью.

Google детализирует возможности Gemini 2.0 Project Astra, браузерный агент ‘Mariner’

Первая доступная модель — Gemini 2.0 Flash, которая, как отмечается, «превосходит 1.5 Pro по ключевым показателям» — в области кода, фактической точности, математики, рассуждений и многого другого — вдвое быстрее.

Она поддерживает мультимодальный вывод, такой как «нативно сгенерированные изображения в сочетании с текстом» для «разговорного, многооборотного редактирования», а также многоязычное аудио, которое разработчики могут настраивать (голоса, языки и акценты). Наконец, она может нативно вызывать инструменты, такие как Google Поиск (для получения более точных ответов) и выполнять код.

Реклама – прокрутите вниз для получения дополнительного контента

Экспериментальная версия Gemini 2.0 Flash доступна сегодня в AI Studio и Vertex AI для разработчиков. Она станет общедоступной (GA) в январе, с появлением дополнительных размеров моделей. Google также представляет новый Multimodal Live API для «аудио-, видеопотокового ввода в реальном времени» с камер или экранов.

Для конечных пользователей в приложении Gemini новая модель обеспечивает «еще более полезного помощника Gemini». Пользователи Gemini и Gemini Advanced смогут использовать оптимизированную для чата версию 2.0 Flash экспериментально на gemini.google.com на этой неделе. Перейдите в выпадающее меню моделей в верхнем левом углу. Доступ в мобильное приложение появится «скоро».

Связанное: Gemini изменяет текстовое поле, добавляет информацию о модели в приложение для Android

Google также начинает тестирование Gemini 2.0 в разделе AI Overviews в Поиске. Это позволит сгенерированному ответу отвечать на «более сложные темы и многоступенчатые вопросы, включая продвинутые математические уравнения, мультимодальные запросы и программирование». Он станет «более широко» доступен в начале следующего года.

Наконец, Gemini 2.0 появится в большем количестве продуктов Google в начале следующего года.