Приложение Gemini представляет камеру 2.5 Flash & Live и режим Deep Think 2.5 Pro

Abner Li | Вторник, 20 мая, 2025, 22:56.

На конференции I/O 2025 Google анонсировал ряд обновлений для приложения Gemini, включая запуск Gemini 2.5 Flash и камеру Gemini Live с возможностью демонстрации экрана для iOS.

Обновления моделей

Обновление Gemini 2.5 Flash, которое Google впервые представил в апреле, улучшает его производительность в задачах рассуждения, мультимодальности, кодирования и работе с длинными контекстами, при этом повышая эффективность за счет использования на 20-30% меньше токенов. Теперь оно доступно всем пользователям приложения Gemini, а обновленная предварительная версия (05-20) уже доступна в Google AI Studio и Vertex AI. Общая доступность для разработчиков и корпоративных клиентов ожидается «в начале июня». Gemini 2.5 Pro достигнет общей доступности «вскоре после этого».

Google анонсировал Gemini 2.5 Deep Think с продвинутыми возможностями мышления, лидирующими по всем бенчмаркам в областях математики (USAMO 2025), кода (LiveCodeBench v6) и мультимодальности (MMMU). Этот «улучшенный режим рассуждения» использует «новые исследовательские методики, позволяющие модели рассматривать несколько гипотез перед ответом».

Компания «выделяет дополнительное время на проведение более глубоких оценок безопасности и получение дальнейших отзывов от экспертов по безопасности». Сначала он будет доступен доверенным тестировщикам через Gemini API для сбора обратной связи «перед широким распространением». После этого режим Gemini 2.5 Deep Think станет доступен потребителям в рамках подписки Google AI Ultra.

Реклама — прокрутите дальше, чтобы увидеть больше контента

Мы продолжим совершенствовать Deep Think на основе наших оценок безопасности и отзывов пользователей, прежде чем выпустить его более широко.

Google также анонсировал Imagen 4 с «жизненной детализацией» и улучшенным выводом текста/типографики, а также повышением скорости. Он доступен в приложении Gemini уже сегодня. Veo 3 с возможностью нативной генерации звука доступен в приложении Gemini (США) для пользователей Google AI Ultra. Это включает звуковые эффекты, фоновые шумы и диалоги между персонажами.

Новые функции Gemini

Что касается новых функций приложения Gemini на I/O 2025, Google внедряет камеру и демонстрацию экрана на базе Project Astra в приложения для iPhone и iPad после дебюта на Android в прошлом месяце. Полноэкранный интерфейс Gemini Live будет содержать новые кнопки для запуска этой функции. Она доступна всем (бесплатным) пользователям и начнет развертываться на iOS сегодня.

В ближайшие недели Gemini Live получит поддержку приложений/расширений Gemini для Google Карт, Календаря, Задач и Keep. В рамках беседы Live сможет создавать события в Календаре и выполнять поиск на Картах, а в будущем ожидается поддержка других собственных сервисов.

Deep Research теперь (начиная с сегодняшнего дня) может объединять общедоступные данные с вашими частными PDF-файлами и изображениями для «целостного понимания, перекрестного сопоставления ваших уникальных знаний с более широкими тенденциями». Интеграция с Gmail и Google Диском «скоро появится».

Например, специалист по маркетингу теперь может загружать внутренние данные о продажах (в формате PDF) для перекрестного сопоставления с общедоступными рыночными тенденциями, и все это в рамках Deep Research. Или ученый может использовать конкретные, труднодоступные научные статьи для обогащения своего литературного обзора.

Тем временем, когда вы что-то написали с помощью Gemini Canvas, новое меню «Создать» позволит генерировать из этого веб-страницу, инфографику и викторину, а также существующий Аудиообзор. Также имеется открытое поле ввода «Опишите свое собственное приложение».

Gemini также добавляет интерактивные викторины:

Например, просто попросите Gemini «создать практическую викторину по термодинамике» и погрузитесь в индивидуальный учебный процесс. По мере ответов Gemini предоставляет мгновенную обратную связь, выделяя темы, требующие большего внимания. По завершении Gemini проактивно предлагает персонализированную последующую викторину, сосредоточенную на областях, которые вы нашли трудными, помогая вам превратить слабости в сильные стороны.

Подписчики Google AI Ultra скоро получат «Режим агента» на gemini.google.com на базе Project Mariner: «Представьте, что вы просто излагаете свою цель, а Gemini интеллектуально организует шаги для ее достижения». У вас будет чат слева, а справа — окно браузера. Это объединяет «веб-браузинг, углубленные исследования и интеллектуальные интеграции с вашими приложениями Google»