Google представляет Gemini 3 с передовыми возможностями рассуждения, «генеративным пользовательским интерфейсом» для ответов и многим другим

Google сегодня анонсировала Gemini 3 с целью «воплотить любую идею в жизнь». Первая модель, доступная в этом семействе, — Gemini 3 Pro, выпуск которой начинается сегодня для приложения Gemini и AI Mode.

С Gemini 1.0 Google сосредоточилась на нативной мультимодальности и большом контекстном окне. Год спустя Gemini 2.0 привнес продвинутые возможности рассуждения и начало агентных возможностей, в то время как Gemini 2.5 представил глубокие возможности рассуждения и кодирования.

Gemini 3 — в названии которого отсутствует «.0» — является «самой интеллектуальной моделью» Google и позиционируется как помощник, позволяющий «воплотить любую идею в жизнь».

Он начинается с улучшения понимания контекста и намерения вашего запроса, чтобы «вы получали то, что вам нужно, с меньшим количеством подсказок». Gemini 3 является передовым в области рассуждений, с возможностью «улавливать глубину и нюансы», например, «воспринимать тонкие намеки в творческой идее или разбирать перекрывающиеся слои сложной проблемы».

Ответы Gemini 3 Pro стремятся быть «умными, краткими и прямыми, заменяя клише и лесть искренним пониманием». 

Он действует как настоящий партнер по размышлениям, который предлагает новые способы понимания информации и самовыражения: от перевода сложных научных концепций путем генерации кода для высокоточных визуализаций до творческого мозгового штурма.

Бенчмарки

Gemini 3 Pro набрал 1501 балл в LMArena, превзойдя 2.5 Pro (1451), который все еще занимал первое место. Он превосходит заменяемую модель по всем основным бенчмаркам со значительным отрывом: 


  • …демонстрирует рассуждения на уровне докторской степени с высшими баллами в Humanity’s Last Exam (37,5% без использования каких-либо инструментов) и GPQA Diamond (91,9%). 
  • …устанавливает новый стандарт для передовых моделей в математике, достигая нового передового результата в 23,4% на MathArena Apex.
  • Помимо текста, Gemini 3 Pro переосмысливает мультимодальные рассуждения, показывая прорывные результаты: 81% на MMMU-Pro и 87,6% на Video-MMMU
  • …получает передовой результат 72,1% на SimpleQA Verified, демонстрируя значительный прогресс в фактической точности. 
  • …возглавляет таблицу лидеров WebDev Arena, набрав впечатляющие 1487 ELO. 
  • …получает 54,2% на Terminal-Bench 2.0, который тестирует способность модели использовать инструменты для управления компьютером через терминал.
  • …значительно превосходит 2.5 Pro на SWE-bench Verified (76,2%), бенчмарке, измеряющем производительность кодирующих агентов.

Это означает, что Gemini 3 Pro обладает высокой способностью решать сложные проблемы по широкому спектру тем, таких как наука и математика, с высокой степенью надежности.

Сегодня Google также анонсировала режим Gemini 3 Deep Think с еще лучшими возможностями рассуждения и мультимодального понимания. Он превосходит Gemini 3 Pro в Humanity’s Last Exam (41,0% без использования инструментов) и GPQA Diamond (93,8%). Это будет доступно в ближайшие недели для подписчиков AI Ultra.

Он также достигает беспрецедентных 45,1% на ARC-AGI (с выполнением кода), демонстрируя свою способность решать новые задачи.

Генеративный пользовательский интерфейс

Gemini 3 делает возможным создание генеративных пользовательских интерфейсов (или генеративных интерфейсов), где LLM генерируют как контент, так и весь пользовательский опыт. Это включает веб-страницы, игры, инструменты и приложения, которые «автоматически разрабатываются и полностью настраиваются в ответ на любой вопрос, инструкцию или запрос.

Эта работа представляет собой первый шаг к полностью генерируемому ИИ пользовательскому опыту, где пользователи автоматически получают динамические интерфейсы, адаптированные к их потребностям, вместо того, чтобы выбирать из существующего каталога приложений.

За кулисами Gemini 3 Pro использует доступ к инструментам, таким как веб-поиск и генерация изображений, а также «тщательно разработанные системные инструкции». 

Система руководствуется подробными инструкциями, которые включают цель, план, примеры и технические спецификации, включая форматирование, руководства по инструментам и советы по избежанию распространенных ошибок. 

Наконец, вывод проходит через постобработчики, которые решают «потенциальные распространенные проблемы».

Это запускается сегодня в приложении Gemini в качестве экспериментов. Dynamic view видит, как Gemini 3 разрабатывает и кодирует «полностью настраиваемый интерактивный ответ для каждого запроса». 

Он настраивает опыт с пониманием того, что объяснение микробиома 5-летнему ребенку требует другого контента и другого набора функций, чем объяснение его взрослому, так же как создание галереи сообщений в социальных сетях для бизнеса требует совершенно другого интерфейса, чем генерация плана предстоящей поездки.

Visual layout — второй эксперимент, который создает «захватывающий вид в стиле журнала с фотографиями и модулями». Основное отличие от dynamic view заключается в том, что Gemini будет генерировать слайдеры, флажки и другие фильтры, позволяющие вам дополнительно настраивать результаты. 

Сначала вы можете видеть только один из этих экспериментов одновременно, чтобы Google мог собирать отзывы. 

Чтобы узнать больше о том, что Gemini 3 предлагает приложению Gemini (включая Gemini Agent), прочитайте нашу статью здесь

Тем временем, это первый раз, когда новая модель появляется в Google Поиске и AI Mode одновременно с приложением Gemini. Начиная с этой недели, подписчики AI Pro и AI Ultra могут перейти в выпадающее меню в верхнем левом углу и выбрать «Thinking: 3 Pro reasoning and generative layouts».

С Gemini 3 техника Google по рассылке запросов (query fan-out) может выполнять больше поисковых запросов, чем раньше, задавая более тонкие вопросы для улучшения окончательного ответа.

AI Mode также будет создавать генеративные пользовательские интерфейсы для творческих интерактивных инструментов и симуляций. Например, Google может создать ипотечный калькулятор, который позволит вам менять процентные ставки и первоначальный взнос. Другим примером является получение симуляции физических процессов при изучении тем.

Gemini 3 скоро появится у всех (бесплатных) пользователей AI Mode в США, причем подписчики получат более высокие лимиты.

Заглядывая в будущее, Google в ближайшие недели обновит автоматический выбор моделей для Поиска для подписчиков, чтобы отправлять сложные вопросы Gemini 3, «продолжая использовать более быстрые модели для простых задач».

Google Antigravity

С Gemini 3 был анонсирован Google Antigravity — новая платформа разработки агентов, которая позволяет разработчикам «работать на более высоком, ориентированном на задачи уровне». В этой IDE агенты работают в редакторе, терминале и браузере. Доступно сейчас на Mac, Windows и Linux, она использует Gemini 3, Gemini 2.5 Computer Use и Nano Banana.

Теперь агенты могут автономно планировать и выполнять сложные, сквозные программные задачи одновременно от вашего имени, проверяя собственный код.