Обновленная экспериментальная модель Gemini 2.0 Flash Thinking теперь доступна

В декабре была анонсирована Gemini 2.0 Flash Thinking как первая модель рассуждений от Google, и теперь доступна обновленная экспериментальная версия для тестирования.

Построенная на основе 2.0 Flash, анонсированной ранее в том же месяце, эта модель «явно демонстрирует свои мысли» (как в AI Studio) для улучшения производительности рассуждений, с возможностью решать более сложные задачи. Она присоединяется к gemini-2.0-flash-exp и gemini-exp-1206.

Сегодня Google выпустила Gemini 2.0 Flash Thinking Experimental 01-21 (дефис между месяцем и днем — новая особенность в схеме именования моделей Google) со следующими улучшениями:

  • Контекстное окно в 1 миллион токенов (вместо 32 тысяч): это полезно для тех, кто хочет «подключить кодовую базу или запрашивать набор статей с более сложными рассуждениями».
  • Встроенная поддержка выполнения кода: для улучшения использования инструментов.
  • Генерация более длинных выходных токенов.
  • Менее частые противоречия модели («сниженная вероятность противоречий между мыслью и ответом»).

По сравнению с Exp 1219, она демонстрирует «лучшую производительность по бенчмаркам математики, естественных наук и мультимодальных рассуждений», включая 73,3% на AIME2024 (математика) и 74,2% на GPQA Diamond (естественные науки).

Реклама — прокрутите дальше для получения контента

Генеральный директор DeepMind Демис Хассабис заявил, что это «представляет собой супербыстрый прогресс с момента нашего первого выпуска всего в прошлом декабре». В более широком смысле:

Мы занимаемся разработкой таких систем планирования уже более десяти лет, начиная с таких программ, как AlphaGo, и очень радует видеть мощное сочетание этих идей с наиболее способными базовыми моделями.

Gemini 2.0 Flash Thinking Experimental доступна для бесплатного тестирования в Google AI Studio и через API. Заглядывая в будущее, Сундар Пичаи говорит, что «прогресс в масштабировании мышления невероятен, и мы продолжим итерации», с «еще большим».

Тем временем, ранее в этом месяце Google обновила мобильный интерфейс для AI Studio:

Подробнее о Gemini: