
В декабре была анонсирована Gemini 2.0 Flash Thinking как первая модель рассуждений от Google, и теперь доступна обновленная экспериментальная версия для тестирования.
Построенная на основе 2.0 Flash, анонсированной ранее в том же месяце, эта модель «явно демонстрирует свои мысли» (как в AI Studio) для улучшения производительности рассуждений, с возможностью решать более сложные задачи. Она присоединяется к gemini-2.0-flash-exp и gemini-exp-1206.

Сегодня Google выпустила Gemini 2.0 Flash Thinking Experimental 01-21 (дефис между месяцем и днем — новая особенность в схеме именования моделей Google) со следующими улучшениями:
- Контекстное окно в 1 миллион токенов (вместо 32 тысяч): это полезно для тех, кто хочет «подключить кодовую базу или запрашивать набор статей с более сложными рассуждениями».
- Встроенная поддержка выполнения кода: для улучшения использования инструментов.
- Генерация более длинных выходных токенов.
- Менее частые противоречия модели («сниженная вероятность противоречий между мыслью и ответом»).
We’ve also enabled code execution as a tool, so the model can decide to write and execute code during its response. You can enable it in the sidebar in AI Studio!
Here’s a fun example where the model ballparks the solution with a formula, but writes some python code to arrive at… pic.twitter.com/j8wNp8Yn27
— Jack Rae (@jack_w_rae) January 21, 2025
По сравнению с Exp 1219, она демонстрирует «лучшую производительность по бенчмаркам математики, естественных наук и мультимодальных рассуждений», включая 73,3% на AIME2024 (математика) и 74,2% на GPQA Diamond (естественные науки).

Генеральный директор DeepMind Демис Хассабис заявил, что это «представляет собой супербыстрый прогресс с момента нашего первого выпуска всего в прошлом декабре». В более широком смысле:
Мы занимаемся разработкой таких систем планирования уже более десяти лет, начиная с таких программ, как AlphaGo, и очень радует видеть мощное сочетание этих идей с наиболее способными базовыми моделями.
Gemini 2.0 Flash Thinking Experimental доступна для бесплатного тестирования в Google AI Studio и через API. Заглядывая в будущее, Сундар Пичаи говорит, что «прогресс в масштабировании мышления невероятен, и мы продолжим итерации», с «еще большим».
Тем временем, ранее в этом месяце Google обновила мобильный интерфейс для AI Studio:
We just shipped an updated Google AI Studio mobile experience. It’s time to prompt! 🚢 pic.twitter.com/68XYUqs0Wi
— Logan Kilpatrick (@OfficialLoganK) January 17, 2025