Обновленная экспериментальная модель Gemini 2.0 Flash Thinking теперь доступна

Abner Li | Вторник, 21 января, 2025, 07:33.

В декабре была анонсирована Gemini 2.0 Flash Thinking как первая модель рассуждений от Google, и теперь доступна обновленная экспериментальная версия для тестирования.

Построенная на основе 2.0 Flash, анонсированной ранее в том же месяце, эта модель «явно демонстрирует свои мысли» (как в AI Studio) для улучшения производительности рассуждений, с возможностью решать более сложные задачи. Она присоединяется к gemini-2.0-flash-exp и gemini-exp-1206.

Сегодня Google выпустила Gemini 2.0 Flash Thinking Experimental 01-21 (дефис между месяцем и днем — новая особенность в схеме именования моделей Google) со следующими улучшениями:

Контекстное окно в 1 миллион токенов (вместо 32 тысяч): это полезно для тех, кто хочет «подключить кодовую базу или запрашивать набор статей с более сложными рассуждениями».
Встроенная поддержка выполнения кода: для улучшения использования инструментов.
Генерация более длинных выходных токенов.
Менее частые противоречия модели («сниженная вероятность противоречий между мыслью и ответом»).

We’ve also enabled code execution as a tool, so the model can decide to write and execute code during its response. You can enable it in the sidebar in AI Studio!

Here’s a fun example where the model ballparks the solution with a formula, but writes some python code to arrive at… pic.twitter.com/j8wNp8Yn27

— Jack Rae (@jack_w_rae) January 21, 2025

По сравнению с Exp 1219, она демонстрирует «лучшую производительность по бенчмаркам математики, естественных наук и мультимодальных рассуждений», включая 73,3% на AIME2024 (математика) и 74,2% на GPQA Diamond (естественные науки).

Реклама — прокрутите дальше для получения контента

Генеральный директор DeepMind Демис Хассабис заявил, что это «представляет собой супербыстрый прогресс с момента нашего первого выпуска всего в прошлом декабре». В более широком смысле:

Мы занимаемся разработкой таких систем планирования уже более десяти лет, начиная с таких программ, как AlphaGo, и очень радует видеть мощное сочетание этих идей с наиболее способными базовыми моделями.

Gemini 2.0 Flash Thinking Experimental доступна для бесплатного тестирования в Google AI Studio и через API. Заглядывая в будущее, Сундар Пичаи говорит, что «прогресс в масштабировании мышления невероятен, и мы продолжим итерации», с «еще большим».

Тем временем, ранее в этом месяце Google обновила мобильный интерфейс для AI Studio:

We just shipped an updated Google AI Studio mobile experience. It’s time to prompt! 🚢 pic.twitter.com/68XYUqs0Wi

— Logan Kilpatrick (@OfficialLoganK) January 17, 2025

Обновленная экспериментальная модель Gemini 2.0 Flash Thinking теперь доступна

Подробнее о Gemini: