«Gemini 2.0 Flash Thinking» — первая модель Google для рассуждений

Сегодня Google выпустила экспериментальную модель «Gemini 2.0 Flash Thinking», которая «явно демонстрирует свои мысли» для решения сложных задач.

Как следует из названия, она построена на базе «скорости и производительности 2.0 Flash». Google утверждает, что она «обучена думать вслух», что «приводит к лучшей производительности в рассуждениях».

В конкуренции с OpenAI o1, Google продемонстрировала несколько примеров работы в области физики и теории вероятностей:

Gemini 2.0 Flash Thinking доступна в Google AI Studio (прямая ссылка) и Vertex AI. Вы можете нажать «Expand to view model thoughts» («Развернуть, чтобы просмотреть мысли модели») и увидеть процесс рассуждения в реальном времени перед получением окончательного ответа. Это «лишь первый шаг на пути [Google] к рассуждениям».

Реклама — прокрутите дальше для получения большего количества контента

Она дебютировала на «1-м месте во ВСЕХ категориях» в рейтинге LLM Chatbot Arena. Буквально вчера Google выпустила 2.0 Experimental Advanced в приложении Gemini, а Gemini-Exp-1206 также заняла первое место в рейтинге.


Скачок от Gemini-2.0-Flash:

  • Общее: №3 → №1
  • Общее (Контроль стиля): №4 → №1
  • Математика: №2 → №1
  • Креативное письмо: №2 → №1
  • Сложные запросы: №1 → №1 (+14 очков)
  • Визуальное восприятие: №1 → №1 (+16 очков)

Еще предстоит увидеть, как это будет в конечном итоге запущено для конечных пользователей. Эти возможности рассуждений, предположительно, будут интегрированы в основную модель в дальнейшем, а позиционирование Google как части семейства Gemini 2.0 является хорошим индикатором этого. В настоящее время у нас уже есть модель для конкретных задач — «1.5 Pro с глубокими исследованиями».

Обновляется…

Еще о Gemini: