Google анонсировала Gemma 3 как «лучшую в мире модель для одного ускорителя»

После первой версии в феврале 2024 года и второй в мае, Google сегодня объявила о выпуске Gemma 3 — своей новейшей открытой модели для разработчиков.

Gemma — это семейство открытых моделей Google, насчитывающее более 100 миллионов загрузок за прошедший год и 60 000 вариантов Gemma в так называемой «Gemmaverse». Они «разработаны для быстрой работы непосредственно на устройствах — от телефонов и ноутбуков до рабочих станций».

Gemma 3 «построена на основе тех же исследований и технологий, которые используются» в моделях Gemini 2.0. Она доступна в версиях размером 1B, 4B, 12B и 27B.

Google особо подчеркивает, что Gemma 3 является «лучшей в мире моделью для одного ускорителя» (один GPU или TPU). В частности, она превосходит Llama-405B, DeepSeek-V3 и o3-mini в LMArena.

Реклама — прокрутите дальше, чтобы увидеть больше контента

Google заявляет об «улучшенных возможностях для рассуждений с текстом и визуальным контентом» для «анализа изображений, текста и коротких видео» в версиях от 4B и выше. Контекстное окно составляет 128 тысяч токенов, а поддержка более 35 языков реализована «из коробки», с предварительно обученной поддержкой более 140 языков. Кроме того:

  • Создавайте рабочие процессы на основе ИИ с использованием вызовов функций: Gemma 3 поддерживает вызовы функций и структурированный вывод, помогая автоматизировать задачи и создавать агентные решения.
  • Высокая производительность стала быстрее благодаря квантованным моделям: Gemma 3 представляет официальные квантованные версии, уменьшая размер модели и вычислительные требования при сохранении высокой точности.

Что касается безопасности, существует «мощный 4B-детектор безопасности изображений» под названием ShieldGemma 2: «готовое решение для обеспечения безопасности изображений, выводящее метки безопасности по трем категориям: опасный контент, сексуально откровенный и насилие». Google также заявляет об «обширном управлении данными, согласовании с нашими политиками безопасности посредством тонкой настройки и надежных оценок на основе бенчмарков» в процессе разработки.

… Улучшенная производительность Gemma 3 в области STEM потребовала проведения специальных оценок, направленных на выявление потенциального злоупотребления при создании вредных веществ; результаты этих оценок указывают на низкий уровень риска.

Вы можете попробовать ее прямо сейчас в Google AI Studio, а загрузки модели доступны через Kaggle или Hugging Face.