
Сегодня Google анонсировала Gemma 4 — свою последнюю открытую модель. Она «создана на основе тех же передовых исследований и технологий, что и Gemini 3».
Gemma 4 доступна в четырех размерах для различных устройств: от Android до графических процессоров ноутбуков и разработческих станций/ускорителей:
- 31B Dense: «#3 открытая модель в мире в отраслевом рейтинге Arena AI text leaderboard»
- 26B Mixture of Experts (MoE): «#6»
- Effective 4B (E4B)
- Effective 2B (E2B)
Для моделей с 2 и 4 миллиардами параметров Google сотрудничала с командами Pixel, Qualcomm и MediaTek. Модель может работать на телефонах, Raspberry Pi и Jetson Nano с «близкой к нулевой задержкой».
Google утверждает, что Gemma 4 способна выполнять задачи от простого чата до «сложной логики и агентных рабочих процессов», при этом компания отмечает, что она «превосходит модели в 20 раз большего размера». Пограничные модели имеют контекстное окно 128K, в то время как более крупные варианты достигают 256K, что позволяет обрабатывать длинные документы и репозитории в одном запросе.
Все модели нативно обрабатывают видео и изображения, что позволяет выполнять оптическое распознавание символов (OCR) и анализ диаграмм. Модели E2B и E4B имеют нативную поддержку аудиовхода для распознавания и понимания речи. Gemma 4 нативно обучена на более чем 140 языках.
Другие основные моменты включают:
- Продвинутое рассуждение: Gemma 4 способна к многошаговому планированию и глубокой логике, демонстрируя значительные улучшения в тестах по математике и следованию инструкциям, которые этого требуют.
- Агентные рабочие процессы: Нативная поддержка вызова функций, структурированного вывода JSON и системных инструкций позволяет создавать автономных агентов, которые могут взаимодействовать с различными инструментами и API и надежно выполнять рабочие процессы.
- Генерация кода: Gemma 4 поддерживает высококачественный офлайн-код, превращая вашу рабочую станцию в мощный локальный ИИ-помощник по программированию.
Тем временем Gemma 4 выпускается под коммерчески ориентированной и дружелюбной к бизнесу лицензией Apache 2.0.
Эта лицензия на открытый исходный код обеспечивает основу для полной гибкости разработчиков и цифрового суверенитета, предоставляя вам полный контроль над вашими данными, инфраструктурой и моделями. Она позволяет вам свободно создавать и безопасно развертывать решения в любой среде, будь то локально или в облаке.
Вы можете получить доступ к Gemma 4 в Google AI Studio (31B и 26B MoE) или в Google AI Edge Gallery (E4B и E2B).
Получите веса моделей на Hugging Face, Kaggle или Ollama.