
Google вновь обновила рейтинг «Android Bench», в котором представлены лучшие ИИ-модели для разработки приложений под Android. В список вошло множество новых моделей с «открытыми весами» (open-weight), а также появились подробные данные об использованных токенах и стоимости эксплуатации этих моделей.
Одна из областей, в которой большие языковые модели стали по-настоящему хороши — это программирование. Их способность помогать в разработке приложений и других программных проектов привела к появлению термина «vibe coding» (программирование по наитию). Ранее в этом году Google опубликовала новый бенчмарк-рейтинг, в котором были представлены «лучшие» ИИ-модели для Android-разработки с учетом распространенных задач и того, насколько хорошо эти модели придерживаются лучших практик.
Когда «Android Bench» был представлен впервые, лидировала Gemini 3.1 Pro, а позже GPT 5.4 от OpenAI разделила первое место.
По состоянию на обновление от 18 мая 2026 года, у рейтинга новый лидер. По данным Google, GPT 5.5 на текущий момент является лучшей ИИ-моделью для разработки Android-приложений, опережая GPT 5.4 и Gemini 3.1 Pro чуть менее чем на 2%.
Это обновление также позволяет лучше оценить ситуацию, поскольку Google теперь отображает среднюю задержку (latency), общее количество использованных токенов и среднюю стоимость использования каждой модели. В своей документации к бенчмарку Google подробно описывает, как был рассчитан каждый показатель.
- Средняя задержка: время, затраченное на решение 100 задач за 10 прогонов
- Среднее общее количество токенов: потребление токенов при полном прогоне бенчмарка за 10 попыток
- Средняя стоимость: стоимость одного прогона бенчмарка на момент тестирования в долларах США
Имея это в виду, можно заметить, что хотя GPT 5.5 немного мощнее, выполнение той же функции обходится более чем в два раза дороже, чем при использовании Gemini 3.1 Pro.
Вот десятка лучших моделей по версии Google, включая новые данные (по состоянию на 21 мая 2026 г.):
| Модель | Оценка | Ср. задержка | Ср. кол-во токенов | Ср. стоимость |
| Новинка: GPT 5.5 | 74 | 15.5 | 64.5 | $133.9 |
| GPT 5.4 | 72.4 | 21.2 | 64.2 | $91.7 |
| Gemini 3.1 Pro Preview | 72.4 | 11.5 | 75.4 | $49.0 |
| Новинка: Claude Opus 4.7 | 68.7 | 11.6 | 90.0 | $124.3 |
| GPT 5.3 Codex | 67.7 | 11.2 | 71.4 | $42.6 |
| Claude Opus 4.6 | 66.6 | 9.9 | 69.5 | $84.4 |
| GPT 5.2 Codex | 62.5 | 24.3 | 124.4 | $121.9 |
| Claude Opus 4.5 | 61.9 | 12.5 | 79.8 | $102.5 |
| Gemini 3 Pro Preview | 60.4 | 9.8 | 117.0 | $63.7 |
| Новинка: GLM 5.1 | 59.7 | 33.4 | 80.2 | $46.7 |
Как уже упоминалось, в рейтинге стало больше моделей с открытыми весами, включая Gemma, Qwen, DeepSeek, MiMo и другие. Среди них самый высокий балл получил GLM 5.1, за ним следует Kimi K2.6.
Вы можете ознакомиться с полным рейтингом на сайте Google.
Google продолжает обновлять «Android Bench» примерно раз в месяц. Учитывая, что скоро выйдет Gemini 3.5 Pro, а версия 3.5 Flash уже доступна, будет интересно посмотреть, смогут ли собственные модели Google вернуть лидерство, которое сейчас перехватила OpenAI.
Используете ли вы ИИ-модели для разработки Android-приложений? Если да, то какие?
Еще об Android:
- Google AI Studio теперь может создавать Android-приложения, а Android Studio добавила возможность портирования iOS-приложений
- В Android внедряют «Контекстные подсказки» на базе ИИ, которые обучаются на ваших привычках
- Gemini Intelligence добавляет генеративные виджеты и функцию Gboard «Rambler» в Android, дебют на Pixel и Samsung