Google протестировала ряд новых ИИ-моделей для написания кода под Android — вот рейтинг

Google вновь обновила рейтинг «Android Bench», в котором представлены лучшие ИИ-модели для разработки приложений под Android. В список вошло множество новых моделей с «открытыми весами» (open-weight), а также появились подробные данные об использованных токенах и стоимости эксплуатации этих моделей.

Одна из областей, в которой большие языковые модели стали по-настоящему хороши — это программирование. Их способность помогать в разработке приложений и других программных проектов привела к появлению термина «vibe coding» (программирование по наитию). Ранее в этом году Google опубликовала новый бенчмарк-рейтинг, в котором были представлены «лучшие» ИИ-модели для Android-разработки с учетом распространенных задач и того, насколько хорошо эти модели придерживаются лучших практик.

Когда «Android Bench» был представлен впервые, лидировала Gemini 3.1 Pro, а позже GPT 5.4 от OpenAI разделила первое место.

По состоянию на обновление от 18 мая 2026 года, у рейтинга новый лидер. По данным Google, GPT 5.5 на текущий момент является лучшей ИИ-моделью для разработки Android-приложений, опережая GPT 5.4 и Gemini 3.1 Pro чуть менее чем на 2%.

Это обновление также позволяет лучше оценить ситуацию, поскольку Google теперь отображает среднюю задержку (latency), общее количество использованных токенов и среднюю стоимость использования каждой модели. В своей документации к бенчмарку Google подробно описывает, как был рассчитан каждый показатель.

  • Средняя задержка: время, затраченное на решение 100 задач за 10 прогонов
  • Среднее общее количество токенов: потребление токенов при полном прогоне бенчмарка за 10 попыток
  • Средняя стоимость: стоимость одного прогона бенчмарка на момент тестирования в долларах США

Имея это в виду, можно заметить, что хотя GPT 5.5 немного мощнее, выполнение той же функции обходится более чем в два раза дороже, чем при использовании Gemini 3.1 Pro.

Вот десятка лучших моделей по версии Google, включая новые данные (по состоянию на 21 мая 2026 г.):

Модель Оценка Ср. задержка Ср. кол-во токенов Ср. стоимость
Новинка: GPT 5.5 74 15.5 64.5 $133.9
GPT 5.4 72.4 21.2 64.2 $91.7
Gemini 3.1 Pro Preview 72.4 11.5 75.4 $49.0
Новинка: Claude Opus 4.7 68.7 11.6 90.0 $124.3
GPT 5.3 Codex 67.7 11.2 71.4 $42.6
Claude Opus 4.6 66.6 9.9 69.5 $84.4
GPT 5.2 Codex 62.5 24.3 124.4 $121.9
Claude Opus 4.5 61.9 12.5 79.8 $102.5
Gemini 3 Pro Preview 60.4 9.8 117.0 $63.7
Новинка: GLM 5.1 59.7 33.4 80.2 $46.7

Как уже упоминалось, в рейтинге стало больше моделей с открытыми весами, включая Gemma, Qwen, DeepSeek, MiMo и другие. Среди них самый высокий балл получил GLM 5.1, за ним следует Kimi K2.6.

Вы можете ознакомиться с полным рейтингом на сайте Google.

Google продолжает обновлять «Android Bench» примерно раз в месяц. Учитывая, что скоро выйдет Gemini 3.5 Pro, а версия 3.5 Flash уже доступна, будет интересно посмотреть, смогут ли собственные модели Google вернуть лидерство, которое сейчас перехватила OpenAI.

Используете ли вы ИИ-модели для разработки Android-приложений? Если да, то какие?

Еще об Android: