Google протестировала ряд новых ИИ-моделей для написания кода под Android — вот рейтинг

Ben Schoon | Четверг, 21 мая, 2026, 12:15.

Бен Скун | 21 мая 2026 г. — 12:15 PT

Google вновь обновила рейтинг «Android Bench», в котором представлены лучшие ИИ-модели для разработки приложений под Android. В список вошло множество новых моделей с «открытыми весами» (open-weight), а также появились подробные данные об использованных токенах и стоимости эксплуатации этих моделей.

Одна из областей, в которой большие языковые модели стали по-настоящему хороши — это программирование. Их способность помогать в разработке приложений и других программных проектов привела к появлению термина «vibe coding» (программирование по наитию). Ранее в этом году Google опубликовала новый бенчмарк-рейтинг, в котором были представлены «лучшие» ИИ-модели для Android-разработки с учетом распространенных задач и того, насколько хорошо эти модели придерживаются лучших практик.

Когда «Android Bench» был представлен впервые, лидировала Gemini 3.1 Pro, а позже GPT 5.4 от OpenAI разделила первое место.

По состоянию на обновление от 18 мая 2026 года, у рейтинга новый лидер. По данным Google, GPT 5.5 на текущий момент является лучшей ИИ-моделью для разработки Android-приложений, опережая GPT 5.4 и Gemini 3.1 Pro чуть менее чем на 2%.

Это обновление также позволяет лучше оценить ситуацию, поскольку Google теперь отображает среднюю задержку (latency), общее количество использованных токенов и среднюю стоимость использования каждой модели. В своей документации к бенчмарку Google подробно описывает, как был рассчитан каждый показатель.

Средняя задержка: время, затраченное на решение 100 задач за 10 прогонов
Среднее общее количество токенов: потребление токенов при полном прогоне бенчмарка за 10 попыток
Средняя стоимость: стоимость одного прогона бенчмарка на момент тестирования в долларах США

Имея это в виду, можно заметить, что хотя GPT 5.5 немного мощнее, выполнение той же функции обходится более чем в два раза дороже, чем при использовании Gemini 3.1 Pro.

Вот десятка лучших моделей по версии Google, включая новые данные (по состоянию на 21 мая 2026 г.):

Модель	Оценка	Ср. задержка	Ср. кол-во токенов	Ср. стоимость
Новинка: GPT 5.5	74	15.5	64.5	$133.9
GPT 5.4	72.4	21.2	64.2	$91.7
Gemini 3.1 Pro Preview	72.4	11.5	75.4	$49.0
Новинка: Claude Opus 4.7	68.7	11.6	90.0	$124.3
GPT 5.3 Codex	67.7	11.2	71.4	$42.6
Claude Opus 4.6	66.6	9.9	69.5	$84.4
GPT 5.2 Codex	62.5	24.3	124.4	$121.9
Claude Opus 4.5	61.9	12.5	79.8	$102.5
Gemini 3 Pro Preview	60.4	9.8	117.0	$63.7
Новинка: GLM 5.1	59.7	33.4	80.2	$46.7

Как уже упоминалось, в рейтинге стало больше моделей с открытыми весами, включая Gemma, Qwen, DeepSeek, MiMo и другие. Среди них самый высокий балл получил GLM 5.1, за ним следует Kimi K2.6.

Вы можете ознакомиться с полным рейтингом на сайте Google.

Google продолжает обновлять «Android Bench» примерно раз в месяц. Учитывая, что скоро выйдет Gemini 3.5 Pro, а версия 3.5 Flash уже доступна, будет интересно посмотреть, смогут ли собственные модели Google вернуть лидерство, которое сейчас перехватила OpenAI.

Используете ли вы ИИ-модели для разработки Android-приложений? Если да, то какие?

Google протестировала ряд новых ИИ-моделей для написания кода под Android — вот рейтинг

Еще об Android: