Google обновляет лучшие ИИ-модели для разработки Android-приложений: Gemini и GPT 5.4 лидируют

Обновлен «Android Bench» – система оценки ИИ-моделей, используемых при разработке Android-приложений, где последняя модель OpenAI теперь делит первое место с Gemini.

Впервые представленный в марте, «Android Bench» является ресурсом Google для измерения эффективности лучших ИИ-моделей при написании кода для Android-приложений. Методология Google включает оценку того, как модели работают с Jetpack Compose для пользовательского интерфейса, Coroutines и Flows для асинхронного программирования, Room для персистентности и Hilt для внедрения зависимостей, среди прочих факторов.

В первом обновлении этого списка Google добавил две новые модели: GPT 5.4 от OpenAI и GPT 5.3 Codex, которые быстро поднялись на вершину списка.

Лучшие ИИ для разработки Android-приложений по версии Google (9.04.26)

  • Новое: GPT 5.4: 72,4%
  • Gemini 3.1 Pro Preview: 72,4%
  • Новое: GPT 5.3-Codex: 67,7%
  • Claude Opus 4.6: 66,6%
  • GPT-5.2 Codex: 62,5%
  • Claude Opus 4.5: 61,9%
  • Gemini 3 Pro Preview: 60,4%
  • Claude Sonnet 4.6: 58,4%
  • Claude Sonnet 4.5: 54,2%
  • Gemini 3 Flash Preview: 42%
  • Gemini 2.5 Flash: 16,1%

Остальная часть списка на этот раз не изменилась, поскольку использованные результаты по-прежнему относятся к концу февраля первоначального тестирования. Последние модели OpenAI были протестированы в середине марта перед выпуском этих результатов на этой неделе.

Конечно, к этим результатам не следует относиться как к абсолютной истине. Как и в случае с *любым* тестом, реальность часто отличается от контролируемых испытаний. Существует множество переменных, из-за которых одна модель может работать лучше для вас, чем другая, включая рабочий процесс, ценность и многое другое.

Google изначально заявлял, что цель публикации этих результатов — помочь разработчикам быть «более продуктивными» и, в конечном итоге, создавать «более качественные приложения в экосистеме Android».

Больше о Android: