Google назвала лучшие ИИ-модели для разработки Android-приложений

Инструменты на базе ИИ, любите вы их или ненавидите, стали огромным достижением в области разработки программного обеспечения и приложений, и Google сейчас активно тестирует лучшие инструменты для разработки Android-приложений – вот полный список.

Новый проект «Android Bench» представляет собой рейтинг лучших моделей ИИ для создания Android-приложений. Google активно проверяет топовые ИИ-модели LLM по набору тестов, направленных на определение того, как эти инструменты справляются с созданием Android-приложений. Google заявляет, что оценивает, как модели работают с Jetpack Compose для пользовательского интерфейса, Coroutines и Flows для асинхронного программирования, room для персистентности и hilt для внедрения зависимостей. Другие аспекты включают «миграцию навигации, конфигурации Gradle/сборки или обработку критических изменений в обновлениях SDK», в то время как Google утверждает, что также измеряет, как эти инструменты работают с основными и более специфическими частями Android, такими как камера, системный интерфейс, медиа, адаптация к складным устройствам и многое другое.

Google заявляет, что ее цель — показать, какие модели ИИ лучше всего подходят для разработки Android-приложений, поскольку существующие эталонные тесты не охватывают проблемы, с которыми может столкнуться разработчик при работе над Android-приложениями.

В области программной инженерии с использованием ИИ появилось несколько эталонных тестов для измерения возможностей LLM. Разработчики Android сталкиваются с особыми трудностями, которые не охватываются существующими тестами, поэтому мы создали тест, ориентированный на разработку для Android.

Итак, какая же лучшая модель ИИ для разработки Android-приложений?

Как и следовало ожидать, Google сообщает, что Gemini 3.1 Pro Preview является лидером с показателем 72,4% в бенчмарке. Второе место занял Claude Opus 4.6, за ним следует GPT 5.2 Codex от OpenAI. Самый низкий балл показал Gemini 2.5 Flash — всего 16,1%.

Лучшие ИИ для разработки Android-приложений по версии Google

  • Gemini 3.1 Pro Preview: 72,4%
  • Claude Opus 4.6: 66,6%
  • GPT-5.2 Codex: 62,5%
  • Claude Opus 4.5: 61,9%
  • Gemini 3 Pro Preview: 60,4%
  • Claude Sonnet 4.6: 58,4%
  • Claude Sonnet 4.5: 54,2%
  • Gemini 3 Flash Preview: 42%
  • Gemini 2.5 Flash: 16,1%

Google заявляет, что, публикуя эти цифры и рейтинги, она надеется «стимулировать улучшения LLM для разработки Android», а также помочь разработчикам быть «более продуктивными» и, в конечном итоге, создавать «более качественные приложения во всей экосистеме Android».

Больше о Android: