
Инструменты на базе ИИ, любите вы их или ненавидите, стали огромным достижением в области разработки программного обеспечения и приложений, и Google сейчас активно тестирует лучшие инструменты для разработки Android-приложений – вот полный список.
Новый проект «Android Bench» представляет собой рейтинг лучших моделей ИИ для создания Android-приложений. Google активно проверяет топовые ИИ-модели LLM по набору тестов, направленных на определение того, как эти инструменты справляются с созданием Android-приложений. Google заявляет, что оценивает, как модели работают с Jetpack Compose для пользовательского интерфейса, Coroutines и Flows для асинхронного программирования, room для персистентности и hilt для внедрения зависимостей. Другие аспекты включают «миграцию навигации, конфигурации Gradle/сборки или обработку критических изменений в обновлениях SDK», в то время как Google утверждает, что также измеряет, как эти инструменты работают с основными и более специфическими частями Android, такими как камера, системный интерфейс, медиа, адаптация к складным устройствам и многое другое.
Google заявляет, что ее цель — показать, какие модели ИИ лучше всего подходят для разработки Android-приложений, поскольку существующие эталонные тесты не охватывают проблемы, с которыми может столкнуться разработчик при работе над Android-приложениями.
В области программной инженерии с использованием ИИ появилось несколько эталонных тестов для измерения возможностей LLM. Разработчики Android сталкиваются с особыми трудностями, которые не охватываются существующими тестами, поэтому мы создали тест, ориентированный на разработку для Android.
Итак, какая же лучшая модель ИИ для разработки Android-приложений?
Как и следовало ожидать, Google сообщает, что Gemini 3.1 Pro Preview является лидером с показателем 72,4% в бенчмарке. Второе место занял Claude Opus 4.6, за ним следует GPT 5.2 Codex от OpenAI. Самый низкий балл показал Gemini 2.5 Flash — всего 16,1%.
Лучшие ИИ для разработки Android-приложений по версии Google
- Gemini 3.1 Pro Preview: 72,4%
- Claude Opus 4.6: 66,6%
- GPT-5.2 Codex: 62,5%
- Claude Opus 4.5: 61,9%
- Gemini 3 Pro Preview: 60,4%
- Claude Sonnet 4.6: 58,4%
- Claude Sonnet 4.5: 54,2%
- Gemini 3 Flash Preview: 42%
- Gemini 2.5 Flash: 16,1%
Google заявляет, что, публикуя эти цифры и рейтинги, она надеется «стимулировать улучшения LLM для разработки Android», а также помочь разработчикам быть «более продуктивными» и, в конечном итоге, создавать «более качественные приложения во всей экосистеме Android».
Больше о Android: