
DeepMind — это лаборатория ИИ-исследований Alphabet, и сегодня она представила AndroidEnv в качестве платформы, позволяющей агентам обучения с подкреплением «взаимодействовать с широким спектром приложений и сервисов, обычно используемых людьми, через универсальный интерфейс сенсорного экрана».
Обучение с подкреплением (RL) — это область машинного обучения, которая позволяет системе учиться методом проб и ошибок. В AndroidEnv агенты, подобно людям, принимают решения на основе отображаемой информации и управляют ею с помощью касаний/жестов. DeepMind заявляет, что «набор возможных сервисов и приложений, с которыми агент может взаимодействовать, практически неограничен», учитывая, что это Android.
Например, агент может просматривать Интернет, открывать приложение YouTube, устанавливать будильник или играть в игру. Возможность агентов RL работать на реальной платформе, используемой миллиардами людей ежедневно, открывает новые исследовательские возможности.
Помимо широких возможностей, AndroidEnv перспективна тем, что требует от агентов преодоления сложностей переноса и обобщения, временной абстракции, реальной динамики и масштабирования.


Агентам могут быть поставлены задачи, такие как «поиск маршрута в парк, бронирование авиабилетов или максимизация очков в игре». Относительно того, что может позволить AndroidEnv, DeepMind предполагает, что:
возможность автоматического изучения последовательностей действий может привести к созданию передовых систем голосовой навигации без рук; модели ИИ на устройстве могут помочь улучшить пользовательский опыт; а обученные агенты могут помочь в тестировании устройств и обеспечении качества путем сравнения новых приложений, измерения задержки или обнаружения сбоев или непреднамеренного поведения в ОС Android.
Подробнее о DeepMind:
- DeepMind от Alphabet добился прорыва в области ИИ с помощью AlphaFold, который может помочь в исследованиях лекарств
- Прогнозы времени прибытия Google Maps учитывают недавние дорожные условия, поскольку ИИ DeepMind улучшает предсказания
- DeepMind от Alphabet надеется помочь исследователям благодаря ИИ-анализу структуры вируса COVID-19
- Система рекомендаций приложений в Google Play Store работает на базе DeepMind