Платформа AndroidEnv от DeepMind позволяет агентам обучения с подкреплением использовать Android

DeepMind — это лаборатория ИИ-исследований Alphabet, и сегодня она представила AndroidEnv в качестве платформы, позволяющей агентам обучения с подкреплением «взаимодействовать с широким спектром приложений и сервисов, обычно используемых людьми, через универсальный интерфейс сенсорного экрана».

Обучение с подкреплением (RL) — это область машинного обучения, которая позволяет системе учиться методом проб и ошибок. В AndroidEnv агенты, подобно людям, принимают решения на основе отображаемой информации и управляют ею с помощью касаний/жестов. DeepMind заявляет, что «набор возможных сервисов и приложений, с которыми агент может взаимодействовать, практически неограничен», учитывая, что это Android.

Например, агент может просматривать Интернет, открывать приложение YouTube, устанавливать будильник или играть в игру. Возможность агентов RL работать на реальной платформе, используемой миллиардами людей ежедневно, открывает новые исследовательские возможности.

Помимо широких возможностей, AndroidEnv перспективна тем, что требует от агентов преодоления сложностей переноса и обобщения, временной абстракции, реальной динамики и масштабирования.

Агентам могут быть поставлены задачи, такие как «поиск маршрута в парк, бронирование авиабилетов или максимизация очков в игре». Относительно того, что может позволить AndroidEnv, DeepMind предполагает, что:

возможность автоматического изучения последовательностей действий может привести к созданию передовых систем голосовой навигации без рук; модели ИИ на устройстве могут помочь улучшить пользовательский опыт; а обученные агенты могут помочь в тестировании устройств и обеспечении качества путем сравнения новых приложений, измерения задержки или обнаружения сбоев или непреднамеренного поведения в ОС Android.

Подробнее о DeepMind: