
После объявления автоматизации Gemini сегодня Google подробно описывает, как все это работает на Android.
Google «внедряет возможности для разработчиков на ранних стадиях, которые устраняют разрыв между вашими приложениями и агентными приложениями, а также персонализированными помощниками, такими как Google Gemini».
Хотя мы находимся на ранних, бета-стадиях этого пути, мы разрабатываем эти функции с упором на конфиденциальность и безопасность как первый шаг в исследовании этого парадигматического сдвига в экосистеме приложений.
AppFunctions
Android имеет два подхода, начиная с AppFunctions. Это было тихо анонсировано в прошлом году, и только сейчас подробно описано.
AppFunctions — это функция платформы Android 16 и сопутствующая библиотека Jetpack, которая позволяет приложениям предоставлять определенные функции для вызывающих абонентов, таких как агентные приложения, для доступа и выполнения на устройстве.
Разработчики описывают возможности своих приложений как инструменты, которые агенты и AI-помощники (например, Gemini) могут использовать. Google приравнивает AppFunctions к протоколу Model Context Protocol (MCP), который популярен для агентов и серверных инструментов. Однако эти функции выполняются локально на устройстве Android. Примеры использования:
- Управление задачами и продуктивность
- Запрос пользователя: «Напомни мне забрать посылку с работы сегодня в 17:00».
- Действие AppFunction: Вызывающий абонент определяет соответствующее приложение для управления задачами и вызывает функцию для создания задачи, автоматически заполняя поля заголовка, времени и местоположения на основе запроса пользователя.
- Медиа и развлечения
- Запрос пользователя: «Создай новый плейлист с лучшими джазовыми альбомами этого года».
- Действие AppFunction: Вызывающий абонент выполняет функцию создания плейлиста в музыкальном приложении, передавая контекст, такой как «лучшие джазовые альбомы 2026 года», в качестве запроса для генерации и немедленного воспроизведения контента.
- Межприкладные рабочие процессы
- Запрос пользователя: «Найди рецепт лапши из письма Лизы и добавь ингредиенты в мой список покупок».
- Действие AppFunction: Этот запрос использует функции из нескольких приложений. Сначала вызывающий абонент использует функцию поиска в почтовом приложении для получения контента. Затем он извлекает соответствующие ингредиенты и вызывает функцию приложения списка покупок для заполнения списка пользователя.
- Календарь и планирование
- Запрос пользователя: «Добавь день рождения мамы в мой календарь на следующий понедельник в 18:00».
- Действие AppFunction: Авторизованное агентное приложение вызывает функцию «создать событие» в приложении календаря, анализируя соответствующий контекст, такой как «следующий понедельник» и «18:00», для создания записи без необходимости ручного открытия календаря пользователем.
Ниже приведен пример использования AppFunctions с приложением Samsung Gallery на Galaxy S26. Оно также появится на устройствах Samsung с OneUI 8.5 и выше.
Вместо ручной прокрутки фотоальбомов вы теперь можете просто попросить Gemini: «Покажи мне фотографии моей кошки из Samsung Gallery». Gemini принимает запрос пользователя, интеллектуально определяет и запускает нужную функцию, а затем представляет возвращенные фотографии из Samsung Gallery непосредственно в приложении Gemini, так что пользователям никогда не придется выходить. Этот опыт мультимодален и может быть реализован голосом или текстом. Пользователи могут даже использовать полученные фотографии в последующих разговорах, например, отправляя их друзьям в текстовом сообщении.
Тем временем Google заявляет, что приложение Gemini уже использует AppFunctions для обеспечения интеграции с Календарем, Заметками и Задачами в приложениях Google и OEM-устройствах по умолчанию.
Автоматизация пользовательского интерфейса
Android также работает над вторым подходом, как видно из автоматизации Gemini, анонсированной для серий Galaxy S26 и Pixel 10 сегодня утром.
В то время как AppFunctions предоставляет структурированную основу и больший контроль для приложений для взаимодействия с AI-агентами и помощниками, мы знаем, что не каждое взаимодействие еще имеет выделенную интеграцию.
Google «разрабатывает фреймворк автоматизации пользовательского интерфейса для AI-агентов и помощников, чтобы интеллектуально выполнять общие задачи в установленных пользователем приложениях».
Это платформа выполняет основную работу, поэтому разработчики могут получить агентный охват без кода. Это простой способ расширить их охват без существенных инженерных усилий прямо сейчас.
Google заявляет, что Android 17 «расширит эти возможности для охвата еще большего числа пользователей, разработчиков и производителей устройств».
В настоящее время мы создаем опыт с небольшой группой разработчиков приложений, уделяя особое внимание высококачественному пользовательскому опыту по мере развития экосистемы. Мы планируем поделиться более подробной информацией позднее в этом году о том, как вы можете использовать AppFunctions и автоматизацию пользовательского интерфейса для обеспечения агентных интеграций для вашего приложения. Следите за обновлениями.