Google о возможностях ИИ на устройстве и новых приложениях Android с Gemini Nano

ИИ на устройстве — главный приоритет для Android в будущем, и Google предоставил дополнительные ресурсы для разработчиков на I/O 2024.

На сессии I/O 2024 «ИИ на устройстве Android под капотом» были представлены «хорошие примеры использования» генеративного ИИ на устройстве:

  • Потребление: Предоставление сводки или обзора текста
  • Создание: Предложение ответов в приложениях обмена сообщениями или генерация/перефразирование текста
  • Классификация: Определение тональности / настроения в разговорах или тексте

В целом, преимущества включают безопасную локальную обработку, доступность в автономном режиме, снижение задержки и отсутствие дополнительных (облачных) затрат. Ограничения заключаются в меньшем размере параметров — 2-3 миллиарда, или «почти на порядок меньше, чем у облачных аналогов». Также имеется более узкое контекстное окно, и модель будет менее обобщенной. В связи с этим «тонкая настройка имеет решающее значение для достижения хорошей точности».

Gemini Nano является «основным выбором для Android при создании репликаций генеративного ИИ на устройстве», но вы также можете запускать Gemma и другие открытые модели.

Реклама — прокрутите вниз для получения дополнительного контента

До сих пор только приложения Google — «Сводка» в Pixel Recorder, Magic Compose в Google Messages и «Умный ответ» в Gboard — использовали его, но Google «активно сотрудничает с разработчиками, имеющими убедительные сценарии использования Gemini на устройстве» в рамках программы раннего доступа. Их запуск ожидается в 2024 году.

Тем временем Google скоро начнет использовать Gemini Nano для субтитров TalkBack, динамических предложений Gemini и предупреждений о спаме, а обновление мультимодальности ожидается позже в этом году «начиная с Pixel».

Google также отметил состояние генеративного ИИ на устройстве год назад и достигнутые с тех пор улучшения, такие как аппаратное ускорение:

Подробнее об Android 15: