
Впервые о Pixie стало известно в декабре. Издание The Information рассказало о существовании ИИ-ассистента, который будет эксклюзивом для устройств Google Pixel.
У 9to5Google есть обновленная рассылка, которая освещает главные новости Google с дополнительными комментариями и другими интересными фактами. Подпишитесь, чтобы получать ее раньше в своем почтовом ящике, или продолжайте читать 9to5Google Log Out ниже:
Помимо запуска вместе с Pixel 9, мы знаем, что:
- «Pixie будет использовать информацию на телефоне пользователя — включая данные из продуктов Google, таких как Карты и Gmail — чтобы развиться в гораздо более персонализированную версию Google Assistant».
- «…ИИ-ассистент, который стремится обогнать таких ассистентов, как Siri, выполняя сложные и мультимодальные задачи, например, предлагая маршруты к ближайшему магазину, где можно купить сфотографированный товар».
Остается много неизвестного о том, как Pixie на самом деле будет работать для достижения этих целей. Имейте в виду, что отчет вышел до запуска приложения Gemini (ранее Assistant с Bard) в феврале.
В сложившейся ситуации Apple, по слухам, «позволит пользователям управлять отдельными функциями приложений голосом» с помощью Siri в iOS 18. Согласно Bloomberg, для этого будут использоваться большие языковые модели:
Это включает возможность открывать отдельные документы, перемещать заметку в другую папку, отправлять или удалять электронное письмо, открывать определенную публикацию в Apple News, отправлять ссылку по электронной почте или даже запрашивать у устройства сводку статьи.
В будущем пользователи смогут объединять несколько команд в один запрос.
Это очень похоже на новый Google Assistant, дебютировавший на Pixel 4. Предполагалось, что в 2019 году обработка голоса на устройстве сделает «нажатие для управления телефоном почти замедленным». Эта система была направлена на то, чтобы вы могли управлять, работать в многозадачном режиме и создавать.
Этот Google Assistant нового поколения позволит вам мгновенно управлять телефоном голосом, работать в многозадачном режиме между приложениями и выполнять сложные действия, причем почти с нулевой задержкой.
Видение, которое Google представил пять лет назад, полностью совместимо с тем, которое было представлено для ИИ-агентов на I/O 2024:
«Я думаю о них как об интеллектуальных системах, демонстрирующих рассуждение, планирование и память. Способных мыслить на несколько шагов вперед, работать с программным обеспечением и системами, чтобы выполнить что-то от вашего имени, и, самое главное, под вашим контролем».

Pixie может стать новым Google Assistant, сделанным правильно, теперь, когда технология (LLM) для этого готова. Версия Google 2019 года требовала, чтобы пользователи придерживались определенных формулировок, вместо того чтобы позволять им говорить естественно, а затем автоматически распознавать намерение.
Google Research работает над этим в рамках проекта «Enabling Conversational Interaction with Mobile UI using Large Language Models». Их подход с использованием LLM позволяет отвечать на вопросы о контенте, отображаемом в пользовательском интерфейсе, и управлять им после получения инструкций на естественном языке.
Еще один большой вопрос — связь с приложением Gemini на техническом и брендовом уровне. Я предвижу, что Gemini, которое работает над добавлением большего количества функций телефонного ассистента, будет доступно для всех устройств Android. Тем временем Gemini Live, похоже, сильно ориентировано на прямое общение с Gemini, а не на управление телефоном.
На Pixel инициатива Pixie предоставляет Gemini дополнительные возможности, позволяющие использовать телефон голосом. Это позволяет Google поддерживать единую инфраструктуру ассистента. Еще следует помнить о том, как реорганизация аппаратного обеспечения и Android привела к тому, что команды Google Research, ответственные за вычислительную фотографию и интеллектуальные технологии на устройстве, присоединились к объединенному подразделению, чтобы «привносить глубокую экспертизу в области ИИ на различных платформах и устройствах».
Я не совсем вижу «Pixie» (или какое-либо другое название) как отдельный брендированный продукт. В конечном итоге Google должен донести, что Gemini доступен везде. Учитывая это, я лично считаю, что название очень подходящее и вызывает все нужные ассоциации с ассистентом.