Некоторые вопросы о снимках экрана Pixel: интеграция Gemini, пересечение с Ask Photos?

Судя по утечкам, Google позиционирует Pixel Screenshots наряду с Gemini и Circle to Search как главные вспомогательные функции Pixel 9.


9to5Google запустил обновленную рассылку, освещающую главные новости Google с дополнительными комментариями и другими подробностями. Подпишитесь здесь!


Что нам известно на данный момент 

Официально, согласно утекшей рекламе, «Pixel Screenshots помогает сохранять информацию, которую вы хотите запомнить позже – например, события, места и многое другое. Так вы сможете найти то, что вам нужно, именно тогда, когда это нужно». Тем временем, тизеры Google позиционировали его как помощника в решении таких проблем:

  • Забыли, какой ресторан понравился вашему другу 
  • Забыли, какой фильм рекомендовал ваш друг
  • Забыли, какое шоу рекомендовал ваш друг

Когда включена «обработка AI», согласно опыту настройки, Pixel Screenshots будет «использовать AI для суммирования ваших новых и существующих снимков экрана и отвечать на ваши вопросы об информации в них». Существующие снимки, предположительно, — это те, что перенесены со старого телефона. Между тем, новые снимки экрана, сделанные после включения этой функции, будут «сохранять метаданные, такие как веб-ссылки, названия приложений и время создания снимка экрана».

Реклама — прокрутите вниз для получения дополнительного контента

Примечательно, что вы можете использовать Pixel Screenshots без обработки AI, и, предположительно, приложение будет более быстрым и специализированным способом доступа к снимкам экрана, чем Google Photos. Мы также видим, что может быть значком приложения: три синих снимка экрана.

С точки зрения дизайна, вы получаете приложение, которое отображает сетку снимков экрана, причем некоторые из них содержат наложенный текст/AI-суммирование: «Не забудьте купить молоко в магазине», «Забронировать визит к ветеринару», «Идея для поездки на выходные» и «Пароль Wi-Fi для новой квартиры». Большинство снимков помечены значком соответствующего приложения в правом нижнем углу, например, Google Photos, Messages, Google Search и Maps. Однако другие приложения не указаны.

Material You используется повсеместно, с новыми вертикальными кнопками в форме таблетки для возврата (?) и, похоже, опциями сетки наверху. Внизу есть плавающая строка «Поиск по снимкам экрана» с голосовым вводом и плавающей кнопкой действия (FAB). Это, предположительно, для добавления не-снимков экрана, таких как изображения, загруженные из Интернета, для анализа.

Вы можете выполнять поиск в разговорной манере, а на странице результатов отображается снимок экрана с нужной информацией. Примечательно, что в правом верхнем углу есть фирменный логотип Gemini.

Какая связь с Gemini?

Я предполагаю, что Google использует модель Gemini Nano с мультимодальностью, представленную на I/O 2024, для понимания того, что происходит на снимке экрана, например, включенного медиа и любого окружающего текста.

Однако, интегрируются ли Pixel Screenshots каким-либо образом с приложением Gemini? Например, можете ли вы запросить у Gemini через его панель или «Привет, Google» информацию из снимков экрана, или Pixel Screenshots работает изолированно?

Изолированный опыт может иметь смысл для конфиденциальности, поскольку ручной характер захвата ставит его выше Microsoft Recall, но это не создает целостного впечатления.

Конкурент Ask Photos?

Другой вопрос, который меня интересует, заключается в том, конкурирует ли функциональность Pixel Screenshots с Ask Photos на базе Gemini? Эта функция Google Photos, возможно, больше ориентирована на реальные фотографии, которые вы делаете, но все ваши снимки экрана уже появляются там. Было бы странно, если бы это не использовалось для получения дополнительной информации о вашем мире и, следовательно, для ответов на большее количество вопросов о нем.

Похоже, что обе функции стремятся к одному и тому же: предоставлять вашу информацию в разговорной манере. Кроме того, мне интересно, позволяет ли облачная обработка проводить более глубокий анализ по сравнению с обработкой на устройстве в Pixel Screenshots.