DeepMind подробно рассказывает о «Magic Pointer» для Googlebook с демонстрациями, доступными для тестирования, а также о его интеграции в Gemini в Chrome

Magic Pointer для Googlebook был разработан Google DeepMind. Исследовательская группа, стоящая за этой базовой возможностью, поделилась подробностями о концепции указателей с поддержкой ИИ.

DeepMind стремится использовать ИИ «для того, чтобы указатель не только понимал, на что он указывает, но и почему это важно для пользователя».

Наша цель — устранить распространенное разочарование: поскольку типичный ИИ-инструмент находится в собственном окне, пользователям приходится переносить свой мир в него. Мы хотим обратного: интуитивно понятного ИИ, который встречается с пользователями во всех используемых ими инструментах, не прерывая их рабочий процесс. Например, представьте, что вы указываете на изображение здания и запрашиваете «Покажи мне маршрут». Ничего больше не нужно, когда система ИИ уже понимает контекст.

Идея заключается в замене «многословных подсказок более простыми и интуитивно понятными взаимодействиями».

Указатель с поддержкой ИИ оптимизирует этот процесс, плавно захватывая визуальный и семантический контекст вокруг указателя, позволяя компьютеру «видеть» и понимать, что важно для пользователя. 

Аналогично, «система ИИ, которая понимает это сочетание контекста, указания и речи, позволит пользователям делать сложные запросы с помощью естественного сокращения».

Примеры использования включают:

  • можно указать на PDF-файл и запросить краткое изложение в виде маркированного списка для вставки непосредственно в электронное письмо
  • навести курсор на таблицу статистики и запросить ее представление в виде круговой диаграммы
  • выделить рецепт и попросить удвоить все ингредиенты

На приведенном ниже примере «остановленный кадр из видео о путешествиях становится ссылкой для бронирования того классного ресторана».

Google предлагает два демонстрационных варианта AI-enabled pointer в AI Studio:

Кроме того, вскоре у вас появится возможность «использовать указатель для запросов к Gemini в Chrome о части веб-страницы, которая вас интересует» . Эта функция находится в процессе развертывания.  

Например, вы можете выбрать несколько продуктов на странице и попросить сравнить их, или указать, где вы хотите визуализировать новый диван в своей гостиной.