Отчет: Google готовит ИИ-агента «Джарвис», работающего в Chrome

На конференции I/O 2024 в мае Google привела два примера функционала агентов, к которым вы могли бы получить доступ через Gemini. Google, возможно, готова поделиться большей информацией об агентах, работающих в Chrome и использующих Gemini 2.0, в декабре этого года с проектом «Джарвис».

«Я думаю об [агентах] как об интеллектуальных системах, которые демонстрируют рассуждение, планирование и память. Способны думать на несколько шагов вперед, работать с различными программными обеспечениями и системами, чтобы выполнить что-то от вашего имени, и, самое главное, под вашим контролем».

— Сундар Пичаи об ИИ-агентах

По данным The Information, Google «разрабатывает искусственный интеллект, который берет на себя управление браузером пользователя для выполнения таких задач, как сбор информации, покупка товара или бронирование авиабилетов».

«Проект Джарвис» — по аналогии с J.A.R.V.I.S. из «Железного человека» — будет работать в Google Chrome и является потребительской (а не корпоративной) функцией для «автоматизации повседневных задач, выполняемых через веб». В статье не уточняется, будет ли это доступно для мобильных устройств или компьютеров.

На конференции I/O Пичаи продемонстрировал, как «Gemini и Chrome работают вместе, чтобы помочь вам в выполнении ряда задач: организация, анализ, синтез информации от вашего имени». Этот сценарий на сцене был обобщенно показан через gemini.google.com, без демонстрации другого пользовательского интерфейса по сравнению с предыдущим примером, который происходил через Gemini для Android.

Реклама — прокрутите дальше, чтобы узнать больше контента

Получив команду/действие, «Джарвис» работает, делая «частые снимки экрана того, что находится на экране компьютера, и интерпретируя их перед выполнением таких действий, как нажатие кнопки или ввод текста в поле». Сегодняшний отчет гласит, что «Джарвис» работает «относительно медленно, поскольку модель должна обдумать каждое действие в течение нескольких секунд». Таким образом, он, скорее всего, еще не работает на устройстве и по-прежнему требует облачных вычислений.

Сообщается, что «Джарвис» работает на базе Gemini 2.0 и может быть представлен «уже в декабре», что подтверждает другой вчерашний слух. После этого «Джарвис» может быть доступен первым тестировщикам, поэтому запуск пока не ожидается. Для Google имеет смысл иметь флагманский пример чего-то, работающего на Gemini 2.0. Компания уже поступала так при предыдущих запусках моделей, и «Джарвис» кажется гораздо более ощутимым.