
На сегодняшний день Google Chrome запустил три функции генеративного ИИ, а другие, интегрирующие Gemini, анонсированы на этот год. Сегодняшнее интервью дает представление о процессе разработки.
«Мы думали о том, как привнести технологии ИИ в браузер, чтобы сделать типичные действия, которые вы выполняете каждый день — работу с вкладками, поиск, ввод данных в формы, чтение веб-страниц — немного проще», — говорит директор по инжинирингу Chrome Адриана Портер Фелт. «Мы собирали идеи со всей команды Chrome».
«Когда мы думаем о будущем Chrome», — говорит Адриана, — «мы постоянно думаем: «Как мы можем быть максимально полезными?»»
Из этих четырех распространенных задач текущий набор функций еще не затрагивает «использование поиска» или «чтение веб-страниц». Последнее может суммировать статьи, а первое может интегрироваться с SGE. В Omnibox Chrome недавно добавили ярлык @Gemini для быстрого доступа к gemini.google.com.
Процесс разработки функций на основе LLM включает в себя взятие базовой модели и «обучение ее тому, что мы хотим, чтобы она делала для наших примеров использования, а затем мы оцениваем, как она работает в различных типах пользовательских сценариев».
Google запустил функцию «Организовать похожие вкладки» в январе; организатор вкладок использует эмодзи, чтобы облегчить их сканирование. Одной из проблем было убедиться, что Chrome не выберет что-то неуместное:
Например, если вы планируете церемонию прощания, поясняет Адриана, они не хотят, чтобы Chrome показывал вам череп и скрещенные кости. Поэтому, с помощью команды эмодзи Google, они решили составить карту категорий группировки вкладок, которые были бы безопасны для широкого использования. «Путешествия, животные, места, природа — такие вещи являются отличными вариантами использования для эмодзи, поэтому мы знаем, что автоорганизатор вкладок с большой вероятностью сможет правильно их подобрать, используя только эти категории», — говорит она.
Тем временем, создатель тем не принимает открытые запросы, как планировалось изначально, поскольку команда обнаружила, что «на самом деле довольно сложно придумать для этого запрос». Вместо этого, как и на Android, инструмент предлагает различные выпадающие меню: Тема, Стиль и Настроение. В данном случае «более узкие варианты» дают лучшие результаты, а также гарантируют, что инструмент не будет использоваться как генератор изображений общего назначения.
Наконец, «Помоги мне написать» сначала собирает контекст веб-страницы: «Он может определить, что вы хотите написать обзор ресторана, и скорректироваться под это, вместо того, чтобы помогать вам заполнить форму или продать что-то».