У Google есть все необходимое для противодействия ChatGPT — вот что уже было представлено

Abner Li | Пятница, 23 декабря, 2022, 20:53.

Способность ChatGPT отвечать на вопросы в разговорной и прямой манере побудила некоторых заявить, что ИИ-чат уничтожит традиционные поисковые системы. Google серьезно реагирует на это и, судя по тому, что уже было показано, вполне способен конкурировать. Вопрос в пользовательском опыте.

Вопросы и ответы

По сути, миссия Google «организовать мировую информацию и сделать ее универсально доступной и полезной» может быть разделена на два компонента.

Пользователи задают вопросы, а Google дает ответы. Запросы — сначала ключевые слова, затем вопросы, сформулированные естественным языком — изначально набирались в поле, а затем произносились. Ответы начинались со ссылок на веб-сайты, которые могли содержать соответствующую информацию, но и это развивалось.

Google начал предоставлять немедленные ответы на более простые вопросы, которые более или менее являются фактами, используя информацию из баз данных, списков и, чаще всего, Википедии. Этот переход к прямым ответам совпал с тем, что смартфоны и их относительно небольшие экраны стали основным устройством. Затем появились носимые устройства и другие аудиоустройства, такие как умные колонки и дисплеи.

Реклама — прокрутите дальше, чтобы узнать больше

На другие вопросы ответить нелегко, но Google все равно пытается и использует так называемые «Избранные фрагменты» (Featured Snippets) или прямые цитаты с веб-сайта, который, по его мнению, ответит на ваш вопрос. В последние годы Google подвергался критике за эти фрагменты со всех сторон. Иногда он выбирает для цитирования источник, который явно ошибочен, в то время как владельцы этого контента обвиняют Google в заговорщическом воровстве кликов, чтобы удержать пользователей в поиске.

С таким же типом сложных вопросов успешно справляется ChatGPT, генерируя ответы на многие вещи вместо того, чтобы отправлять вас куда-то еще. Ранние пользователи приняли это и считают, что будущее поиска будет заключаться в получении прямых ответов все время через диалог с возможностью задавать уточняющие вопросы. Фактически, ChatGPT также может задавать вопросы, чтобы уточнить ваш запрос по мере необходимости. Между тем, он также может отлаживать код, писать эссе (с возможностью указания абзацев), резюмировать, объяснять и многое другое.

Что есть у Google |

LaMDA

Google уже некоторое время работает над той же технологией языковой модели, которая лежит в основе ChatGPT, хотя и менее эффектно. Тем не менее, он уделяет основное внимание своей работе по пониманию естественного языка (NLU) и большим языковым моделям на двух конференциях для разработчиков I/O подряд.

LaMDA (Language Model for Dialog Applications) — это «самый продвинутый диалоговый ИИ Google на сегодняшний день». Он был представлен на I/O 2021 «для ведения диалога на любую тему» с оговоркой, что он все еще находится на стадии исследований и разработок. Примеры Google, демонстрирующие общение с планетой Плутон и бумажным самолетиком, были призваны показать, как LaMDA уловил «несколько нюансов, отличающих диалог с открытым концом», включая разумные и конкретные ответы, способствующие дальнейшему обмену репликами.

Другие качества, которые Google ценит, — это «интересность» (насколько ответы содержательны, неожиданны или остроумны) и «фактичность», то есть приверженность фактам.

Год спустя была анонсирована LaMDA 2, и Google начал предоставлять общественности доступ к трем конкретным примерам LaMDA через приложение AI Test Kitchen.

MUM

Помимо LaMDA, Google выделяет мультимодальные модели, которые «позволяют людям естественно задавать вопросы по различным типам информации» с помощью MUM (Multitask Unified Model). Примечателен пример запроса, предложенный Google, на который поисковая система сегодня не может ответить, но с которым может справиться эта новая технология:

Я поднимался на гору Адамс и теперь хочу подняться на гору Фудзи следующей осенью, что мне следует сделать по-другому для подготовки?

MUM поймет, что вы сравниваете две горы, и что указанный вами временной диапазон приходится на сезон дождей на горе Фудзи, что требует водонепроницаемого снаряжения. Он мог бы показать статьи, написанные на японском языке, где больше местной информации, а самый впечатляющий пример был более или менее связан с Google Lens:

Итак, представьте, что вы фотографируете свои походные ботинки и спрашиваете: «Могу ли я использовать их для восхождения на гору Фудзи?» MUM сможет понять содержимое изображения и намерение, стоящее за вашим запросом, сообщить вам, что ваши походные ботинки подойдут, а затем предоставить список рекомендуемого снаряжения и блог о горе Фудзи.

Это был еще исследовательский запрос, но более конкретно Google объявил, как он добавляет MUM в Lens, чтобы вы могли сфотографировать сломанную деталь своего велосипеда (о которой вы не знаете) и получить инструкции по ее ремонту.

PaLM

Если MUM позволяет задавать вопросы с использованием различных носителей, а LaMDA может поддерживать разговоры, то PaLM (Pathways Language Model) — это то, что может отвечать на вопросы. Он был анонсирован в апреле и получил упоминание на сцене на I/O. PaLM способен выполнять:

Ответы на вопросы, Семантический разбор, Пословицы, Арифметика, Завершение кода, Общие знания, Чтение с пониманием, Резюмирование, Цепочки логических выводов, Рассуждения на основе здравого смысла, Распознавание закономерностей, Перевод, Диалог, Объяснение шуток, Вопросы по физике и Понимание языка.

Он основан на архитектуре ИИ нового поколения под названием Pathways, которая может «обучать одну модель выполнять тысячи или миллионы задач» по сравнению с текущим, сильно индивидуализированным подходом.

Переходя к продуктам

Когда Google анонсировал LaMDA в 2021 году, Сундар Пичаи сказал, что его «возможности естественного общения имеют потенциал сделать информацию и вычисления радикально более доступными и простыми в использовании».

Google Assistant, Search и Workspace были специально упомянуты как продукты, в которые компания надеется «включить лучшие разговорные функции». Google также может предлагать «возможности разработчикам и корпоративным клиентам».

В этом пост-ChatGPT мире немало людей отметили, что прямые ответы могут навредить бизнес-модели Google, основанной на рекламе, поскольку считается, что люди больше не будут нуждаться в переходе по ссылкам, если они уже получили ответ. В предоставленных Google примерах нет никаких указаний на то, что он хочет прекратить ссылаться на контент.

Существуют серьезные проблемы с безопасностью и точностью, на которых Google всегда делал акцент при демонстрациях. Тот факт, что эти модели «могут выдумывать», кажется, является более серьезным препятствием, чем что-либо еще.

Между тем, неясно, хотят ли люди, чтобы каждое взаимодействие с поисковой системой было разговором. Тем не менее, Google признал на внутреннем уровне, что разговорный подход «действительно удовлетворяет потребность, которая, похоже, есть у людей».

Сообщается, что Google находится в состоянии «красного кода» из-за ChatGPT и перераспределил различные команды для работы над конкурирующими ИИ-продуктами и демонстрациями. Еще одна демонстрация технологии на I/O 2023 весьма вероятна, но будет ли это означать, что LaMDA, MUM и PaLM будут активно интегрированы в крупнейшие продукты Google, остается под вопросом.

Еще в мае Пичаи вновь подчеркнул, что «разговор и обработка естественного языка — это мощные способы сделать компьютеры более доступными для всех». Судя по всему, что компания представила, конечная цель состоит в том, чтобы Google Search мог отвечать на вопросы, как человек.

Неудивительно, что у Google есть технологии для достижения этой цели, но «вечная задача» компании — внедрение исследований и разработок в реальные продукты, и спешка в этом не кажется мудрой для поисковой системы, которая должна быть неизменно точной для всего мира.