
Восторг по поводу Google Duplex на конференции I/O 2018 быстро сменился критикой из-за недостаточной прозрачности и вопросов к демонстрации на сцене. Мне кажется, что в этом ажиотаже несколько упущено из виду истинное впечатляющее достижение Duplex для технологий. Но что это такое, как оно работает? И что оно сможет сделать для вас?
Что такое Google Duplex?
Хотя системы онлайн-бронирования становятся все более распространенными, большинство компаний сегодня не имеют таких систем. По данным Google, в США 60% мелких предприятий не имеют автоматизированных способов привлечения клиентов и полагаются на телефоны.
Это проблематично для бизнеса, но также неудобно и для конечных пользователей. С помощью Duplex Google Assistant может звонить от имени пользователя для записи на приемы, которые по-прежнему осуществляются только по телефону. Это основной сценарий использования, который Google демонстрирует на данный момент.
Будут ли люди им пользоваться?
Некоторые высмеивают, сколько времени на самом деле экономит Duplex, но есть определенные случаи, когда что-то подобное было бы действительно удобно и являлось бы настоящим «помощником» для относительно простого взаимодействия. Один идеальный сценарий — это когда ваши руки заняты, буквально или фигурально, и ваше внимание рассеяно. Вместо того чтобы затягивать звонок и, возможно, допускать ошибки, пользователи могут просто дать одну команду Ассистенту.
В целом, голосовые взаимодействия помогают решить эту проблему и становятся все более распространенными с ростом числа приложений Google Assistant. В некотором смысле Duplex является действием Ассистента для этих 60% малых предприятий и помогает им оставаться на уровне с компаниями, которые предлагают такие автоматизированные решения. Автоматизация всегда была общей тенденцией в технологиях, учитывая, как мы уже автоматизируем бытовую технику с помощью Routines и ответов с помощью Smart Reply.
Тем временем, один из сценариев использования, который был немедленно предложен людьми в Интернете, — это последствия для доступности. Duplex, как уже продемонстрировал Google сегодня, мог бы использоваться теми, кто испытывает трудности с речью из-за недостаточного знания языка или социальной тревожности. Этот сценарий использования подпадает под идею Google о создании общего вспомогательного сервиса для всех.
Люди, которым трудно говорить, люди, которым трудно слышать, люди, испытывающие тревогу при разговоре по телефону, люди, для которых английский не родной язык. Всем им жизнь значительно улучшит совершение звонков с помощью ИИ. https://t.co/QvYLkPBfpZ
— Steve Streza 🏳️🌈 (@SteveStreza) May 8, 2018
Как это работает?
Сундар Пичаи отметил на сцене, что Duplex стал кульминацией различных усилий компании за годы в области глубокого обучения, понимания естественного языка, распознавания речи и преобразования текста в речь.
Пользователи могут начать с того, что скажут Ассистенту, что хотят записаться на прием в такое-то место, указав желаемое время, вид услуги и другие соответствующие детали. Затем система Duplex берет эту информацию и совершает звонок в компанию в фоновом режиме.
После объявления себя машиной и в соответствии с законодательством нескольких штатов, он будет говорить естественным голосом с человеком по телефону. Он учитывает несовершенства ответов другого человека, включая распространенные явления, такие как исправления в середине предложения, сложные фразы, пропуск слов и использование контекста вместо явного изложения.
Тем временем, голос Duplex опирается на последние достижения Google в области преобразования текста в речь; вставляет в речь паузы («хм» и «э») и искусственные паузы, которые естественно ожидаемы и дают системе время на обработку. Как было отмечено в прошлой неделе в эпизоде Alphabet Scoop, источник сообщил нам, что набор фраз Duplex может быть предварительно написан, а система выбирает подходящую для ответа.
Почему это вызывает споры?
Существует несколько проблем, которые делают Google Duplex спорным. То, что делает Duplex таким естественным — а именно использование «хм» — является одним из моментов, который беспокоит людей. Проблема в том, как без должного раскрытия информации это может быть воспринято как обман человека на линии. Не говоря уже о том, что некоторые законы требуют, чтобы обе стороны знали, что телефонный звонок записывается.
Помимо естественной склонности людей к неприятию обмана, предположение, что люди разговаривают с человеком, повышает уровень ожиданий в отношении продвинутой речи и ответов.

Если вы не можете отличить, имеет ли это значение?
Звоня сегодня в банк или службу поддержки, многие сначала сталкиваются с автоматизированной компьютерной системой, которая просит описать проблему, прежде чем направить их в соответствующий отдел. Взаимодействуя с этими несовершенными системами, люди сразу же пытаются их «взломать», говоря как можно проще.
Если Duplex не способен полностью понимать расширенные ответы, но создает впечатление сложности благодаря своему естественному голосу, большие усилия и попытки человека на линии могут оказаться напрасными. В результате звонки через Duplex становятся неудобством и хлопотами в отличие от естественного опыта, который Google хочет предоставить обеим сторонам.
Пичаи завершил объявление, вновь подчеркнув, что Google прилагает все усилия, чтобы «правильно управлять ожиданиями», и что «при правильном подходе это сэкономит людям время и создаст большую ценность для бизнеса».
Тем временем, другой, более мелкий спор — это критика со стороны некоторых, что демонстрация Google I/O была не совсем откровенной. Одна из критических статей заключалась в том, что два предприятия не представились, как это обычно бывает при телефонном разговоре, а Bloomberg позже сообщил, что Google отредактировал записи звонков для защиты конфиденциальности магазинов.
Что такое тест Тьюринга?
Тест Тьюринга, созданный в 1950 году, является критерием того, может ли машина «имитировать» человека или выдавать себя за него. Названный в честь отца искусственного интеллекта Алана Тьюринга, этот тест предусматривает, что один человек ведет беседу с компьютером, а третий человек пытается определить, кто из них является машиной. Если оценщик не может определить, машина считается «прошедшей» тест.
Я считаю, что примерно через пятьдесят лет будет возможно запрограммировать компьютеры с объемом памяти около 109, чтобы они играли в имитационную игру настолько хорошо, что средний следователь будет иметь не более 70% шансов на правильную идентификацию после пяти минут допроса. — Алан Тьюринг
Без раскрытия информации, может ли занятый сотрудник ресторана действительно отличить десятки обыденных звонков, которые он получает в течение рабочего дня? Между тем, если бы он не знал, что такое Google Assistant с самого начала, принял бы он его просто за человеческого ассистента на другом конце провода?
Проходит ли Google Duplex тест?
Чтобы проанализировать, в чем система уступает человеку в определенных ответах, требуется действительно внимательное прослушивание. Скорее всего, он проходит тест, но с ключевым уточнением, что Duplex проходит его только в очень специфической задаче записи на прием. Об этом заявил председатель Alphabet и выдающийся ученый-компьютерщик Джон Хеннесси на выступлении I/O 2018 о «Будущем вычислений».
В области записи на прием он проходит тест Тьюринга в этой области, что является выдающимся прорывом. Он не проходит его в общем смысле, но проходит в ограниченной области, и это действительно показатель того, что грядет.
Тест Тьюринга был больше предназначен для оценки искусственного общего интеллекта — или машины, способной выполнять любую задачу, выполняемую человеком. Что-то вроде Duplex, в идеальном полностью рабочем состоянии, может справиться только с одной общей задачей, выполняемой ежедневно.
Google очень ясно дал понять, что его система имеет ограниченную область применения: «Duplex может вести естественные беседы только после глубокого обучения в таких областях». Далее подчеркивается, что Duplex «не может вести общие беседы».
Несмотря на это, учитывая темпы недавних достижений, нет никаких оснований полагать, что Duplex не сможет сделать в будущем. Его применение и возможное обучение однажды могут быть расширены на множество других областей.
Когда я смогу использовать Google Duplex?
Google начнет тестирование Duplex этим летом для записи в ресторанах и назначения встреч в парикмахерских. Неясно, означает ли это, что он будет доступен ограниченному кругу обычных пользователей или только для внутреннего тестирования внутри компании для отладки ответов системы.
Однако в ближайшие недели Google будет экспериментировать с вариантом технологии для определения праздничных часов работы. Идея состоит в том, чтобы Google совершил один звонок в небольшой бизнес и обновил время работы в карточке Knowledge Graph в поиске для всех.