Комментарий: Google Duplex — не единственное объявление на I/O, имеющее социальные последствия

Abner Li | Понедельник, 14 мая, 2018, 01:15.

В дни после I/O 2018 критика в основном касалась Google Duplex. У этой функции есть проблемы, но лично для меня очевидно, что компания размышляла о некоторых социальных последствиях, связанных с практически неотличимым человеческим голосом в мире.

Однако я считаю, что другая функция, анонсированная Google, заслуживает такого же уровня критики из-за своего широкого влияния. Встречайте Джона Ледженда.

На I/O Сундар Пичаи объявил, что достижения WaveNet в области более естественной речи уже питают шесть новых голосов Ассистента. Поскольку эта технология DeepMind может сократить время студийной записи, Google начал исследовать, чей «потрясающий голос» они могли бы запечатлеть.

Реклама — прокрутите, чтобы увидеть больше контента

Google и Джон Ледженд поддерживали тесные отношения, начавшиеся на CES 2018, где он выступал на мероприятии Made by Google. Затем он возглавил рекламный ролик на «Оскаре», а позже артист использовал Pixel 2 для записи своего последнего музыкального видео.

Таким образом, выбор Ледженда в качестве «потрясающего голоса» не слишком удивителен. На презентации было показано забавное видео, где Ледженд записывает различные фразы за сокращенное время благодаря WaveNet.

Эта функция объективно забавна и идеально подходит для пересечения технологического прогресса и развлечений Google. Она обращается к гиковской фантазии о говорящих компьютерах — которые у нас есть уже несколько лет — и огромной кастомизации, будь то HAL 9000 или Knightrider.

Однако, после первоначального восторга, который, безусловно, придаст пользователям ожидаемую долю веселья, стоит задуматься о том, как легкодоступный генератор голоса подвержен злоупотреблениям и подделке речи. Например, представьте, что какая-нибудь злонамеренная сторона выдает ответ Ледженда от Ассистента за якобы «слитую» голосовую почту для таблоида.

самое простое обратное проектирование могло бы заставить Ледженда сказать что угодно

Как и в случае с Duplex, я думаю, команда, разрабатывающая это направление, предвидела это. Генеральный директор Google отчетливо отметил, что голос Ледженда будет использоваться для ответов пользователям «в определенных контекстах».

На сцене Сундар просто показал, как он используется для утренней «Рутины» Ассистента и краткого обзора дня, в то время как другое упоминало поздравление кого-то с днем рождения голосом певца.

Простым и очевидным средством защиты было бы не позволять использовать голос Ледженда с функцией «Пользовательский ответ» в «Рутине», где пользователи могут фактически программировать Ассистента говорить что угодно.

Однако я уже могу предвидеть, как самое простое обратное проектирование могло бы заставить Ледженда сказать что угодно. В примере с календарем Сундара просто измените название встречи на любое желаемое, и продолжайте делать это до тех пор, пока не будет записана и собрана нужная фраза.

Я уверен, что до запуска будут внедрены дополнительные меры безопасности — например, система, анализирующая произносимое заранее — после более широкой обратной связи после I/O, но эта проблема заставляет задуматься, стоит ли вообще эта конкретная функция.

Существует множество других вымышленных персонажей, к которым Google мог бы обратиться вместо этого, чтобы создать другие забавные голоса для Ассистента. Фактически, эти голоса могли бы использоваться в неограниченном количестве контекстов по всей системе, если пользователь этого пожелает.

Заглядывая еще дальше в будущее, эта технология вызывает дискуссии о возможности захвата образа человека и, в свою очередь, его лицензирования. Один из недавних примеров — фильм «Звездные войны: Изгой-один», где принцесса Лея Кэрри Фишер и персонаж Питера Кушинга — Гранд-Мофф Таркин — были не просто визуально воссозданы, но и произносили реплики.

Это не первый случай, когда Google захватывает образ человека для использования в коммерческом продукте. Waze давно создает голосовые пакеты для навигации от известных личностей. Однако Ассистент гораздо более универсален и широко доступен, с практически неограниченным словарем.

Это, наряду с Duplex, является противоположностью заявленной Google цели «ответственности» на I/O этого года. Позволяя Duplex совершать звонки от имени людей, Google упрощает их жизнь. Google еще не полностью использовал или даже не обсуждал преимущества этой функции для людей с нарушениями речи и социальной тревожностью.

Однако, применительно к голосам знаменитостей в Ассистенте, я не вижу в этом ничего, кроме забавы, или, циничнее говоря, создания конкурентного преимущества за счет более продвинутых базовых технологий для привлечения потребителей.

Я понимаю, что развлечения часто лежат в основе Google, но я думаю, что в данном случае фактор крутости затмевает должный акцент на ответственности.

Смотрите 9to5Google на YouTube для получения дополнительных новостей: