
Каждый год на Google I/O компания демонстрирует свои новейшие технологии в различных сферах жизни, в которых Google принимал участие. В этом году Google, похоже, представит новую технологию доступности, «Project Euphonia», призванную «вернуть голос» людям с нарушениями речи.
Доступность давно является одним из направлений деятельности Google: на прошлогодней презентации Google I/O были продемонстрированы такие технологии, как поддержка ввода азбукой Морзе для Gboard. Хотя до открытия нынешней конференции еще больше недели, у нас появилось довольно четкое представление о том, что подготовила команда Google по доступности на этот год.
Один из докладов в списке мероприятий Google I/O называется «Проектирование с учетом доступности» и будет вестись адвокатом по вопросам доступности Элизой Рой и ученым Google, профессором Гарварда Майклом Бреннером. Описание доклада было обновлено вчера, чтобы добавить информацию о Бреннере и том, о чем он будет говорить, но в обновлении также упоминается некий «Project Euphonia».
[…] Майкл Бреннер из Google расскажет, как Project Euphonia использует технологии Google, чтобы вернуть голос людям с нарушениями речи.
Судя по предоставленной биографии Майкла Бреннера на веб-сайте Google I/O, Project Euphonia действительно является проектом Google, а не чем-то от сторонней организации, такой как Гарвард.
[…] В Google, помимо Euphonia, он сосредоточен на использовании последних достижений в области машинного обучения для ускорения научных открытий.
Обновление от 1.05: Описание доклада и биография Бреннера были обновлены на веб-сайте Google I/O с целью удаления упоминаний Project Euphonia.
Однако перед этим Google добавил (а затем удалил) третьего спикера для выступления «Проектирование с учетом доступности» — Ирен Альварадо. Согласно ее персональному веб-сайту, Альварадо является креативным технологом в Google Creative Lab. Какое влияние это может оказать на Project Euphonia, остается только гадать.
Так что же такое Project Euphonia? Пока мы можем только предполагать, исходя из этой небольшой информации и самого названия. Для некоторого исторического контекста: в 1800-х годах человек по имени Джозеф Фабер разработал сложное устройство, которое воспроизводило человеческую речь и было названо «Euphonia» П. Т. Барнумом.
Учитывая это, вполне вероятно, что Google представит некое подобие синтеза голоса в реальном времени для людей с нарушениями речи. На прошлогоднем I/O Google продемонстрировал нам, включив Джона Ледженда в качестве голоса для Google Assistant и невероятные демонстрации Google Duplex, что их технология синтеза речи WaveNet приближается к неразличимости от реального голоса.
Настоящий вопрос в том, насколько глубоким будет Project Euphonia? Минимум, это звучит как доступный способ общаться голосом, возможно, с использованием преобразования текста в речь. Это может быть аппаратное устройство или оно может работать непосредственно на смартфоне.
Крайний (и крайне маловероятный) сценарий — буквально «вернуть голос» людям с нарушениями речи, обучив модель машинного обучения на образцах голоса, сделанных до того, как человек стал плохо говорить. Это, конечно, дикие спекуляции, и что-то, что больше похоже на сюжет научно-фантастического фильма, но Google уже не раз впечатлял нас.