
С официальным запуском Google Podcasts в июне прошлого года компания обещала функции на основе искусственного интеллекта, такие как перевод и автоматическая транскрипция. Ранее в этом году мы активировали последнюю функцию на Android, чтобы пользователи могли читать подкасты. Хотя эта функция не ориентирована на пользователя, она уже работает в фоновом режиме для поиска.
В апреле прошлого года Google подробно описал свои планы относительно подкастов, где ключевую роль играли искусственный интеллект и машинное обучение. Транскрибируя подкасты, Google мог понимать, о чем идет речь в выпуске, не полагаясь исключительно на примечания к выпускам и описания, созданные подкастерами.
Эта технология существует в Google Cloud Speech-to-Text и уже может транскрибировать речь от четырех и более говорящих с фоновым шумом в течение двух часов. Как заметил Android Police, эта функция, похоже, уже используется.
На недавно обнаруженном веб-интерфейсе можно подтвердить, что Google Podcasts транскрибирует выпуски. Эта функция не ориентирована на пользователя, в отличие от кнопки «Закрытые субтитры», которую мы заметили в Android в январе. Вместо этого она доступна только с помощью инструментов разработчика в исходном коде страницы.
Эта транскрипция, похоже, используется для улучшения результатов поиска. Встроенная функция поиска — которая только что добавила поиск по выпускам — может находить термины, которые были только транскрибированы, но не включены нигде больше в примечаниях к выпускам или деталях подкаста.
Пока неясно, использует ли Google транскрипцию для предоставления других, более продвинутых функций, таких как понимание тем подкаста, а не просто поиск точных совпадений.
Транскрипция также может обеспечивать временные метки и индексирование, благодаря чему создателям больше не придется вручную добавлять главы или иметь возможность переходить к точному разделу по результатам поиска. Используя Text-to-Speech, Google может переводить выпуски и делать их доступными во всем мире. Приложение для Android уже работает над возможностью позволить пользователям читать подкаст во время прослушивания, что полезно в шумной обстановке.
Конечно, учитывая, что основной источник дохода Google по-прежнему составляет реклама, транскрипция может позволить компании лучше показывать рекламу, зная, что вы только что слушали в выпуске. Гипотетически реклама может появляться в плеере Podcasts или преследовать пользователей в Интернете, как и сегодня.