
Машинное обучение лежит в основе множества функций в приложениях и сервисах Google. Компания уделила I/O 2019 освещению различных сценариев использования специальных возможностей. Это вызвало дискуссию в Twitter, которая завершилась признанием Google того, что распознавание метеоризма с помощью машинного обучения Android технически находится в области возможного.
Для контекста раскрытия, сегодня утром Google подробно рассказал о предстоящем обновлении Live Transcribe в рамках Всемирного дня осведомленности о доступности. В следующем месяце приложение для Android сможет распознавать и отображать «неречевые звуковые сигналы» в дополнение к существующей возможности транскрипции речи.
Это включает хлопки, смех, музыку, аплодисменты или «звук проезжающего автомобиля». Транскрибированная речь будет продолжать появляться в верхней части экрана, а повседневные звуки будут выделены ниже.
По словам Google, «визуализация звуковых событий позволяет вам глубже погрузиться в неречевую аудиосреду и помогает понять, что происходит в мире». Например, вы сможете услышать стук в дверь, свист или лай собаки.

Это привело к тому, что Tech Twitter™ спросил, «считается ли метеоризм звуковым событием». Дэйв Ли из BBC, вслед за Кейси Ньютоном из The Verge, поинтересовался, «создала ли Google машинное обучение, способное распознавать метеоризм?»
Как ни смешно, официальный аккаунт Android в Twitter ответил: «Да, наше машинное обучение может это сделать, но сложно приобрести набор тестовых данных». Как показал Project Euphonia, если собрать достаточное количество аудиозаписей, машинное обучение может быть использовано для распознавания всех речевых и звуковых паттернов.
Машинное обучение хорошо справляется с поиском таких закономерностей, но, как отмечает @Android, сбор записей метеоризма был бы «трудным» и неловким. С другой стороны, это не самая невыполнимая задача, которую Google уже достиг. Кроме того, существует сценарий использования машинного обучения Android для распознавания метеоризма в Live Transcribe, учитывая, что метеоризм объективно является звуком, информирующим «о том, что происходит в мире» и о социальном контексте комнаты. В любом случае, День смеха в этом году получил последнее продолжение.
Yes, our ML can do it, but it’s difficult acquiring a test data set.
— Android (@Android) May 16, 2019