Привет, Google, голосовое определение близости на Google Home просто достаточно несовершенно, чтобы раздражать

Я большой поклонник Google Home. У меня есть одно практически в каждой комнате дома, а в некоторых комнатах — по два. В основном это работает нормально, но особенность наличия такого большого количества Home заключается в том, что большее, чем в среднем, количество устройств постоянно борются за то, чтобы определить, к какому из них вы обращаетесь. Иногда это получается хорошо, а иногда — очень плохо.

При бесчисленном множестве устройств с поддержкой «Окей, Google» в нашей жизни Google должен иметь систему, которая приоритизирует эти устройства, чтобы не все они отвечали на каждый запрос. Способ, которым это делается, сложен, но есть два основных правила, о которых вы должны знать. Первое простое: если и планшет/телефон, и Google Home, вошедшие в одну и ту же учетную запись Google, слышат горячее слово, Google Assistant выбирает Home.

Но если вас слышит более одного Google Home, как в моем случае практически при каждом взаимодействии с этими устройствами, все немного сложнее. Google никогда не раскрывал тонкостей работы своей системы, но, по сути, есть алгоритм, который просто пытается решить, какое устройство слышит ваш голос… лучше всего. В большинстве случаев это работает, особенно если у вас всего пара Google Home, и они расположены достаточно далеко друг от друга в вашем доме.

Реклама — прокрутите дальше, чтобы узнать больше

Раздражение возникает, когда у вас столько же Google Home, сколько у меня (которых, кстати, 7), и вы живете в относительно небольшом одноэтажном доме. Да, я признаю, что это перебор, но это также не ужасно неразумно или нереалистично, верно?

Я чаще всего замечаю проблемы на кухне, где сейчас находится два Home. Рядом с плитой стоит Home Hub, а на «обеденной» стороне кухни — Home Max (это не отдельная комната, просто другая сторона кухни). Обычно я встаю прямо перед одним из них, говорю: «Окей, Google», и другое устройство считает, что слышит меня лучше. Эти два устройства достаточно далеко друг от друга и даже разделены частичной стеной, так что вы могли бы подумать, что этого не произойдет. И они не дискриминируют — Home Max слышит меня неправильно так же часто, как и Home Hub.

В этом примере несовершенство голосового определения близости Google Home раздражает, но отчасти понятно, учитывая, что разница в ясности и громкости между тем, что улавливают два набора микрофонов дальнего поля, вероятно, не является существенной. Этого должно быть достаточно, чтобы Google мог их различать — чтобы знать, что тот, рядом с которым я стою и разговариваю напрямую, лучше. Но это не такая серьезная проблема, чтобы я мог написать эту статью с жалобой.

Удивительно, но иногда бывает и хуже. Вчера я стоял прямо рядом с вышеупомянутым Google Home Hub на моей кухне. Я устанавливал таймер для чего-то, что положил в духовку. В этот раз каким-то образом стандартный Google Home, который был в нескольких комнатах от меня, с двумя стенами между мной и им (не говоря уже о закрытой двери), решил, что слышит меня лучше. Да, я видел, что Home Hub активно слышал горячее слово и мой запрос. И между мной и тем Home в дальней ванной комнате было три Google Home, которые тоже должны были слышать меня лучше.

К счастью, Google ведет учет всех этих вещей в разделе Мои действия, поэтому у меня была возможность услышать, что именно услышал тот дальний Home. Я, признаться, говорил достаточно громко (и мой дом, по-видимому, достаточно акустически резонирует), так что это не совсем приглушенно, но можно понять, как далеко я нахожусь. Вот как меня услышал тот дальний Home:


Далекий стандартный Google Home

Я не смог скачать то, что услышал Home Hub в тот конкретный момент, так как «Мои действия» не сохраняют запросы, которые Google Assistant игнорирует, но я воспользовался возможностью попробовать еще раз и записать то, что, вероятно, услышал и проигнорировал Home Hub. Как вы можете видеть, это намного яснее.

Google Home Hub в 30 см от вас

Разница очевидна, поэтому мне непонятно, как Google мог решить, что дальний Home лучше. Это был просто баг? Алгоритм посчитал громкий и четкий голос с расстояния 30 см почему-то хуже, чем приглушенный с расстояния 12 метров? Почему Home Max на кухне (или даже более близкий Home Mini в спальне) не уловил мой голос вместо этого? Почему это происходит только в редких случаях (может быть, 1 из 10 взаимодействий, в моем случае), которые слишком редки, чтобы их легко воспроизвести, но не настолько редки, чтобы это не было проблемой?

Очень мало общедоступной информации о том, как на самом деле работает этот алгоритм. Пытается ли он определить только ясность речи? Или он учитывает громкость голоса, которая в некоторых случаях может ухудшить качество (если слишком громко), из-за чего далекие Home предполагают, что вы разговариваете с ними? Возможно, какой-то дополнительный шум, например эхо или фоновая музыка, ломает систему?

В любом случае, эти проблемы достаточно распространены, чтобы это не могло быть просто ошибкой пользователя. Неправильное восприятие разницы в качестве между двумя Google Home в одной комнате на расстоянии 3 метров иногда объяснимо (хотя я бы сказал, что это раздражает и, вероятно, исправимо), но при отсутствии проблем с оборудованием, когда Home, находящийся в нескольких комнатах, считает, что слышит ваш голос лучше, чем тот, рядом с которым вы стоите на расстоянии 30 см, — это расстраивает. В моем случае мне пришлось пройти через весь дом, чтобы выключить таймер духовки — это определенно то, что сбило бы с толку большинство людей.

Здесь много переменных, но их будет еще больше, поскольку Google выпускает больше продуктов с поддержкой «Окей, Google». Микрофоны дальнего поля в этих различных Home имеют, казалось бы, разное качество, расположены по-разному на самих устройствах и теоретически могут даже быть физически заблокированы (например, если вы коснетесь Home Hub грязными пальцами с кухни).

Однако я не думаю, что в моем случае есть какие-то необычные переменные, и у меня эти проблемы возникают уже много лет, поэтому я могу подтвердить, что Google активно не работает над их устранением. Возможно, пришло время внести некоторые изменения в эту систему голосового определения близости.