Google Pixel испортил голосовой ввод на всех остальных телефонах, но решение уже близко

Есть множество причин, по которым мне нравится использовать телефоны Google Pixel, но голосовой ввод, пожалуй, является самой недооцененной функцией этих устройств. Каждый раз, когда я беру в руки Pixel, без исключения, мне становится трудно вернуться к любому другому устройству Android, отчасти потому, что голосовой ввод там работает намного хуже. Но, наконец-то, впереди светлое будущее.

Gboard — это основная клавиатура Android, и она имеет встроенный голосовой ввод. Она работает достаточно хорошо, но на Pixel она получает сверхзарядку. Google впервые внес это изменение более пяти лет назад; улучшенный опыт на Pixel не только намного быстрее, но и точнее. Между фактическим правильным распознаванием слов и возможностью вставлять знаки препинания, голосовой ввод на Pixel становится резко лучше, чем на любом другом устройстве Android.

И это независимо от того, какую клавиатуру вы используете. Gboard на Pixel и Gboard на Samsung Galaxy — это два совершенно разных опыта. Версия, используемая на других устройствах Android, не поддерживает знаки препинания (если вы не произносите их вслух), часто требует больше времени для загрузки и редко бывает такой же точной. Не поймите меня неправильно, могло быть и хуже — голосовой ввод Samsung Keyboard — это настоящее бедствие — но я действительно хотел бы, чтобы Google внес некоторые улучшения.

Однако, похоже, что решение этой проблемы уже на горизонте.

Это ИИ.

Я все еще с опаской отношусь к большинству применений ИИ, но если есть что-то, в чем большие языковые модели хороши, так это в работе с текстом — ведь это прямо в названии. Поэтому голосовой ввод стал очень популярным использованием ИИ и одним из самых полезных для конечного пользователя. Google, технически, был далеко впереди всех здесь, поскольку улучшенный голосовой ввод Gboard на Pixel является результатом машинного обучения. Новейшие модели только усилили это.

Одно из первых мест, где я начал наслаждаться этим, был «Wispr Flow», сервис голосового ввода с использованием ИИ, запущенный на Android ранее в этом году, и которым я пользуюсь с тех пор.

Я думаю, у этого есть два основных преимущества.

Во-первых, Flow не заменяет Gboard или любую другую клавиатуру, которую вы хотите использовать. Вместо этого он действует как плавающая кнопка/всплывающее окно поверх любого другого приложения, которое вы пытаетесь использовать. Требуется некоторая мышечная память, чтобы перестать нажимать кнопку микрофона Gboard и вместо этого использовать Flow, но это лучшее решение, которое я могу себе представить. Вы не смогли бы отнять у меня Gboard, и я не думаю, что я один — Gboard, возможно, является одним из лучших программных продуктов Google на Android. Плавающая кнопка отображается не всегда, а скорее появляется достаточно интеллектуально в зависимости от приложения, которое вы используете, и того, что вы на самом деле делаете. Я говорю «достаточно», потому что я заметил, что она появляется в моменты, когда она мне не нужна. Flow, похоже, фокусируется на обнаружении приложения, а не на простом методе, просто проверяя, когда активируется клавиатура.

Тем не менее, это одна из лучших реализаций, которые я видел. Нажатие кнопки запускает голосовой ввод, а нажатие галочки обрабатывает его и вставляет в активное текстовое поле. Я хотел бы, чтобы он показывал предварительный просмотр текста, но в целом он работает достаточно хорошо.

Конечно, это не единственные компромиссы. Вам придется предоставить Wispr Flow некоторые дополнительные разрешения, такие как отображение поверх других приложений, а также доступ к функциям специальных возможностей. В результате приложение отображает уведомления в строке состояния. Значка в строке состояния нет, и по умолчанию они отключены, но вам придется вручную отключить их через настройки Android, если вы действительно хотите их скрыть. Я быстро отключил постоянное уведомление через настройки Android, но немного разочаровывает, что существует постоянное уведомление, когда приложения имеют возможность отображаться поверх других. Я понимаю, почему оно существует — эту функциональность легко злоупотребить, но, черт возьми, это так сильно портит впечатление. Это главная причина, по которой Flow стал «приходящим и уходящим» статусом. Я все еще использую его время от времени, но я часто выключал его просто потому, что он мешал.

Вам также придется доверять Wispr в вопросах конфиденциальности. У приложения есть «Приватный режим», который, по их словам, «хранит данные только на вашем устройстве».

Тем не менее, фактическая производительность более чем компенсирует это.

Я использую его на своем Galaxy Z Fold 7 — моем повседневном устройстве и именно на том телефоне, который постоянно напоминает мне, насколько плох голосовой ввод Gboard вне Pixel — и я просто поражен тем, как хорошо все это работает. Модель голосового ввода здесь невероятно точна, способная идеально транскрибировать то, что я говорю, независимо от контекста. Будь то тихая комната или шумное место с громкой музыкой, он улавливает мой голос и точно преобразует его в текст. Он не безошибочен, иногда допускает опечатки или недопонимания, но ощущается почти таким же точным, как и на Pixel. Он также довольно хорошо вставляет знаки препинания. Я думаю, что опыт Google на Pixel все еще немного лучше в этом плане, но Flow справляется действительно хорошо.

Основное место, где Flow превосходит Gboard на Pixel, — это понимание контекста. Там, где вы можете транскрибировать через Pixel и получить слова вроде «типа» в местах, где это не самое подходящее, Flow автоматически исправляет такие фразы. Приложение в конечном итоге будет поддерживать пользовательский словарь и другие способы настройки вывода, но мне нравится оно и в текущем виде.

Но, как уже упоминалось, главная проблема Flow заключается в том, что он не является нативным.

Именно здесь и появляется следующий шаг. Это тот тип технологий, который, как я легко могу представить, будет использовать больше брендов Android. Nothing начал движение на этой неделе с запуском «Essential Voice», что по сути является нативным Wispr Flow для телефонов Nothing. Это устраняет дополнительную стоимость, а также лучше интегрирует голосовой ввод в ваш обычный опыт, поскольку он работает как через физическую кнопку Essential Key (так и через клавиатуру).

Мне кажется, вполне вероятно, что больше брендов Android последуют этому примеру. Поскольку все пытаются внедрить ИИ во все, улучшения голосового ввода — это почти беспроигрышный вариант, на мой взгляд. Это функция, которую мы все в той или иной степени используем, и в которой ИИ действительно хорош.


Главные истории этой недели

Безэкранный фитнес-трекер Google получит название «Fitbit Air»

Мы сообщили, что безэкранный фитнес-трекер Google получит название «Fitbit Air», а дополнительные отчеты показывают, что устройство будет стоить около 100 долларов и будет доступно в нескольких цветах. Оно также может появиться в течение следующих двух-трех недель.

Android 17 QPR1 Beta 1

Еще до первого стабильного релиза Android 17 Google уже выпустил первую бета-версию Android 17 QPR1. Она очень незначительная, с, пожалуй, самым примечательным — обоями, предназначенными для Pixel 11 Pro Fold.

Больше главных историй


Из других новостей 9to5

9to5Mac: iPhone 18 Pro Max может быть толще, макет iPhone Ultra по сравнению с 17 Pro Max

9to5Toys: Nintendo только что выпустила новые кадры игрового процесса и подробности для Switch 2: Yoshi и Таинственная книга

Electrek: Прототип Tesla Model YL впервые замечен на дорогах США