Google давно обладает функциями оптического распознавания символов (OCR) в Google Drive, которые позволяют индексировать и редактировать отсканированные бумажные документы, загруженные в Drive. Теперь Google недавно расширил эту функцию для более чем 200 языков и 25 стилей письма.
Чтобы сделать это возможным, инженерные команды Google применили подход к OCR, ориентированный на широкое языковое покрытие, с целью разработки архитектуры, которая потенциально могла бы работать со всеми существующими языками и системами письма. Мы делаем это отчасти, используя скрытые марковские модели (HMM), чтобы понимать ввод как единую последовательность, а не пытаться сначала разбить его на части. Это похоже на то, как современные системы распознавания речи распознают аудиоввод…
После сканирования документа и его загрузки в Drive, вам просто нужно щелкнуть по нему правой кнопкой мыши и выбрать «Открыть с помощью» -> «Google Документы».
Google добавляет, что вам даже не нужно устанавливать предпочтительный язык, Drive автоматически определит его при загрузке документа.
Вы можете получить доступ к функциям OCR как через веб-интерфейс, так и через приложение Google Drive для Android.
