Google демонстрирует понимание естественного языка с помощью поиска «Talk to Books» и игры «Semantris»

Одно из выдающихся достижений, обусловленных машинным обучением, — это способность компьютеров понимать естественный язык. Google демонстрирует эти улучшения с помощью Smart Reply. Его исследовательское подразделение изучает другие приложения и сегодня выпустило две увлекательные и интересные демонстрации.

В прошлом году Google смог увеличить процент полезных предложений Smart Reply, используя иерархические векторные модели языка:

Понимание естественного языка существенно развилось за последние несколько лет, отчасти благодаря разработке векторов слов, которые позволяют алгоритмам узнавать о взаимосвязях между словами на основе примеров фактического использования языка. Эти векторные модели отображают семантически похожие фразы в соседние точки на основе эквивалентности, сходства или связанности идей и языка.

Эти улучшения могут стимулировать новые возможности поиска, что Google демонстрирует с помощью «Talk to Books». Пользователи могут задать вопрос или сделать утверждение, а затем веб-сайт попытается ответить, предложив релевантный отрывок из книги. Идея Google заключается в том, что эти ответы «помогут вам определить, хотите ли вы их прочитать или нет».

Реклама — прокрутите вниз для получения дополнительного контента

После того как вы зададите свой вопрос (или сделаете утверждение), инструмент найдет все предложения в более чем 100 000 книг, чтобы найти те, которые соответствуют вашему вводу на основе семантического значения на уровне предложений; не существует предопределенных правил, ограничивающих связь между тем, что вы вводите, и результатами, которые вы получаете.

По сравнению со Smart Reply и его анализом на уровне абзацев, этот эксперимент рассматривает только предложения из 100 000 проанализированных книг. Таким образом, ответы могут быть не в контексте, но Google утверждает, что преимущество заключается в поиске «неожиданных авторов и названий».

Тем временем Semantris — это увлекательная игра на ассоциации слов, которая использует формат, похожий на Тетрис, для демонстрации технологии. Игрок вводит слово или фразу, а игра ранжирует их по отношению к словам на экране, оценивая, насколько хорошо они соответствуют, а затем удаляет их как часть игры.

Режим «Блоки» имеет формат Тетриса, который, как мне показалось, довольно увлекателен, особенно когда пытаешься быть неочевидным и посмотреть, сможет ли понимание естественного языка установить даже самые незначительные связи.

Другие практические приложения включают классификацию, семантическое сходство, семантическую кластеризацию, приложения с белым списком (выбор правильного ответа из множества альтернатив) и семантический поиск (Talk to Books). Google надеется, что, поделившись этими демонстрациями, другие смогут найти новые способы использования этих последних достижений в машинном обучении.


Посетите 9to5Google на YouTube для получения дополнительных новостей: