DeepMind работает над ИИ, способным «воображать» и планировать сложные, непредсказуемые сценарии

DeepMind продемонстрировал с помощью AlphaGo, что исследования в области искусственного интеллекта продвинулись дальше, чем ожидалось при нашей жизни. Подразделение Alphabet теперь занимается воображением — «отличительно человеческой способностью» — для создания ИИ, который лучше справляется со сложностью и непредсказуемостью реального мира.

Лондонская исследовательская группа называет воображение «мощным инструментом человеческого познания», который позволяет визуализировать последствия. В одном из примеров DeepMind описывает способность человека осознавать опасность размещения стакана на краю стола:

Размещая, например, стакан на краю стола, мы, вероятно, остановимся, чтобы подумать о его устойчивости и о том, не упадет ли он. На основе этого воображаемого последствия мы можем переставить стакан, чтобы он не упал и не разбился.

DeepMind утверждает, что ИИ должны уметь воображать и рассуждать о будущем, чтобы развивать «сложное поведение». В прошлом AlphaGo мог использовать «внутреннюю модель» для «анализа того, как действия приводят к будущим результатам, чтобы рассуждать и планировать».

Реклама — прокрутите дальше для получения контента

Однако эти модели преуспели в Го, потому что игры следуют четко определенным правилам, которые можно запрограммировать и точно предсказать. В сравнении с этим реальность сильно отличается:

Но реальный мир сложен, правила не так четко определены, и часто возникают непредсказуемые проблемы. Даже для самых умных агентов воображение в этих сложных средах — это долгий и дорогостоящий процесс.

Чтобы решить эту проблему, DeepMind опубликовал две статьи по «планированию на основе воображения», где агенты ИИ могут «изучать и строить планы для максимизации эффективности задачи».

Нейронная сеть, известная как «энкодер воображения», извлекает информацию, которая будет полезна для будущих решений. Игнорируя нерелевантную информацию, эти агенты, усиленные воображением, эффективны и могут изучать различные стратегии для построения плана.

DeepMind снова использовал игры, требующие перспективного планирования и рассуждения, чтобы протестировать эти новые архитектуры. В головоломке Sokoban есть необратимые ходы, а в другой игре по навигации космического корабля ИИ должен стабилизировать аппарат с минимальным количеством включений двигателей, учитывая гравитационное притяжение.

Последняя игра представляет собой «высоконелинейную сложную задачу непрерывного управления». В этих тестах ИИ может попробовать каждый уровень только один раз, тем самым побуждая его сначала представить различные стратегии, прежде чем применять их.

Конечные результаты многообещающи: агенты с усиленным воображением превосходят стандартные ИИ, обучаясь на меньшем опыте и работая более эффективно. Добавление компонента «менеджера» для построения планов привело к дальнейшему повышению эффективности. Однако мы все еще далеки от научно-фантастического концепта ИИ:

Для предоставления масштабируемых решений для агентов с богатыми моделями, которые могут использовать свое воображение для рассуждений о будущем и планирования, требуется дальнейший анализ и рассмотрение.