
После убедительной победы в игре Го в 2017 году, DeepMind от Alphabet перешла к покорению StarCraft II. Эта игра является «великим вызовом» для демонстрации успешности ИИ-агентов в сложных задачах, и завтра DeepMind и Blizzard в прямом эфире продемонстрируют последние достижения.
DeepMind и другие исследователи давно используют игры, чтобы определить, сможет ли искусственный интеллект справляться со сложными задачами, которые относительно просты для человека. StarCraft считается «великим вызовом», поскольку он требует от ИИ-агентов «выполнения и балансировки ряда подзадач» для достижения конечной цели «победить противника».
Например, хотя цель игры — победить противника, игрок также должен выполнять и балансировать ряд подзадач, таких как сбор ресурсов или строительство сооружений. Кроме того, игра может длиться от нескольких минут до часа, что означает, что действия, предпринятые в начале игры, могут не принести результата долгое время. Наконец, карта наблюдается лишь частично, что означает, что агенты должны использовать комбинацию памяти и планирования для достижения успеха.
В 2017 году подразделение Alphabet и Blizzard Entertainment выпустили Starcraft II Learning Environment (SC2LE). Он включает в себя API машинного обучения, предоставляющий исследователям и разработчикам доступ к игре, а также полмиллиона анонимизированных повторов игр и другие исследования.
Набор данных повторов полезен для обучения и помогает в исследованиях прогнозирования последовательностей и долговременной памяти, в то время как популярность игры предоставляет ИИ-агентам большой пул талантов для соревнований.
По сравнению с простыми играми, которые имеют только действия вверх/вниз/влево/вправо, StarCraft состоит из более чем 300 основных действий. Ранние исследования показывали успехи ИИ в мини-играх — таких как перемещение камеры, сбор минералов или выбор юнитов. Однако агенты исторически не могли «выиграть ни одной игры даже против самого простого встроенного ИИ».
Релиз также содержит серию «мини-игр» — устоявшийся метод разбивки игры на управляемые части, которые могут использоваться для тестирования агентов на конкретных задачах, таких как перемещение камеры, сбор минералов или выбор юнитов. Мы надеемся, что исследователи смогут протестировать на них свои методы, а также предложить новые мини-игры для соревнований и оценки другими исследователями.
На BlizzCon 2018 в ноябре прошлого года команда Alphabet продемонстрировала агента, способного выполнять базовые макро-ориентированные стратегии, а также защищаться от тактик.
DeepMind усердно работает над обучением своего ИИ (или агента) для лучшего понимания StarCraft II. Как только он начал осваивать основные правила игры, он начал демонстрировать забавное поведение, например, немедленную раш-атаку рабочего противника, которая на самом деле имела 50% успех против ИИ StarCraft II со стандартной сложностью «Безумие»!
После загрузки повторов от реальных игроков агент начал выполнять стандартные макро-ориентированные стратегии, а также защищаться от агрессивных тактик, таких как «пуш пушки».
Прямая трансляция начнется в 10:00 по тихоокеанскому времени (13:00 по восточному времени, 18:00 по Гринвичу) 24 января и будет доступна на YouTube и Twitch.
Обновление: Обе трансляции теперь идут в прямом эфире из штаб-квартиры DeepMind в Лондоне.
Посетите 9to5Google на YouTube для получения большего количества новостей: