
Genie 3 — это «общецелевая модель мира, способная генерировать разнообразные интерактивные среды». Google теперь позволяет подписчикам AI Ultra в США получить к ней доступ в рамках «Проекта «Джинн».
Модель мира имитирует динамику среды, предсказывая, как она развивается и как действия на нее влияют. В то время как Google DeepMind имеет опыт работы с агентами для конкретных сред, таких как шахматы или го, для создания AGI требуются системы, которые ориентируются в многообразии реального мира.
Этот экспериментальный исследовательский прототип позволяет вам описать свою среду («Как выглядит ваш мир?»), включая то, как вы хотите ее исследовать — пешком, верхом, в полете, на машине и т. д. — и с видом от первого или третьего лица.
После выбора персонажа («Это человек, животное, объект или что-то другое?») «Проект «Джинн» создает предварительное изображение, или World Sketching, используя Nano Banana Pro. Это позволяет вам предварительно просмотреть, «как будет выглядеть ваш мир, и изменить свое изображение, чтобы довести ваш мир до совершенства перед погружением».
Затем вы «создаете мир» с ограничением для пользователей в 60-секундные сессии. Фотореалистичные миры имеют разрешение 720p, а частота взаимодействия составляет 20-24 кадра в секунду.
Когда вы двигаетесь, Genie 3 (впервые представленный в августе) «генерирует путь вперед в режиме реального времени на основе ваших действий». Google симулирует физику и взаимодействия с «прорывной согласованностью». Вы можете настраивать камеру во время взаимодействия с миром, с возможностью загружать видео ваших прогулок.
Еще одна функция позволяет вам «Ремиксовать миры»:
Ремиксируйте существующие миры в новые интерпретации, опираясь на их подсказки. Вы также можете исследовать курируемые миры в галерее или в <иконка рандомизатора> для вдохновения или опираться на них.
Помимо 60-секундного ограничения, Google также предупреждает о том, как:
- «Сгенерированные миры могут не выглядеть полностью правдоподобными или не всегда точно соответствовать подсказкам, изображениям или законам физики реального мира»
- «Управление персонажами иногда может быть менее точным или испытывать более высокую задержку управления»
Google работает над улучшением «Проекта «Джинн» с помощью «триггерных событий, которые меняют мир по мере его исследования».
- Подсказка для среды: Бескрайний океан с огромными, грохочущими волнами, с гигантскими бирюзовыми туннелями, разбивающимися под драматическими солнечными вспышками, с роями сотен чаек, летающих так близко, что на мгновение заслоняют вид.
- Подсказка для персонажа: Нос белой доски для серфинга, рассекающий воду, направленный прямо в полый туннель гигантской, разбивающейся волны.
Этот демонстрационный образец позволит Google «лучше понять, как люди будут использовать модели мира в различных областях как исследований в области ИИ, так и генеративных медиа». Доступ «начинает предоставляться сегодня подписчикам Google AI Ultra в США (18+), с расширением на другие территории в ближайшее время».
…наша цель — сделать эти возможности и технологии доступными для большего числа пользователей
В более широком смысле, модели мира являются частью миссии Google DeepMind по созданию AGI. Моделирование сценариев реального мира имеет практическое применение в «робототехнике, моделировании анимации и художественной литературы, а также в исследовании локаций и исторических мест».
- Подсказка для среды: Высокогорный открытый мир с деформируемым снежным рельефом.
- Подсказка для персонажа: Ловкий альпинист с всенаправленным движением и механикой прыжков.