Google анонсировала модель генерации видео Veo 2, расширяя доступ к VideoFX

Сегодня Google анонсировала Veo 2, а также обновления Imagen 3 и новый эксперимент Whisk, демонстрирующий новейшую модель и Gemini.

Google представила Veo в мае на конференции I/O 2024, а последующая модель отличается «улучшенным пониманием реальной физики и нюансов человеческого движения и выражения» для повышения общей детализации и реализма. 

Кроме того, ваш запрос может включать указание жанра, объектива и кинематографического эффекта. Например:

  • …съемка с нижней точки, плавно перемещающаяся в центре сцены
  • …крупный план лица ученого, смотрящего в свой микроскоп
  • Укажите «18-мм объектив» в своем запросе, и Veo 2 создаст кадр с широким углом обзора, которым известен этот объектив…
  • …размойте фон и сфокусируйтесь на объекте, указав в запросе «малая глубина резкости»

Veo 2 также «реже галлюцинирует», и в ней есть невидимый водяной знак SynthID.

Реклама — прокрутите вниз для просмотра контента

Google разворачивает Veo 2 в VideoFX (в Google Labs) и «расширяет число пользователей, имеющих к ней доступ», но список ожидания все еще существует. В следующем году она появится в «YouTube Shorts и других продуктах».

Мы сознательно подходили к расширению доступности Veo, чтобы помочь выявить, понять и улучшить качество и безопасность модели, постепенно внедряя ее через VideoFX, YouTube и Vertex AI.

Камера плавно скользит по рядам покрашенных в пастельные тона деревянных ульев, пчелы, жужжа, вылетают и влетают в кадр. Движение останавливается на опрятном фермере, стоящем в центре, его безупречный белый костюм пчеловода блестит в золотом свете послеполуденного солнца. Он поднимает банку с медом, слегка наклоняя ее, чтобы поймать свет. За ним высокие подсолнухи ритмично качаются на ветру, их лепестки светятся в теплом солнечном свете. Камера наклоняется вверх, показывая фермерский дом в стиле ретро с окнами, выкрашенными в мятно-зеленый цвет, его стены покрыты тенями от качающихся деревьев. Снято 18-мм объективом на пленку Kodak Portra 400, золотистый свет придает богатую текстуру перчаткам фермера, банке с джемом и выветренному дереву ульев.

Этот средний план с малой глубиной резкости изображает милую мультяшную девочку с волнистыми каштановыми волосами, сидящую прямо на кухне 1980-х годов. У нее волосы средней длины и волнистые. У нее маленький, слегка приподнятый нос и маленькие округлые уши. Она очень оживленно и взволнованно разговаривает с камерой.

Низкоугловой кадр запечатлевает стаю розовых фламинго, грациозно бредущих по пышной, спокойной лагуне. Ярко-розовый цвет их оперения красиво контрастирует с изумрудно-зеленой прилегающей растительностью и кристально чистой бирюзовой водой. Солнечный свет играет на поверхности воды, создавая мерцающие отражения, которые танцуют на перьях фламинго. Изящные изогнутые шеи птиц погружены, пока они идут по мелководью, их движения создают нежные круги, распространяющиеся по лагуне. Композиция подчеркивает безмятежность и природную красоту сцены, освещая хрупкий баланс экосистемы и присущую этим великолепным птицам грацию. Мягкий, рассеянный свет раннего утра окутывает всю сцену теплым, неземным свечением.

Кинематографический кадр запечатлевает пушистого коккапу, сидящего на ярком розовом надувном круге в виде фламинго, в залитом солнцем бассейне Лос-Анджелеса. Кристально чистая вода сверкает под ярким калифорнийским солнцем, отражая игривую сцену. Шерсть коккапу, мягкое сочетание белого и абрикосового, подсвечена золотым солнечным светом, а его висячие уши нежно колышутся на ветру. Его счастливое выражение лица и виляющий хвост передают чистую радость и летнее блаженство. Яркий розовый фламинго добавляет причудливый штрих, создавая идеальный образ беззаботного веселья под солнцем Лос-Анджелеса.

Вы можете найти больше примеров здесь.

Сегодня Google также анонсировала улучшенную модель Imagen 3. Изображения стали ярче, лучше скомпонованы и отличаются «более богатой детализацией и текстурами», а также возможностью «отображать более разнообразные художественные стили с большей точностью». 

Эта последняя модель глобально внедряется в ImageFX

Наконец, в Google Labs появился новый эксперимент «Whisk», который «позволяет создавать запросы с изображениями». Он предназначен для демонстрации обновленного Imagen 3 и возможностей Gemini по визуальному пониманию/описанию.

Whisk позволяет вам использовать изображения для объекта, одно для сцены и другое изображение для стиля. Затем вы можете смешать их, чтобы создать что-то уникальное, от цифровой игрушки до эмалированной булавки или наклейки.