
Если бы интернет еще не был полон дезинформации и общего второстепенного контента, Veo 3 выведет его на совершенно новый уровень. Новый движок для генерации видео и аудио Veo 3 от Google уже используется для создания ужасающе реалистичных видео, которые обманут практически любого.
Новый движок Veo 3 был анонсирован на Google I/O вместе с целым рядом других обновлений моделей искусственного интеллекта Google. Главным улучшением движка Veo стало добавление синхронизированного аудио. Оказалось, что именно аудио отделяло очевидно сгенерированный контент от реальных видео с настоящими людьми.
Кроме того, улучшилась и генерация видео, что еще больше затрудняет отличить сгенерированный контент от органически созданного. Кадры стали четче и детализированнее, что только добавляет реализма, который теперь так сложно распознать.
Дополнительные инструменты, которые Google предоставил пользователям, подливают масла в огонь. Недавно анонсированный инструмент Flow в Google Labs позволяет пользователям создавать клипы и бесшовно объединять их, как виртуальную раскадровку. При правильном использовании клипы ИИ становятся фильмами со связностью и экспозицией, если пользователь этого желает. Хотя отдельные клипы ограничены примерно восемью секундами, Flow позволяет создавать гораздо более длинные видео со сшитыми сценами.
Несмотря на то, что Veo 3 скрыт в плане Google AI Ultra, пользователи уже начинают наполнять социальные сети созданными ими клипами. Один пост на Reddit принадлежит пользователю, который использовал Veo 3 для создания минутного видеоклипа, похожего на то, что мы видим от ребят из Electrek во время автомобильного шоу.
В клипе показано несколько интервьюируемых, у всех них невероятно детализированное синхронизированное аудио и индивидуальные личности. У каждого человека уникальная внешность и манера говорить, которая заставляет думать, что это настоящее автомобильное шоу.
Опять же, это не настоящие люди; это то, что придумал Veo 3. Изображение и сгенерированное аудио полностью синтетические, даже несмотря на то, что звук звучит совершенно реально. В этом клипе есть пара явных признаков, например, повторяющийся отец с ребенком или кофейная чашка, которая издает звук стекла, когда говорящий ее ставит.
Какими бы придирчивыми ни были эти детали, именно это теперь требуется, чтобы определить, является ли видео ИИ или нет.
Другой клип Veo 3 изображает YouTube-блогера, реагирующего на геймплей Minecraft и объясняющего, как играть. Этот клип немного легче отвергнуть как ложный по нескольким причинам. В основном, геймплей Minecraft выглядит реальным, но демонстрирует несколько надуманных функций, например, как разбивание дерева кулаками добавляет хлеб в ваш инвентарь. Это известная механика, а не диктат ИИ.
Veo 3 даже правильно генерирует зеленую дымку вокруг волос человека, что является дикой детализацией для включения.
Проблема с этими игровыми видео заключается в том, что они выглядят невероятно точно, и требуется пиксельный анализ, чтобы определить, сгенерированы они или нет. Возьмем, к примеру, видео игрового процесса Fortnite, которое было сгенерировано с помощью Veo 3. Единственный реальный способ определить, что все видео — подделка, — это отсутствие элементов пользовательского интерфейса, когда игрок выигрывает игру. В противном случае вы бы подумали, что это настройка записи нового YouTuber.
Вышеупомянутый клип также получен из самого простого запроса:
Стример получает победу в королевской битве только с помощью своей кирки
Насколько впечатляют эти сгенерированные видео с синхронизированным звуком, настолько важно прогнозировать тип контента, который мы можем увидеть в интернете в будущем. Эти клипы, без сомнения, могут обмануть большинство людей, и вероятность того, что создатели контента, имеющие возможность, будут использовать эти инструменты для разработки вводящей в заблуждение информации, высока. Это тот шаг, где ИИ сливается с реальностью.