В Gemini появилась модель видео «Omni» с первыми впечатляющими демонстрациями

Похоже, в Gemini появится новая модель генерации видео под названием «Omni», которая демонстрирует весьма впечатляющие первоначальные результаты.

Генерация видео —, пожалуй, один из самых впечатляющих, но и самых спорных аспектов генеративного ИИ. Google уже некоторое время разрабатывает Veo в качестве своей модели генерации видео, но, похоже, готовит что-то новое.

По крайней мере, одного пользователя Gemini попросили «Создать с помощью Gemini Omni», которую Google описывает следующим образом:

Представляем нашу новую модель генерации видео. Ремиксируйте свои видео, редактируйте прямо в чате, пробуйте шаблоны и многое другое.

То, как «Omni» вписывается в более широкий контекст Gemini и Veo, пока не совсем ясно, но метаданные предполагают, что «Omni» является расширением Veo. Но, независимо от этого, результаты здесь выглядят довольно впечатляюще. В одной из демонстраций использовался запрос: «Профессор пишет математическое доказательство тригонометрических тождеств на обычной классной доске, объясняя шаг, на котором он находится в данный момент в уравнении», и хотя в конечном результате все еще есть некоторые очевидные недочеты, видео отлично справляется с текстом, создавая довольно реалистичное видео.

Тем временем, второй запрос был о сцене, где два мужчины едят спагетти — в отсылку к тесту Уилла Смита — опять же с довольно реалистичными результатами. Это ничего совершенно революционного, но результат довольно хорош.

Запрос здесь был: «Можешь ли ты создать сцену с двумя мужчинами за столом у моря на террасе дорогого ресторана. Они сидят за круглым столом с красивой белой скатертью и всеми модными аксессуарами, всеми ложками, вилками и ножами, стильными салфетками, центральной композицией. Один мужчина — уважаемый: зрелый афроамериканец лет 50 с короткой бородой и уверенной осанкой, в элегантном, сшитом на заказ костюме, другой — его друг, оба подходят к столу, чтобы съесть тарелку спагетти. В начале мужчины подходят к столу, обмениваются краткими любезностями и спокойно начинают есть спагетти, перекусывая и разговаривая.»

У этого пользователя также появилась вкладка «Использование», где эти два запроса занимают 86% ежедневного использования по плану AI Pro (хотя пользователь также упомянул некоторое использование Gemini Flash в тот же день).

Мы недавно заметили намерение Google добавить более явные ограничения на использование.

Google еще не анонсировала Gemini «Omni», но ранее заявляла, что «видео никуда не денется», подтверждая свою приверженность технологии после анонса о том, что OpenAI прекратит генерацию видео через свою модель Sora ранее в этом году. Поскольку I/O 2026 не за горами, вероятно, именно там мы узнаем больше о планах Google относительно Gemini и генерации видео.

Больше о Gemini: