Информация о самом сильном конкуренте Seedance 2.0 просочилась в сеть.
Теперь, всякий раз, когда какая-либо компания выпускает видеомодель, её неизбежно сравнивают с Seedance 2.0.
Компания Google, которая в последнее время вела себя относительно тихо, похоже, втайне готовится к масштабному шагу по возвращению себе лидерства в сфере создания видеоконтента.
Рано утром один из пользователей сети случайно активировал совершенно новую модель генерации видео в Gemini – Omni (Универсальный).
На странице чата Gemini отображается сообщение: «Создавайте видео с помощью Gemini Omni и познакомьтесь с нашей совершенно новой моделью генерации видео. Редактируйте свои видео, создавайте ремиксы прямо в чате, пробуйте множество шаблонов и многое другое».

▲Скриншот, на котором Gemini получает неожиданный доступ
Однако, по словам этого пользователя сети, при повторном открытии приложения Gemini исчезла не только функция Omni, но и интерфейс Gemini вернулся к старой версии.
Судя по предварительным результатам тестов, опубликованным на данный момент, Gemini Omni демонстрирует довольно хорошие показатели в определенных сценариях, напоминая о доминировании Nano Banana в области обработки изображений в свое время.
В двух представленных тестовых примерах, подобно тому как Nano Banana решает проблему рендеринга текста, Gemini Omni также решает две болевые точки предыдущих методов генерации видео с помощью ИИ: связность текста и физическую логику процесса еды .
▲ Источник видео: X@chetaslua | Подсказка: Профессор записывает на обычной доске математическое доказательство тригонометрических тождеств, объясняя текущий шаг в уравнении.
В этом 10-секундном видеоролике, который бросает вызов написанию сложных математических уравнений на доске, всего одна подсказка: «Профессор пишет математическое доказательство тригонометрического тождества на обычной доске и объясняет шаги, которые он предпринимает в данный момент при решении уравнения».
Хотя в видеоматериале всё ещё можно обнаружить некоторые незначительные недостатки в генерации ИИ, в целом видео идеально обрабатывает текстовое содержимое на доске, что было серьёзной ошибкой во многих видеомоделях в прошлом. Кроме того, общий реализм видео также очень высок.
Пользователи сети отреагировали на видео как на «слишком безумное», а блогер @Azed_ai, специализирующийся на создании супер-ИИ, также прокомментировал видео: «Если это реальный результат, то согласованность текста действительно невероятна».

▲ Ссылка на видеофайл: https://gemini.google.com/share/7d5dc678c80a
Некоторые пользователи сети усомнились в источнике видео, предположив, что оно могло быть создано не компанией Gemini Omni, поскольку блогер, опубликовавший новость, разместил официальную ссылку на сайт Gemini.
Мы протестировали Seedance 2.0 с теми же заданиями, и реализм визуального оформления был похвальным. Однако текст, написанный на доске, похоже, не имел особого отношения к тригонометрическим тождествам, и по-прежнему оставались некоторые проблемы с отображением текста на доске.
▲Сгенерировано Seedance 2.0
Ещё одно видео, попавшее в сеть, — это дань уважения "Уиллу Смиту, поедающему спагетти", и этот тестовый пример стал одним из обязательных заданий практически для всех моделей создания видеоконтента.
▲ Источник: Reddit@Zacatac_391 | Задание: Можете ли вы создать сцену, где двое мужчин сидят за столиком на открытой террасе фешенебельного ресторана на берегу моря? Они сидят за круглым столом, накрытым красивой белой скатертью, со всеми изысканными аксессуарами: ложками, вилками и ножами, красивыми салфетками и центральным украшением стола. Один мужчина – представитель высшего общества: зрелый афроамериканец лет 50 с короткой бородой и уверенной осанкой, одетый в элегантный костюм, другой – его друг. Оба подходят к столу, чтобы съесть спагетти. В начале мужчины подходят к столу, обмениваются короткими любезностями и начинают спокойно есть спагетти, перебрасываясь едой между укусами и беседуя.
Тестировщик, получивший ранний доступ, рассказал, что когда он попытался ввести в тест фразу "спагетти Уилла Смита", его ограничили правила генерации контента Google, поэтому он описал человека, очень похожего на Уилла Смита.
Видео, созданное с помощью Gemini Omni, превосходит собственную модель генерации видео Google, Veo 3.1, и по качеству звука и изображения больше похоже на реального человека.
Однако некоторые пользователи сети заметили, что когда они стояли, на тарелке не было пасты, но она появлялась, как только они садились. Затем, когда они ели, паста исчезала, даже не успев ничего съесть.
Мы также использовали Seedance для обработки этого набора подсказок, и когда мы его съели, результат оказался гораздо более естественным, чем у Gemini Omni.
▲ Сгенерировано Seedance 2.0 | Задание: Можете ли вы представить себе двух мужчин, обедающих за столиком на открытой террасе в фешенебельном приморском ресторане? Они сидят за круглым столом, покрытым белоснежной скатертью, на котором расставлены изысканные столовые приборы, включая ложки, вилки, ножи, красивые салфетки и центральное украшение стола. Один из мужчин безупречно одет: зрелый и сдержанный афроамериканец лет пятидесяти, с короткой бородой, в хорошо сшитом костюме, излучающий уверенность. Другой — его друг; оба мужчины приходят к столу, чтобы насладиться тарелкой пасты. Сначала они обмениваются несколькими простыми любезностями, прежде чем спокойно съесть пасту, время от времени вступая в светскую беседу.
На Reddit пользователь задал вопрос, использовал ли он последнюю модель генерации видео. Тестировщик ответил, что лучшей из тех, что он использовал, была Kling 3.0.
Один из пользователей сети ответил, что Seedance 2.0 намного лучше, чем Kling 3.0, поэтому производительность Gemini Omni меня не удивляет (я сам пользовался Seedance 2.0).
Что касается X, некоторые пользователи сети также считают, что Gemini Omni работает лучше, чем Seedance 2.0.

▲ Многие пользователи сети X поделились этими разоблачающими видеороликами, заявив, что они оказались эффективнее, чем Seedance.
Что еще более удивительно, Google на этот раз не только запустила функцию создания видео, но и добавила в Gemini Omni возможности редактирования видео.
Например, вы могли бы заменить пасту в оригинальном видео на тарелку тайского супа, похожего на том ям.

Также можно напрямую редактировать ранее созданные видеоролики с Сорой, содержащие водяные знаки, для их удаления.


▲Источник видео: X@Waguri_Kaoruko8
По результатам тестирования, Gemini Omni успешно удалил постоянно движущийся водяной знак Sora из оригинального видео Sora, сохранив при этом базовую согласованность с оригинальным видео.
Некоторые пользователи сети также протестировали производительность Gemini Omni при создании анимационных видеороликов.
Подобно оригинальной Nano Banana, которая была ориентирована на редактирование изображений и позволяла пользователям создавать различные настольные фигурки, многие считают, что Gemini Omni пойдет по аналогичному пути. Хотя ее возможности по созданию видео слабее, возможности по редактированию видео будут сильнее. Предполагается, что Gemini Omni 3 будет обладать лучшими на сегодняшний день возможностями по созданию видео.
В открытом интерфейсе также был представлен скриншот использования. Данные показали, что создание всего двух видеороликов — видео с математической доской и видео, где пользователь ест лапшу, — израсходовало 86% от суточного лимита подписки AI Pro пользователя. Пользователь упомянул, что в тот день он использовал только Gemini Flash.

Создание видео с использованием ИИ, безусловно, по-прежнему остается очень дорогостоящим бизнесом, но пока результаты достаточно хороши, найдется много людей, готовых за это платить.
В последнее время в интернете стали вирусными видеоролики с участием ИИ, отличающиеся большей продолжительностью, более реалистичными сценами, диалогами, актерской игрой и сюжетом по сравнению с аналогичными видео прошлого года.
Марко Славнич, технический художник платформы для создания видео Runway, опубликовал видео с голубями, созданное с помощью Runway на платформе X. Runway позволяет использовать модели Seedance 2.0, и видео быстро набрало миллионы просмотров.
Некоторые пользователи сети отметили, что 47-секундное видео не демонстрирует никаких следов искусственного интеллекта или неестественных движений, что позволяет предположить, что анимационной студии Disney действительно следует быть настороже.
▲ Источник видео: X@Markoslavnic
Ещё одной темой, которая стала популярной в Weibo, стали "массовое производство короткометражных фильмов с использованием ИИ и их сбои", которые набрали 12 миллионов просмотров после перепоста на сторонних сайтах.
Этот видеоролик был опубликован Пи Джей Эйсом, создателем контента в области генеративного искусственного интеллекта для видео и рекламы, а также основателем компании, занимающейся рекламой с использованием ИИ. Он прямо заявил:
Это один из лучших короткометражных фильмов, которые я видел за последние годы.
Вскоре мы перестанем называть это "фильмом об искусственном интеллекте", а просто фильмом.
▲ Источник видео: X@PJaccetturo
В комментариях к оригинальному видео на Bilibili некоторые пользователи отметили, что видео пользовалось большой популярностью, и что не только PJ Ace из-за рубежа хотел предложить ему работу, но и команда AI+ Creative Team в Гуанчжоу протянула ему руку примирения.
Видеоролик также получил множество похвальных отзывов: «Я бы пошел в кино, если бы это был трейлер», «Первоклассная работа; цвета, композиция и сюжет безупречны. Несмотря на то, что он немного коротковат, он бы органично вписался в любой сезон сериала «Любовь, смерть и роботы»», «Несколько лет назад на создание подобного ролика команде высшего уровня потребовалось бы несколько месяцев и миллионы»…

▲ Источник видео: [Оригинальный короткометражный фильм AI "Уборщик-зомби" – Ремастерированная версия, отечественная версия "Любовь, смерть и роботы"!] https://www.bilibili.com/video/BV1FFRQB2Eqw/
Как и в предыдущие разы, пользователи сети делятся своими рекомендациями по фильмам на месяц: «Четыре короткометражных фильма об искусственном интеллекте, которые обязательно нужно посмотреть в этом месяце».

Помимо контента, критикуемого как некачественный продукт, созданный с помощью ИИ, тенденция к тому, что видеоролики, созданные ИИ, станут мейнстримом, неизбежна по мере улучшения качества генерируемого контента.
Презентация Google Gemini Omni может быть способом подогреть интерес к предстоящей конференции Google I/O на следующей неделе. Если Gemini Omni станет доступен на конференции в этом году, это ознаменует начало новой эры в создании видео с помощью искусственного интеллекта.
#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.







