Vidu Q3 незаметно совершает мощный шаг; отсылка к возвращению «Короля жизни» предвещает лучшие времена для комиксов, короткометражных драм, фильмов и рекламных роликов.

В 1977 году Джордж Лукас основал компанию Industrial Light & Magic специально для создания фильмов «Звёздные войны».
Причина заключалась в том, что в то время просто не существовало доступных инструментов для воплощения образов, которые были у него в голове. Эта компания впоследствии стала краеугольным камнем голливудской индустрии спецэффектов. Но в течение значительного периода времени ее возможности были доступны только тем съемочным группам, которые могли позволить себе ее содержать.

Кинематографический язык, звуковые эффекты и плотность спецэффектов — все это способствует созданию ощущения «готового продукта», но ресурсы, необходимые для их создания, отпугивают большинство создателей от этой профессии.
Лишь с появлением генеративного искусственного интеллекта, перевернувшего ситуацию с ног на голову, эта высокая стена действительно начала трескаться.
Порог входа снизился, но ИИ подобен неукротимой «коробке для гача-игр». Крайне низкая стабильность результатов стала самым серьезным препятствием для того, чтобы видео, созданные с помощью ИИ, достигли пригодного для использования уровня. Для решения этой проблемы компания Shengshu Technology, отечественный разработчик крупномасштабной модели генерации видео Vidu, два года назад впервые в отрасли представила функцию генерации эталонных изображений.

Персонажи, сцены, костюмы, реквизит — все это можно использовать в качестве исходных данных. Искусственный интеллект будет создавать контент на основе предоставленных вами визуальных ориентиров, и вся библиотека ресурсов может быть использована повторно. Недавно APPSO отметила, что функция создания референсов в Vidu Q3 также была официально запущена.
Стоит отметить, что после выхода Vidu Q3 в январе этого года он возглавил список авторитетной международной организации по тестированию ИИ Artificial Analysis. Этот результат, достигнутый благодаря тщательному тестированию, заложил прочную основу для последующих улучшений возможностей.
Компания Industrial Light & Magic десятилетиями значительно снижала порог входа для «возможности снимать» фильмы. Теперь у Vidu Q3 еще более амбициозные планы: оснастить каждого члена съемочной группы искусственным интеллектом, что позволит каждому создателю начать с одинаковой, а то и с более высокой стартовой линии.
В конечном итоге, цель создания видео с помощью ИИ — переориентироваться на «рассказывание историй».
Если в первом вопросе проекта Vidu речь шла о формировании базовых навыков повествования, а во втором — о том, чтобы помочь персонажам начать понимать «актерскую игру», то у третьего вопроса только одна цель: напрямую интегрировать созданный контент в производственный процесс.
Для достижения этой цели Q3 Reference Studio провела систематическое обновление в трех направлениях: спецэффекты, звуковые эффекты и сцены. Создание шести основных спецэффектов (частицы, текучесть, динамика, движение камеры, переходы и освещение), пяти основных звуковых эффектов (окружение, движение, атмосфера, фоли и эмоции) и четырех основных сцен (аниме, короткометражные драмы, фильмы и рекламные ролики) было основано на одном ключевом принципе:
Создайте систему генерации видео с помощью ИИ, действительно предназначенную для драматических произведений.
Работает ли эта функция? Давайте разберем ее по пунктам и посмотрим, как Vidu Q3 уделяет внимание деталям.
Комикс: у вас есть лишь доля секунды, чтобы удержать внимание аудитории.
В комиксах спецэффекты требуются в наибольшей степени.
Зрителям не важна реалистичность визуальных эффектов, но они крайне чувствительны к тому, насколько захватывающими являются сцены экшена. Если удар мечом не производит должного впечатления, а удар кулаком не вызывает должного отклика, зрители просто уйдут. Это решение принимается за доли секунды, не оставляя места для компромиссов.
Сочетание работы с частицами и динамики в Vidu Q3 идеально решает эту проблему.
В сцене, изображающей поле битвы бессмертных, главная героиня стоит на вершине горы, сложив руки в печать. Частицы тёмного золота высыпаются из-под её пальцев, конденсируясь во вращающемся рунном массиве. Рунный массив внезапно взрывается, и божественный меч проносится по воздуху. Отголоски крика меча продолжают сотрясать воздух. Камера быстро следует за траекторией летящего меча, застывая на панорамном виде героини, стоящей рядом с божественным мечом, в то время как частицы-угольки медленно улетают в воздух.
В этой сцене одновременно используются эффекты частиц, слежение камеры, динамические удары и рендеринг освещения.
Неудивительно, что эти элементы могут генерироваться независимо друг от друга; ключевой момент заключается в том, что ритм всех этих элементов следует логике повествования. Скорость конденсации частиц, время взрыва рунного массива и траектория движения камеры — всё это соответствует эмоциональному ритму действия в повествовании, связанного с «призывом божественного меча».
То же самое относится и к сражениям роботов в открытом космосе.
Синяя плазма поражает грудную полость, ударная волна взрыва распространяется концентрическими кругами, разбрасывая обломки и металлические фрагменты. Поврежденный мех издает потрескивающие электрические дуги и механические стоны. Визуальные и звуковые эффекты наслаиваются друг на друга, каждый слой продвигает повествование о бое, а не является случайной, бессмысленной сенсорной бомбардировкой.

Даже в следующем случае, где нет масштабных сцен или конфликтов, одной лишь атмосферы достаточно, чтобы увлечь зрителя. Свист ручек, мелодии фортепиано и едва слышный шелест ветра за окном — ничто из этого не затмевает другое.

Короткая драма: Эмоции сложнее всего подделать.
Если анимационные сериалы полагаются на обилие спецэффектов, то короткометражные драмы — на сдержанность. Короткометражным драмам не нужны грандиозные сцены, но каждый кадр должен передавать смысл.
В сцене во дворце они находятся всего в шаге друг от друга, но каждый хранит свои секреты. Камера медленно кружит вокруг них, свет и тень переливаются между падающими лепестками и их одеждами. Сцена статична, но эмоции ощутимы. Эта атмосфера достигается на 70% за счет звуковых эффектов и на 30% за счет визуальных эффектов. Фоновый звук создает ощущение дыхания, а движения камеры визуально усиливают эмоции; и то, и другое незаменимо.

Сцена ухода из дворца снежной ночью — ещё более наглядный пример. Камера медленно приближается к руке, крепко сжимающей рукав мантии. Фигура главной героини становится всё меньше и меньше, ветер и снег усиливаются, а принц стоит на месте, не двигаясь ни на дюйм. На протяжении всей сцены нет ни одной реплики.

Несмотря на то, что повествование полностью основано на движении камеры и окружающих звуках, звуки снега, ветра и шагов — эти детали формируют «фон» сцены. Если бы они исчезли, вся эмоциональная атмосфера сцены разрушилась бы. Благодаря наличию в Vidu Q3 специальной модели для окружающих звуков, сгенерированное видео впервые приобретает реалистичное ощущение пространства.
Кино и телевидение: откуда берется «качество» трехсекундных решающих моментов, от которых зависит жизнь или смерть?
В кино и телесериалах качество визуального ряда играет решающую роль в том, останется ли зритель у экранов или уйдет в течение трех секунд. А качество является результатом одновременного согласования звука и изображения.
В сцене погони черный модифицированный спортивный автомобиль на высокой скорости входит в поворот, шины визжат, трутся о землю. В зеркале заднего вида появляются фары преследующей машины, которые приближаются все ближе и ближе. Главный герой резко нажимает на газ, двигатель ревет, машина скользит и заносит, разбрызгивая воду по обеим сторонам.

Звуки дождя, двигателя и сердцебиения накладываются друг на друга.
Звуковое оформление сцен на поле боя еще раз подтверждает этот тезис.
Снаряды упали с очень близкого расстояния, ударная волна сбила солдат с ног. Звук резко затих после удара, превратившись в приглушенный звон в ушах, словно все происходило в замедленном темпе. Затем звон постепенно стих, и вернулись звуки выстрелов, крики товарищей и лязг металла, нарастающие от подавления до взрыва с сильным ощущением многослойности.

Реклама: Помните, это единственный KPI.
При оценке коммерческой рекламы практически единственным критерием является то, оставляет ли она неизгладимое впечатление.
Спортсмен вырывается из темноты, каждый шаг запускает динамический эффект, сотрясающий землю. Бетон взрывается вокруг точки удара, разбрасывая осколки, а в момент отрыва подошв обуви от земли появляются оранжевые следы. Ритм барабанов точно синхронизирован с взрывом спецэффектов; каждое приземление соответствует одному удару барабана.

Например, в этой рекламе парфюма, в крайне темной сцене, янтарная жидкость переливается через край в замедленной съемке, а частицы золотистого тумана разлетаются во все стороны. Мозг автоматически создает «ощущение роскоши, как в реальной жизни».

Один подход основан на массированном облучении, другой — на сдержанности; только успешно используя оба пути, можно действительно добиться «достаточного охвата». Это также является самым сложным аспектом контента, созданного с помощью ИИ, в прошлом, потому что «чувство меры» трудно описать параметрами, но его наличие можно определить с первого взгляда.
Конечно, возможности Vidu Q3 выходят далеко за рамки этого. Эти распространенные сценарии были выбраны для проверки именно потому, что требования к «результатам» в них сильно различаются, что прекрасно демонстрирует широкий спектр возможностей версии Q3.
Благодаря мгновенной подаче сигнала сразу после вывода, Vidu Q3 превращает "достаточно хороший" продукт в "простой в использовании".
Оглядываясь на эти четыре сценария, можно сказать, что комиксы должны быть захватывающими, короткие драмы — вызывать эмоции, фильмы и телесериалы — отличаться высоким качеством производства, а реклама — запоминающейся. Освоение этих навыков — лишь первый шаг. Следующий вопрос: как по-настоящему интегрировать эти навыки в рабочий процесс создателя?
Референсные возможности Vidu Q3 не ограничиваются одной конкретной моделью.
Модель основана на Vidu Q3, которая обеспечивает основу для генерации эталонных данных и создания нарративов. Она также предоставляет услуги глобальным разработчикам, создателям контента и предприятиям через MaaS (Vidu AI Open Platform, Vidu.API) и SaaS (Vidu Agent, Vidu Claw).
Среди них корпоративные сервисы MaaS заняли лидирующие позиции в отрасли. По сравнению с аналогичными продуктами, они обладают рядом существенных преимуществ в плане сотрудничества: доступ без пороговых значений, цена в три раза ниже рыночной, рациональная логика переключения сценариев, более высокая скорость генерации, поддержка оптимизации ключевых слов, гибкая адаптация рабочих процессов, поддержка обучающих услуг и удобный пользовательский интерфейс даже в пиковые периоды.
Используйте код приглашения APPSON3 для входа на Vidu.cn, чтобы быстро ознакомиться с новейшими функциями Q3 Reference и получить 500 бонусных баллов.

Независимо от выбранной точки входа, задействуется один и тот же набор функций визуальной привязки и генерации повествования.
Единая библиотека ресурсов может многократно использоваться на разных платформах и в разных инструментах, что устраняет необходимость перестраивать настройки персонажей для каждой среды. «Согласованность стиля», которая ранее зависела от времени и трудозатрат, теперь является параметром, которым можно систематически управлять.
В конечном итоге, такое сочетание возможностей приводит к совершенно ясному выводу: производственные возможности крупномасштабных моделей наконец-то по-настоящему интегрированы во все аспекты фактического производства контента.
Эффект еще более очевиден в конкретных сценариях: при создании комиксов теперь легко можно создавать непрерывные сцены драк, которые раньше было крайне сложно контролировать; при создании коротких драм микровыражения персонажей перестают быть скованными, как у марионеток, и приобретают более реальные и ощутимые эмоции и человечность.
В постпродакшене кино и телевидения звуковые дорожки, созданные с помощью ИИ, могут быть легко интегрированы в существующие материалы; а в рекламном производстве согласование визуального ритма с музыкальными битами автоматически выполняется на этапе создания модели. Первоначальный вариант, полученный создателем, сам по себе представляет собой высококачественный готовый продукт.
Вы заметили? Раньше для реализации этих возможностей требовалось частое общение и сотрудничество между специалистами по визуальным эффектам, монтажёрами, звукорежиссёрами и другими заинтересованными сторонами. Теперь же они стали самыми базовыми функциями Vidu Q3.
Комиксы, короткометражные драмы, фильмы и телесериалы, а также реклама — все эти области сталкиваются с общими проблемами: огромный спрос на контент, чрезвычайно высокие затраты на рабочую силу и длительные циклы итераций. Раньше все полагались на привлечение большого количества людей и времени для соблюдения сроков; теперь же четкая логика снижения затрат и повышения эффективности заставляет переосмыслить эти отрасли.
За этим кроется важная логика. Когда базовый результат модели достигает пригодного для использования уровня, наиболее трудоемкое и внутренне неэффективное звено в цепочке сотрудничества естественным образом разрушается: все приходят к единому визуальному замыслу, и время, ранее затрачиваемое на общение и пробные ошибки, теперь может быть полностью возвращено к самому процессу создания.
Мы часто говорим о необходимости практического внедрения ИИ, но что означает настоящее внедрение? Речь не идёт о получении сотен тысяч лайков в социальных сетях или о первом месте в рейтингах. Настоящее внедрение имеет только один критерий: готовый продукт должен быть готов к немедленному использованию, без необходимости повторных проверок, а первый черновик — это уже завершённая работа.
Можно сказать, что впервые границы доставки контента промышленного уровня действительно открылись для обычных создателей и небольших и средних команд. С Vidu Q3, уже оснащенным самым современным аудиовизуальным языком, следующий вопрос становится все более очевидным:
Перед вами этот ревущий двигатель промышленного класса. Какую историю вы планируете рассказать с его помощью?
#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.
