Теперь ИИ-генерация видео тоже обладает определенными навыками; простой тег @ может привлечь целую голливудскую съемочную группу.

Недавно Claude Skills стал вирусным в социальных сетях. Он превращает ИИ из простого средства общения в квалифицированных работников. Благодаря тому, что профессиональные навыки объединены в модули, пользователи могут выбрать соответствующий навык простым косым чертой (/).
Хотите заниматься анализом данных? /Аналитик данных. Хотите писать код? /Эксперт по программированию. Искусственный интеллект перестал быть «черным ящиком», пытающимся угадать наши желания, и превратился в набор инструментов по запросу. Этот модульный подход теперь распространился и на область генерации видео с помощью ИИ.
В недавно запущенном сообществе тем Vidu восемь категорий — движение камеры, спецэффекты, атмосфера, игра актеров, композиция, повествование, стиль, сцена и движения — объединены в «библиотеку тем». Для доступа к этим темам достаточно просто добавить символ «@» в поле ввода.

▲В видеоролике, содержащем справочную информацию, ввод символа @ автоматически вызовет поле выбора, позволяющее напрямую найти нужную тему.
Хотите увеличить изображение с камеры? @CameraLibrary. Хотите создать атмосферу киберпанка? @AtmosphereLibrary. Хотите эффекты частиц? @EffectsLibrary.
Мы даже можем использовать их в слоях, например, в Claude Skills: @Camera + @Atmosphere + @Effects + Character Images, обрабатывая работу режиссера, оператора, специалиста по визуальным эффектам и арт-директора одновременно.

Ранее говорили, что ИИ отнимет работу у голливудских актеров. Теперь же Vidu напрямую предоставила каждому создателю контента голливудскую студию, работающую на основе ИИ. Актеры, режиссеры и операторы — все они — ИИ; все, что нам нужно сделать, это пометить их.
Это также первое в мире видеосообщество, работающее на основе искусственного интеллекта, сообщество, позволяющее обмениваться контентом, торговать им и взаимодействовать друг с другом.

Оцените возможности здесь: https://www.vidu.cn | API Vidu: http://platform.vidu.cn/
Компания APPSO в кратчайшие сроки получила доступ к тестовой версии тем оформления от сообщества Vidu и протестировала все 8 типов тем . Давайте посмотрим, как они покажут себя на практике.
Мы также подготовили бонус для всех: войдите на vidu.cn , введите пригласительный код: APPSON , и вы получите 500 баллов при регистрации. Приходите и убедитесь сами!
Искусственный интеллект наконец-то научился «действовать».
В традиционных видеороликах, созданных с помощью ИИ, наиболее сложным аспектом для описания является визуальное качество. Добавление даже нескольких дополнительных прилагательных может легко привести к тому, что ИИ начнет создавать иллюзии. В частности, скованность мимики является серьезным недостатком видеороликов, созданных ИИ.
В основной библиотеке эмоциональных выражений и смайликов сообщества Vidu эти сложные описания эмоций и действий стандартизированы. Теперь такие выражения и смайлики, как безудержный смех, страх, грусть и радость, могут напрямую генерировать соответствующее выражение лица и эмоциональное состояние персонажа; а эмоциональные выражения, такие как драки между двумя людьми, групповые столкновения и романтические отношения, даже упорядочили конкретные действия персонажей.
С помощью одного клика для добавления эмодзи мы можем идеально воспроизвести различные эмодзи из основного сообщества, даже без дополнительных подсказок. При этом мы можем сохранить целостность и согласованность видео.
Мы используем изображение клоуна и тему маниакального смеха , чтобы придать клоуну более выразительные черты и движения, сохраняя при этом его внешний вид неизменным и поддерживая общую атмосферу ужаса и напряжения.

▲Комбинированная формула: @Грозы никогда не прекращаются @Городские руины , @Рисунок 1: Стою на улице, лицом к камере и издаю @маниакальный смех , в сочетании с резкой @быстрой тряской камеры , создающей сильную @ужасающую и напряженную атмосферу.
Оно умеет смеяться, и, конечно же, плакать. Используя тему @ExaggeratedBigEyedCrying , вы можете заставить персонажей в видео плакать навзрыд. Эти выражения лица и темы для перформанса действительно могут оживить персонажей в видео с искусственным интеллектом.

▲ Комбинационная формула: @Рисунок 1 показывает её стоящей перед зеркалом с @преувеличенно большими глазами, выражающими слёзы . В сочетании с сильной @грустью атмосфера делает её плач всё более и более печальным. В то же время, @боковая подсветка используется для того, чтобы показать её контур и отчётливое выражение слёз в зеркале.
Управление мимикой не только точное, но и благодаря предустановкам в библиотеке тем, мы можем легко заставить персонажа выполнять мощные приемы. И это касается не только анимации персонажей; видеоэффекты также автоматически добавляются простым тегом в тематическом сообществе.
Сначала мы выбрали клона из списка ходов: @Hundred Flowers in Full Bloom .

▲Комбинированная формула: @Персонаж 3 использует @Ослепительный клон «Сто цветов»
Эффект довольно хороший. Даже с более сложными приемами, такими как @Ice Rain и Chains, Виду отлично с ними справляется.

▲Комбинированная формула: @Sword Saint использует @Ice Rain для атаки на @Cang Xuan . Как только ледяной дождь вот-вот обрушится на @Cang Xuan , @Cang Xuan быстро использует @Golden Bell Shield , чтобы отразить атаку.
Эти приёмы и спецэффекты — просто лучшие инструменты для создателей коротких драм и комиксов.
Различные темы можно комбинировать и накладывать друг на друга, и Vidu может подарить мне замечательный фэнтезийный блокбастер о боевых искусствах.

▲Формула комбинации: @星野仙尊лицает @鬼怪и высвобождает @降龙十八掌 ( Покорение дракона восемнадцатью ладонями), сцена @大战 (Поле боя) , @智能运镜 (Интеллектуальное движение камеры)
В ближнем бою два на два его плавные и грациозные движения могли бы даже напоминать сцены из «Матрицы».


@ Я могу сделать снимок в мгновение ока, я также могу выполнять работу оператора на миллион долларов.
После проработки выражений лиц и движений персонажей следующим шагом стала разработка визуального оформления.
Умение контролировать перспективу и привлекать внимание зрителя — бесспорно, важнейшая часть представления видеоконтента. Движение камеры и композиция являются ключевыми элементами; движение камеры определяет, как она движется, и всегда было основой кинематографического языка, в то время как композиция определяет кадрирование и угол съемки.
В основном сообществе Vidu используются такие типы съемки , как крупные планы, панорамы, виды с высоты птичьего полета и 360-градусные изображения. Композиции также включают групповые противостояния, правило третей и голландскую ракурсную съемку. Техника съемки более разнообразна и включает приближение камеры, панорамирование, круговые съемки и съемку с разведывательного ракурса.
Мы начали с того, что случайным образом выбрали набор ключевых слов из нашей тематической библиотеки, сгруппированных по персонажам, стилю, сценам, атмосфере и движению камеры. Даже слов, связывающих эти темы, было немного. В итоге, представленный сразу, получился фильм, напоминающий голливудский блокбастер.

▲Комбинированная формула: @Напряженная и гнетущая атмосфера , @Леонардо Ди Каприо стоит на @парковке , камера сначала @показывает сцену на 360 градусов , затем отдаляется, чтобы @показать пустую парковку в панорамном виде.
Леонардо Ди Каприо — это персонаж, которого мы создали сами. Загрузив 1-3 фотографии, выбрав соответствующий звук, а затем определив стиль и подсказки, мы получаем многоразового персонажа.

Круговой обзор на 360 градусов еще больше усиливает напряженную и гнетущую атмосферу. Когда камера отдаляется и использует панорамный вид , визуальное воздействие усиливается; всего за пять секунд создается драматическое напряжение.
Помимо работы с камерой в замкнутых пространствах, конфигурация объективов основного сообщества Vidu также отлично показывает себя на открытых, бескрайних пространствах.

▲Комбинированная формула: @Вид сзади @Энергичная девушка, сидящая на краю небоскреба, @Дрон, отдаляющийся от экрана , @Панорамный вид на горизонт города Нанкин и @Впечатляющая атмосфера
Кроме того, основное сообщество Vidu также предоставляет специальные треки для объективов, такие как @probe lens . Сложно четко описать траекторию движения камеры естественным языком. Теперь мы можем напрямую вызвать основной блок, чтобы быстро выполнить макросъемку.

▲Комбинированная формула: @Zheng Kaikai @Научно-фантастический стиль @Сцена в космической капсуле @Технологическая атмосфера @Линза зонда
Многие видеоролики, созданные с помощью ИИ, часто обладают прекрасным качеством изображения, но анимация выглядит неестественно. Новые, более совершенные функции управления движением камеры, добавленные в основное сообщество Vidu, действительно гораздо более управляемы и просты в использовании, чем те, что требовали ранее ввода команд для управления движением камеры и персонажей. Понимание профессиональной терминологии управления камерой достаточно точное.
Продолжайте проверять понимание движения камеры и кадрирования. Кадр с приближением камеры — один из самых простых приемов в кино, постепенно переходящий от общего плана к крупному, создающий ощущение эмоционального развития. Мы начали с написания ключевых слов традиционным способом: «Элин находится напротив больницы, идет дождь, камера приближается к ее лицу, затем отдаляется, показывая вид сверху».
Если отбросить в сторону качество движения камеры, достигнутое с помощью подсказок, то в чисто текстовом видео без эталонного объекта существует множество неконтролируемых аспектов. Например, стиль визуального ряда может быть слишком сюрреалистичным, а представление объекта может быть неуместным в контексте. Мы создавали видео несколько раз, и использование одних только подсказок почти никогда не позволяло нам контролировать скорость и эффект движения камеры в направлении панорамного вида.

▲В версии с подсказкой люди исчезают в панорамном виде и не могут оставаться в центре кадра.
Используя библиотеку тем Vidu, мы также можем напрямую выбирать существующие изображения персонажей из тематического сообщества для создания видеороликов. Одновременно мы выбираем « Масштабирование камеры » из библиотеки @Camera и добавляем простое описание сцены. В результате первого создания был получен видеоролик с естественным переходом от увеличения к уменьшению и затем к виду сверху.

▲Комбинированная формула: @Элин находится напротив больницы , идет дождь, @камера приближается к ее лицу, затем @камера отдаляется, показывая вид сверху.
Это сравнение очень показательно. «Понимание» традиционного подхода к генерации видео с помощью ИИ непостоянно; генерация одного и того же ключевого слова каждый раз подобна открытию коробки с сюрпризом. С другой стороны, тематическая библиотека стандартизирует и инкапсулирует эти специализированные понятия, поэтому модели больше не нужно гадать, какого эффекта мы хотим добиться.
Это не просто визуально привлекательно; это делает сюжет более захватывающим.
Кроме того, атмосфера, стиль и сцены из основной библиотеки контента определяют общее впечатление от видео.
В частности, сцена определяет пространственную среду видео, стиль определяет общий художественный стиль, а атмосфера привносит новый сюжет в эмоциональную окраску изображения. Основное сообщество Vidu также предлагает сцены, включающие космические капсулы, больницы, леса, кофейни и роскошные банкетные залы, стили, такие как научная фантастика, саспенс, киберпанк и античный стиль, а также атмосферы, такие как напряженная и гнетущая, жизнерадостная, грустная, романтическая и нежная, а также технологичная.
Мы превратили роскошный банкетный зал в мрачный и пугающий триллер, используя технику дрожащей камеры для создания эффекта наблюдения за окружающей обстановкой с точки зрения персонажей, что усилило ощущение погружения. 
▲Комбинированная формула: Роскошный банкетный зал превращается в пугающую и напряженную атмосферу благодаря использованию дрожащей камеры, что в целом создает атмосферу фильма, вызывающего саспенс.
Она может демонстрировать изменения атмосферы с помощью окружающего освещения, других атмосфер в основном сообществе Vidu и даже сочетать их с выражениями лиц персонажей.
Это также может добавить романтическую и нежную атмосферу для @LeonardoDelGregor и @MarilynMonroe . Финальное видео, созданное Vidu, имеет превосходные эффекты освещения и теней. В панорамном режиме используется относительно темная атмосфера дождливого дня, но когда происходит автоматическое приближение к лицам двух людей, изображение автоматически осветляется.

▲Тестовая формула: @Групповой портрет, где встречаются @Леонардо Ди Каприо и @Мэрилин Монро @Романтическая и нежная атмосфера , фон – @кофейня
Протестировав эти различные категории сущностей, я подтвердил одно: комбинации нескольких сущностей — это не просто «функциональное наложение». Vidu реализовал механизм координации на базовом уровне, позволяющий различным сущностям взаимодействовать друг с другом.
Именно этого чувства синергии больше всего не хватает традиционной генерации видео с помощью ИИ. Независимо от того, насколько подробно мы прописываем подсказки, модели сложно одновременно понять баланс между ракурсами камеры, атмосферой и спецэффектами.
Что еще более интересно, мы можем не только напрямую использовать библиотеку тем для создания видеороликов; Vidu также превратила эти темы в сообщество, где мы можем делиться информацией, взаимодействовать и обмениваться ею.

▲Пользователи могут загружать свои собственные дизайны.
Каждый из нас может создавать и загружать собственные темы, а также использовать темы других пользователей. В процессе создания и использования Vidu разработала модель монетизации активов, благодаря которой каждая тема может быть продана .
В сочетании с недавно обновленным Vidu Agent 1.0 и моделью Vidu Q2 Reference Pro , он предлагает более автоматизированный рабочий процесс, готов к использованию сразу после установки и позволяет создавать видео одним щелчком мыши, идеально сочетая гибкость и удобство. Новые функции поддерживают загрузку фоновой музыки, удаление закадрового текста, редактирование раскадровок и включают в себя обширную библиотеку материалов, поддерживающую множество языков, голосов, моделей и сцен.
С другой стороны, существует более мощная базовая модель, которая может напрямую имитировать Q2 Reference Pro с различными видеоэффектами.
Компания Vidu, похоже, начинает лучше понимать перспективы развития технологий генерации видео с помощью искусственного интеллекта.
От "гача-игр" до "строительства из Лего"
После этого этапа тестирования у меня сложилось более ясное понимание основного сообщества Vidu. Помимо того, что это более совершенный инструмент, который может помочь нам лучше создавать видео с помощью ИИ, он призван изменить весь рабочий процесс генерации.
Традиционная генерация видео с помощью ИИ — это «система гача». Мы пишем множество подсказок, надеемся, что модель их поймет, а затем играем на удачу. Если нам повезет, мы получим SSR; если нет — ничего, кроме мусора. Проблема этой системы в том, что процесс создания неконтролируем, и профессиональный барьер все еще существует в другой форме (имеется в виду разработка подсказок).
Основное сообщество Vidu следует "модели LEGO", разбивая профессиональные элементы на стандартизированные модули. Нам нужно просто выбрать, скомбинировать и создать. Главное преимущество этой модели — управляемость; выбирая основной элемент, мы, как правило, знаем, какого эффекта добьемся, а не просто полагаемся на удачу.
Кто больше всего выигрывает от этого сдвига? Создатели собственного контента, авторы короткометражных драм и комиксов, маркетинговые команды в сфере электронной коммерции, а также владельцы малых и средних предприятий. Им необходимо производить высококачественный видеоконтент в больших количествах, но у них нет профессиональных команд и больших бюджетов. Для них Mainstream Library — это эквивалент найма «виртуальной съемочной группы» за небольшую сумму денег.

▲Сложный процесс создания видеоконтента
Независимые создатели контента, дизайнеры и специалисты по рекламе также получат от этого пользу. Тематическая библиотека поможет им восполнить пробелы в знаниях, позволяя создавать крутые кадры и спецэффекты, не изучая After Effects с нуля.
В более широком контексте отрасли, основное сообщество Vidu знаменует собой важный шаг в «индустриализации» генерации видео с помощью ИИ.
В течение последнего года основной борьбой в сфере генерации видео с помощью ИИ была борьба за то, чья модель сильнее — Korlin, Runway, Sora и Veo соревновались по качеству изображения, продолжительности и стабильности. Но по мере развития технологий конкурентная борьба сместится к вопросу «как генерировать», а именно к рабочему процессу, управляемости и возможности повторного использования.
Эта трансформация, по сути, основана на той же логике, что и навыки Клода. Ценность навыков заключается не в том, чтобы сделать Клода умнее, а в том, чтобы сделать его возможности предсказуемыми, вызываемыми и комбинируемыми. Пользователям больше не нужно гадать: «Поймет ли он мой смысл на этот раз?», а можно точно знать: «Я вызвал этот навык, и он будет работать именно так».

▲Клод предлагает набор навыков, каждый из которых способен напрямую решить конкретную проблему.
Основная библиотека Vidu делает то же самое. Она превращает генерацию видео из «гача-игры» в «точные команды». Эта определенность — ключ к реальному снижению порога входа.
Для создателей, обладающих настоящими идеями, чувством эстетики и талантом рассказчика, это, по сути, хорошо. Наконец-то их больше не сдерживают технические барьеры, и они могут сосредоточить свою энергию на действительно важных вещах.
Иными словами, совершенно новое основное сообщество Vidu может помочь нам добиться идеального надвигающегося кадра, но оно не может помочь нам решить, где этот надвигающийся кадр должен появиться в сюжете, какому эмоциональному ритму должен соответствовать темп надвигающегося кадра или как этот кадр, а также кадры до и после него должны создавать нарративное напряжение.

▲Основное сообщество включает в себя некоторые из основных организаций.
Эти решения по-прежнему требуют от нас, людей-творцов, рассудительности и эстетического чувства.
Конечно, есть еще куда стремиться, например, ограничение в 8 секунд и охват основной библиотеки, но это области, которые можно дорабатывать и оптимизировать. Что еще важнее, основное сообщество Vidu взяло на себя инициативу, доказав, что путь «стандартизации + компонуемости» жизнеспособен.
#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.
ifanr | Оригинальная ссылка · Посмотреть комментарии · Sina Weibo