Видеоролики с ИИ, которые создаются за секунды, уже здесь! Я использовал его для создания самого волшебного Лабубу, и даже новички, не умеющие писать подсказки, смогут использовать его за считанные секунды.

В этом году вы можете видеть, как различные видео с участием искусственного интеллекта заполоняют экраны почти каждый день, например, Ультрамен против Помаска, Снежный король против Восточной жемчужины, ASMR-резка металла и стекла… Это заставляет людей зудеть.

Но когда вы попробуете это на практике, вы поймете, что это просто слепое копание, а цена просто заоблачная. Часы в очередях — обычное дело, баллы сгорают быстрее бумаги, а в видео либо искажаются персонажи, появляются странные рисунки, либо ваши подсказки просто игнорируются.
Перед лицом «ИИ-видеоубийцы» действительно есть «Король свитков», который готов выступить против него .
PixVerse, ставшая популярной в прошлом году благодаря «спецэффектам Венома», сегодня тихо и незаметно сделала большой шаг вперед — PixVerse V5 .
На этот раз они заявили, что проделали сложную работу по «квазиреальной генерации», всесторонне оптимизировав динамику, ясность, последовательность и возможности понимания команд.

▲ Домашняя страница PixVerse China
PixVerse V5 — это не просто небольшое обновление, они принесли три серьезных новшества:
1. Быстрое поколение
Это всегда было главной изюминкой pixVerse . Благодаря передовым технологиям им удалось сжать видео до «второго уровня». Короткометражный фильм в формате 360p можно снять за 5 секунд, а HD-видео в формате 1080p — за 1 минуту .
2. Менее похожи на ИИ
V5 использует расширенные эстетические данные и подгонку по предпочтениям человека (RLHF), чтобы улучшить понимание моделью как эстетики, так и реализма. Это значительно улучшает как сложную динамику персонажей, так и реалистичность игры света и тени, в результате чего изображения становятся ближе к реальным фотографиям.
3. Наведи и снимай <br /> Они используют технологию «единого пространства признаков» для решения вечной проблемы «ИИ, не понимающего человеческий язык». Проще говоря, независимо от того, даёте ли вы ему предложение, изображение или видео, он может точнее понять ваше намерение , открывая возможности для сложного мультимодального творчества с изображениями, текстом и видео, предоставляя вам по-настоящему точный контроль.
Хотя я не хвастаюсь, но у меня уже есть лицензия на бета-тестирование, так что попробую.
Невероятно быстро, потрясающая цена
Первое впечатление, которое у меня произвел V5, — это скорость.
В реальных тестах 8-секундное видео 360p со звуком занимает менее 30 секунд с момента постановки в очередь до завершения, включая время постановки в очередь и время генерации; в то время как видео сверхвысокой четкости 1080p занимает немного больше времени, но в целом составляет около 2 минут.

▲ Сравнивая с видео, созданным Келингом, время ожидания составляет 3 часа.
Помимо невероятной скорости, V5 ещё и невероятно доступен . Заходите в игру каждый день, чтобы заработать 60 баллов (создание 5-секундного беззвучного видео в формате 360p стоит всего 20 баллов). Кроме того, существует множество вариантов членства, что значительно снижает стоимость «вытягивания карт».
Для сравнения, Keling предлагает 166 баллов в месяц, а создание стандартного 5-секундного видео также стоит 20 баллов. В настоящее время добавление звуковых эффектов в Keling бесплатно, а PixVerse требует дополнительных 10 баллов.
PixVerse V5 предлагает довольно элегантное решение двух основных проблем: времени и денег . Но как насчёт важнейшего качества?
Тест на прочность: от «открывания слепого ящика» до «экзамена полуоткрытой книги»
Давайте перейдем сразу к делу и проверим его истинное качество на нескольких популярных кейсах.
Начнем с простого: создадим снимок башни Гуанчжоу с воздуха.

Cue: Кинематографическая воздушная съёмка с дрона, фокусирующаяся на башне Гуанчжоу. Снято на 35-мм плёнку Kodak с зернистостью. Динамичная воздушная съёмка с круговым движением камеры. Сохраните композицию, кадрирование и структурные детали исходного изображения.
PixVerse действительно хорошо справляется со своей задачей и работает быстро. Кроме того, в отличие от Veo 3, который сейчас генерирует только видео с соотношением сторон 16:9, PixVerse может автоматически адаптировать сгенерированное видео к соотношению сторон загруженного изображения.
Далее мы повысим сложность, чтобы проверить последовательность персонажа и способность понимать сцену.
В последнее время нано-банан стал очень популярен. Несколько дней назад мы использовали его для создания множества интересных фотографий. Многие пользователи социальных сетей также использовали его для создания полноценных историй благодаря его впечатляющей согласованности в персонажах, окружении, стиле фотографий и содержании.
Мы нашли несколько интересных фотонаборов, чтобы проверить, сможет ли PixVerse V5 сгенерировать видео.
Сначала там были две девушки, играющие в бильярд. Сначала они стояли спереди и делали селфи, а потом я попросил их отойти назад, взять кии и начать играть.

Результат немного удивил. Сцена была выдержана в хорошем качестве, походка и мимика тоже были на высоте. Но… они каким-то непостижимым образом втиснули ещё одну девушку с улицы!
Похоже, ИИ всё ещё испытывает трудности с пониманием сложных взаимодействий двух людей и пространственных отношений. Однако, по сравнению с версией 4.5 (которая ранее создавала невнятные кадры замедленной съёмки), версия 5, по крайней мере, лучше понимает намерение «ходить».
В последнее время также стало популярным использовать нано-бананы для создания картинок-фигурок. Сделав фотографии, можно создать множество интересных видеороликов.

Совет: Создайте модель персонажа по этой фотографии. Поместите коробку с напечатанным изображением персонажа и экран компьютера, на котором будет отображаться процесс моделирования в Blender. Добавьте перед коробкой круглое пластиковое основание, на котором будет стоять модель персонажа. Сделайте ПВХ прозрачным и, если возможно, установите сцену в помещении.
Сначала мы использовали нанобанан, чтобы сделать лабубу, который выглядел так, будто мы сами его распечатали на 3D-принтере, а затем отправили это изображение в PixVerse.

▲ Подсказка: Коричневая фигурка начинает исследовать пространство на рабочем столе. Она идёт влево, смотрит вправо и наконец прыгает обратно в коробку рядом с собой. Не перемещайте лабубу на коробке, оставьте её неподвижной. 3D-анимация фигурки, отображаемая на компьютере, находится в режиме предварительного просмотра и вращается автоматически.
Мы также использовали PixVerse для тестирования недавно ставшего популярным и убедительного видео с ночным видением, созданного с помощью искусственного интеллекта. Честно говоря, эффект невероятно убедителен. Котёнок, сидящий на спине медведя, осторожно подпрыгивает взад-вперёд, его контакт с медведем и прыжки выглядят реалистично.

Если выполнение таких простых движений недостаточно сложно, мы сразу дадим ему крупный план его шагов на скейтборде и позволим ему выполнить эти сложные движения.

PixVerse V5 также точно воспроизводит движения ног без каких-либо ошибок. Мы попробовали с версией 4.5, и иногда обувь надевалась задом наперёд, и были забавные моменты, когда скейтборд выглядел очень круто, а персонажи не знали, как поставить ноги.
Можно с уверенностью сказать, что PixVerse действительно значительно улучшил качество продукции. В целом, версия V5 значительно улучшила согласованность и реалистичность, сделав её больше похожей на реальные кадры, а не на изображения, вдохновлённые искусственным интеллектом.
One More Thing и Помощник по созданию агентов
Помимо преобразования изображений в видео, PixVerse V5 также предлагает ряд необычных, но практичных функций, таких как продолжение, многоагентность и агентский интеллект.
Мой любимый — « Продолжение ». Сейчас большинство видео с ИИ могут генерировать только несколько секунд за раз. Если нужно сделать длинное видео, придётся вручную захватывать последний кадр и восстанавливать его, что очень утомительно.
Функция перезаписи позволяет довольно плавно удлинять видео и поддерживает видео длиной до 30 секунд. Я использовал её для создания короткого видео «Кот мечтает стать шеф-поваром», и эффект получился очень милым.

Посмотрите на довольную улыбку котенка в конце!
Чтобы решить серьёзную проблему отсутствия возможности писать подсказки, V5 также запустила Agent . Это своего рода библиотека креативных шаблонов. Просто найдите понравившийся шаблон, введите ключевые слова, и он автоматически выполнит весь процесс: от понимания намерений до генерации сценария и создания видео.

В настоящее время PixVerse предлагает более десяти проектов в области искусственного интеллекта. Среди них — недавно ставший популярным батут-кролик, возможность менять материал персонажа или предмета, комбинирование нескольких объектов для создания нового вида и даже ИИ, который позволит вашему питомцу нарядиться в костюм таракана и заняться балетом.
Я загрузил в него фотографию Лабубу, которую мы использовали ранее. Процесс работы интеллектуального агента всё ещё отличается от шаблона. Шаблон просто применяет набор подсказок, в то время как интеллектуальный агент PixVerse автоматизирует все операции, подобно тому, как мы используем агент ChatGPT, избавляя нас от необходимости сначала генерировать изображения в nano banana.

Хотя иногда он допускает ошибки, например, принимает мою фигурку Лабубу за фигурку в костюме коричневого таракана (извини, Лабубу!).
Но этот хорошо сделанный балет действительно демонстрирует потенциал функциональности Агента — он значительно снижает порог реализации творческих способностей обычными людьми.

В настоящее время PixVerse V5 и помощник по созданию агентов полностью запущены в веб-версии, приложении и API открытой платформы международной версии PixVerse (https://app.pixverse.ai/) и локальной версии Pai Wo AI (https://pai.video/).
Видео с ИИ наконец-то превратилось из «большой азартной игры» в «моментальную лотерею»
После всестороннего опыта данное обновление PixVerse V5 можно четко описать двумя словами: быстрее и лучше .
Возможно, это пока не самая совершенная видеомодель, и она всё ещё сбивается с толку при обработке сложных многопользовательских взаимодействий. Но она напоминает мне необработанные изображения Doubao. Качество, возможно, не такое хорошее, как у Midjourney, но она бесплатна, содержит много контента и сама по себе богата им. Можете попробовать.

▲ Doubao может генерировать 20 изображений одновременно
PixVerse V5 следует по этому пути, полностью меняя творческое мышление благодаря скорости генерации, близкой к реальному времени, и чрезвычайно низким затратам на пробы и ошибки.
Раньше часами стоять в очереди, тратить бесчисленное количество баллов и в итоге получить неудовлетворительный результат было мучительным и утомительным. Теперь же результаты видны за секунды, и если вы не удовлетворены, можно просто попробовать ещё раз. Этот опыт больше похож на лотерейный билет с мгновенным розыгрышем — простой, частый и полный постоянного предвкушения следующего выигрышного билета.
С этой точки зрения, основное конкурентное преимущество PixVerse V5 заключается не в том, насколько потрясающие видеоролики он генерирует, а скорее в том, что он обеспечивает необременительный, высокочастотный опыт создания контента .
Когда стоимость открытия слепого ящика станет достаточно низкой, и когда нестабильность ИИ больше не будет заставлять вас жалеть свое время и деньги, создание видео с помощью ИИ действительно перейдет из алтаря нескольких громких имен в повседневную жизнь каждого из нас.
Текст|Ли Чаофань и Чжан Цзыхао
Оригинальная ссылка: https://mp.weixin.qq.com/s/Q0_1JM-2tJa9VyMP0LYUBQ
#Приглашаем вас следить за официальным публичным аккаунтом WeChat проекта iFaner: iFaner (WeChat ID: ifanr), где в ближайшее время вам будет представлен еще более интересный контент.
iFanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo