Первый взгляд: Долгожданная HappyHorse 1.0 теперь доступна бесплатно на Qianwen.

HappyHorse 1.0, модель генерации видео, которая когда-то возглавляла рейтинг Artificial Analysis AI Video Arena , наконец-то доступна в официальной версии. Вы можете использовать её напрямую, открыв приложение Qianwen и веб-клиент Qianwen Creator (c.qianwen.com), и даже доступны бесплатные пробные периоды.

Некоторое время назад модель генерации видео под названием HappyHorse 1.0 незаметно возглавила рейтинг видеопроектов на авторитетной платформе оценки ИИ Artificial Analysis, вызвав широкое обсуждение в социальных сетях. Загадка была разгадана, когда Alibaba официально заявила о своих правах на HappyHorse; эта милая лошадка появилась в недавно созданной бизнес-группе ATH компании Alibaba, которой было меньше месяца.
Сегодня Alibaba объявила о каналах тестирования HappyHorse 1.0. Официальная платформа Qianwen первой проведет тестирование в режиме оттенков серого, и его можно будет использовать напрямую как в приложении Qianwen, так и в веб-клиенте Qianwen Creator.

В мобильном приложении (Qianwen APP) просто обновите Qianwen до последней версии и нажмите на значок "HappyHorse" на главной странице, чтобы получить прямой доступ к панели создания видео в реальном времени HappyHorse 1.0. Qianwen также предлагает бесплатный пробный период.

Веб-версия для ПК (Qianwen Creation Web Client) предназначена для пользователей с более профессиональными творческими потребностями. Пользователи могут войти в систему и использовать её, открыв c.qianwen.com в своём браузере. Каждая генерация в веб-клиенте расходует баллы, но в целом, это предлагает относительно хорошее соотношение цены и качества.
Как текстовые, так и графические видеоролики поддерживают максимальное разрешение 1080p. Пользователи могут свободно выбирать соотношение сторон видео: 16:9, 9:16 или 1:1, с длительностью генерации 5, 10 или 15 секунд, а также поддерживается генерация собственного звука.
APPSO протестировали приложение сразу после его выхода. Рейтинги в обзорах говорят сами за себя, но в чем именно заключаются преимущества видеороликов, созданных HappyHorse 1.0? Давайте рассмотрим результаты нашего практического тестирования.
В ходе реального тестирования стало очевидно, что HappyHorse 1.0 не фокусируется на сложных универсальных функциях, а делает упор на естественность движений, звука и пространства. В сочетании с разумным языком камеры и точным воспроизведением стиля, общая производительность действительно впечатляет.
С помощью одной команды вы можете управлять как движением камеры, так и созданием раскадровки.
В большинстве распространенных моделей видеосъемки движение камеры рассматривается как библиотека, доступная пользователям. Так называемое движение камеры больше похоже на случайный выбор метода движения камеры из этих библиотек, например, увеличение, уменьшение или вращение, без фактического сопоставления с тем, что происходит на экране.
Поскольку камера играет наиболее важную роль в видео, разница в её присутствии часто заметна сразу, но её сложно количественно оценить с помощью конкретных значений.
В HappyHorse 1.0 также заслуживает похвалы подход к ситуации; время переходов между кадрами должно служить произведению. Там, где необходимо усилить эмоциональный накал, камера приближается; там, где нужно объяснить обстановку, нам показывают панорамный вид; за этим скрывается сценография с повествовательной логикой.
При использовании одного и того же ключевого слова для создания видеоролика, все модели, использующие одно и то же слово, могут стремиться к «фиксированному положению камеры», когда объект стоит в центре и камера не движется. Это объясняется тем, что такой подход наименее вероятно приведет к ошибкам, но он значительно ухудшает общее впечатление от просмотра.
В созданном видеоролике HappyHorse 1.0 выступает в роли опытного оператора, используя различные мастерские движения камеры: от панорамных снимков до крупных планов пыли, поднимаемой копытами лошади, а затем плавно переключаясь на съемку снизу в момент извлечения ружья.
Этот ролик отходит от традиционной модели генерации видео с помощью ИИ, основанной на принципе «выбор посредственности ради стабильности» и использующей множество качественных операторских приемов для передачи динамического напряжения сцены погони в ее первоначальном виде.
Эмоции и движения стали более тонкими; даже микровыражения лица можно использовать для актерской игры.
Для многих видеомоделей наиболее сложной задачей является моделирование движений персонажей. Даже при детальной генерации эталонных данных во второй половине модели легко могут возникать искажения, такие как лишний палец, размытое лицо или резкие изменения ритма движений.
Однако HappyHorse 1.0 показал очень стабильные результаты по этому ключевому показателю. В 5-секундном видеоролике движения персонажа оставались в основном непрерывными от начала до конца, с существенно меньшим количеством ошибок в непрерывности.
В качестве конкретного примера мы использовали сцену, где девушка в белом платье идёт по цветочному полю, двигаясь слева направо по экрану. Камера следовала за ней, когда она повернула платье и взяла цветок, чтобы понюхать его.
HappyHorse 1.0 обеспечивает очень естественные переходы между движениями. У девочки, идущей среди цветов, нет никаких неловких движений, напоминающих лунную походку. От вращения юбки до поднесения цветов близко к носу — все движения плавные и естественные.
Движения многослойны, а выражения лиц персонажей столь же реалистичны. Мы создали видео, где ребенок откусывает кислый лимон, демонстрируя первоначальное ощущение от укуса, сильную кислотность, вызывающую напряжение лицевых мышц, морщины и плотное закрытие глаз, постепенное ослабление кислотности, медленное расслабление лицевых мышц и, наконец, широкое раскрытие глаз ребенка в недоумении.
Использование действий и выражений лица позволяет сделать эмоции персонажей более тонкими, и видеоролики, созданные с помощью HappyHorse 1.0, с меньшей вероятностью отвлекут зрителей от сюжета.
Официальные данные показывают, что внутренний рейтинг предпочтений пользователей HappyHorse 1.0 (GSB — Good-Significant-Bad) в 3 раза выше, чем у Wan2.7, при этом значительно улучшены плавность и четкость движения.
Диалоги звучат более реалистично, и в повествование начинают вплетаться окружающие звуки.
Помимо визуального оформления, HappyHorse также превосходит другие модели в области озвучивания видео с помощью ИИ.
Большинство видеороликов, озвученных с помощью ИИ, страдают от одной и той же проблемы: создается впечатление, что голос «читается», а не «произносится».
Голос монотонный, интонация не соответствует эмоциям. Когда разговаривают два человека, один говорит, а другой просто стоит, не реагируя и не меняя выражения лица, как будто они выполняют свои собственные задачи.
В HappyHorse 1.0 диалоги действительно ощущаются как контекст. Тон и интонация соответствуют эмоциям в сцене; интонация уместна, когда человек удивлен, а ритм спокоен, когда он спокоен. В сценах, где говорят несколько человек, слушатель также ведет себя естественно, используя мимику и едва заметные мышечные реакции, а не просто отвлекается и ждет следующего предложения.
Та же логика применима и к окружающим звукам. Звуки письма, перелистывания страниц и отдаленный фоновый шум отсутствуют в большинстве видеомоделей, или же они звучат так, будто были случайно взяты из библиотеки звуковых эффектов.
В HappyHorse 1.0 звуки идеально соответствуют событиям, разворачивающимся на экране, и перекликаются с эмоциями. В тихих сценах шорох бумаги может создавать более сильное погружение, чем большинство фоновой музыки.
Ещё одна, менее распространённая, но полезная функция — многоязычная синхронизация губ, охватывающая китайский (мандаринский диалект), кантонский диалект, английский, японский, корейский, немецкий, французский и другие языки.
Ввод китайского текста генерирует видео с говорящим персонажем, движения губ которого идеально соответствуют речи. Потенциал этой возможности огромен: от озвучивания коротких видеороликов до виртуальных ведущих, и все это будет использоваться в будущем.
Нет необходимости в сложных стилистических приемах, вы легко освоите классические стили кино и телевидения.
Если вопросы, касающиеся ракурсов камеры, движения и звука, затрагивают аппаратные проблемы видео, созданного с помощью ИИ, — обеспечение того, чтобы оно не нарушало погружение зрителя, — то стилистическая точность заключается в том, чтобы сделать финальный визуальный ряд более привлекательным. Она начинается с использования цвета, освещения и текстуры для создания эстетической атмосферы, принадлежащей создателю.
Добавление стилей также очень важно. Речь идёт не просто о применении фильтра или готовой LUT-таблицы. Это также требует от видеомодели понимания различных эстетических стилей, чтобы применять соответствующую стилизацию.
HappyHorse 1.0 демонстрирует исключительное внимание к деталям при воспроизведении специфических стилей. Стили различных классических фильмов и телесериалов, зернистость старых гонконгских фильмов и яркие блики — все это отчетливо видно в результатах нашей работы.
Будь то грубая и реалистичная историческая составляющая старого стиля «Водяной заставы»/«Троецарствия», классический гонконгский стиль с его размытым светом и тенью, высококонтрастный и холодный свет и тень американских драм или атмосфера корейских драм с их нежным и мягким светом, — все это способно точно передать.
Если вы — создатель контента, стремящийся к высокому визуальному качеству, я настоятельно рекомендую лично оценить этот «режиссёрский» уровень эстетического контроля в Qianwen.
Индустрии видео с использованием искусственного интеллекта нужен «тёмный конь».
Попрощайтесь с очередями на полдня для создания видеороликов. Модель, занявшая первое место в списке Video Arena, теперь не только легко доступна в мобильном приложении, но и предлагается с бесплатным пробным периодом. Шаг компании Qianwen действительно впечатляет.
Оглядываясь на эти особенности HappyHorse 1.0, можно сказать, что действия происходят плавно, а кадры передают ощущение диалога , решая проблему предсказуемости качества контента, создаваемого ИИ. Это позволяет нам познакомиться с генерацией видео с помощью ИИ, не подходя к этому с точки зрения «вытягивания из гача-игроков».
Естественная диалоговая составляющая, реалистичные окружающие звуки и точное воспроизведение стиля значительно снижают затраты на постобработку как для нас, так и для создателей контента, устраняя необходимость переключаться между несколькими инструментами.
Если мы рассмотрим эту способность генерировать данные с чрезвычайно низким порогом входа и высокой устойчивостью к ошибкам в конкретном бизнес-контексте, то ее ценность станет очевидной.
Для новых медиа-компаний, режиссеров короткометражных драм или маркетинговых команд электронной коммерции раскадровка, разработка концепции или создание короткометражных фильмов, которые ранее требовали больших команд постпродакшена и значительных съемочных бюджетов, теперь могут быть быстро реализованы простым вводом инструкций на мобильном телефоне или компьютере. В компании Qianwen один человек — это высокоэффективная команда по аудиовизуальному производству.
▲Теперь мы можем получить настоящее виртуальное видео с ведущей на канале Цяньвэньли.
Уже довольно давно в сфере генерации видеоконтента действует принцип «чья модель сильнее» — более высокое разрешение, большая продолжительность и более сложная физическая симуляция.
Это техническое соревнование параметров и алгоритмов, но реальное узкое место, с которым мы сталкиваемся, редко возникает из-за того, что «модель не может это сделать». В большинстве случаев это происходит потому, что «мы можем это сделать, но не можем себе позволить это использовать или не можем это использовать». Время ожидания слишком велико, аудио и видео необходимо обрабатывать отдельно, а стабильность анимации полностью зависит от удачи. Трение на каждом этапе не позволяет профессиональным пользователям и супер-создателям искусственного интеллекта создавать видеоконтент.
На этот раз Qianwen не только избавил нас от необходимости переключаться между различными инструментами и разместил лучшие возможности генерации видео непосредственно в самом привычном диалоговом окне, но и полностью устранил все творческие сложности, используя возможности базовой модели.

▲ Qianwen теперь — универсальный ИИ-помощник для работы, учебы, повседневной жизни и творчества.
HappyHorse, несомненно, является сильным «темной лошадкой». Это ключевой элемент в полной цепочке недавно созданной бизнес-группы ATH компании Alibaba, которая включает в себя возможности моделирования, распространение платформ и специализированные приложения. После первоначального тестирования в тестовом режиме на платформе Qianwen цепочка заработала.
От текстовых диалогов, помогающих пользователям решать повседневные проблемы и повышать эффективность работы и учебы, до нынешней интеграции высококачественных изображений и видео, созданных с помощью ИИ, эволюционный путь Qianwen предельно ясен: компания разрушает барьеры между «повышением эффективности жизни» и «профессиональным творчеством».
Благодаря многократным усовершенствованиям функционала, Qianwen демократизирует доступ к высокопроизводительным вычислительным мощностям, превращаясь из простого инструмента для вопросов и ответов в «универсального ИИ-помощника», охватывающего все сценарии использования.
Обычным людям, возможно, не стоит беспокоиться о сложной архитектуре алгоритмов, лежащих в основе этой системы, поскольку лучшие технологии уже установлены в ваш телефон самым простым и удобным способом благодаря Qianwen.
Теперь настала очередь всех выйти на сцену.
Если вы хотите оценить мощные возможности HappyHorse 1.0 по созданию видео, компания Qianwen также запустила конкурс "Раскрой своё воображение". Вас ждут четыре видеотрека, созданных с помощью ИИ, с денежным призовым фондом в 200 000 юаней.
Зайдите прямо в приложение Qianwen или на веб-платформу Qianwen Creator и дайте волю своему вдохновению, «пусть ваша фантазия разгуляется» на этом новом, безбарьерном холсте.
* Нажмите на эту ссылку, чтобы посмотреть предварительный просмотр видео в статье.*
#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.











