Впервые за столетие Олимпийские игры стали «открытым проектом»! Alibaba Cloud AI предоставила 8 миллиардам человек «джокеры» для участия.

Ваши ленты в социальных сетях и сами социальные сети, вероятно, не раз за последний год были завалены изображениями, созданными искусственным интеллектом в стиле Ghibli: изображения в стиле Ghibli, созданные ИИ, заполонили социальные сети, а загадочные бананы вызвали настоящий ажиотаж в интернете, что привело к огромному и устойчивому потоку информации.
В отличие от стремительного роста популярности моделей, основанных на изображениях, видеомодели, хотя иногда и создают потрясающие хиты и затрудняют различение настоящего и поддельного Уилла Смита, поедающего лапшу, остаются в основном игрушками для гиков.
Оливия Мур, партнер компании a16z, поделилась тревожными данными, которые показали, что показатель удержания пользователей Sora 2 за 30 дней составил всего 1%, а за 60 дней он упал до нуля.

Причина в том, что большинство продуктов для создания видео ориентированы на повышение мощности инструментов, а затем ждут, пока пользователи изучат их возможности. Создать классное видео легко, но что происходит после того, как оно создано? Кому его отправить? Зачем его отправлять? Когда у обычных людей возникает желание «создать видео»?
После наблюдения за многочисленными конкурсами, посвященными созданию видео с помощью ИИ, компания APPSO задалась вопросом, существуют ли, помимо использования ИИ для создания фильмов или рекламных роликов, более практичные способы побудить нас создавать видео с помощью ИИ, аналогично тому, как мы публикуем их в WeChat Moments или TikTok.
Верите или нет, я недавно наткнулся на довольно уникальный конкурс контента, созданного с помощью ИИ. Международный олимпийский комитет в сотрудничестве с Alibaba Cloud организовал «Глобальный конкурс AIGC по зимним Олимпийским играм в Милане». Для участия нужно просто ввести предложение в модель больших данных Wanxiang и сгенерировать видеоролик о зимних Олимпийских играх продолжительностью от 5 до 15 секунд. Никакого профессионального оборудования, технических знаний или даже навыков катания на лыжах не требуется; всё, что нужно, — это креативная идея.



▲Скриншот с официального сайта Международных Олимпийских игр
Честно говоря, раньше я думал, что спорт и искусственный интеллект совершенно не связаны; мне хотелось видеть настоящий пот и мышцы. Но после того, как я попробовал, у меня возникло другое ощущение.
Интерес к этому заключается не в том, что это просто очередное соревнование в области ИИ, а в том, что оно предоставляет отличный пример для наблюдения: что произойдет, когда самый продвинутый генеративный ИИ столкнется со столетней Олимпийской игрой, которая наиболее скрупулезно относится к физическим правилам и наиболее требовательна к визуальной презентации?
Это уже не просто самовосхваление в сообществе разработчиков ИИ; далее последует «публичное тестирование» для миллиардов людей по всему миру.
Зимние Олимпийские игры: «адское испытание на прочность» для видео, созданного с помощью ИИ.
Вы можете спросить: при таком обилии спортивных событий, почему для этого конкурса искусственного интеллекта выбрали именно зимние Олимпийские игры?
Если углубиться в логику работы технологий генерации видео, вы обнаружите, что это крайне "сложный" выбор. Это объясняется тем, что по сравнению с другими событиями зимние Олимпийские игры, естественно, являются главными противниками искусственного интеллекта.
Современные модели генерации видео наиболее уязвимы к двум факторам: стабильности высокоскоростного движения и сложным законам физики жидкостей и частиц.
На зимних Олимпийских играх 2022 года в Пекине 18-летняя Гу Айлин завоевала золотую медаль в соревнованиях по фристайлу в дисциплине «биг-эйр» среди женщин. Ее слова: «Я не хочу никого победить, я просто хочу быть лучшей версией себя», — вместе с моментом завоевания золотой медали, стали классическим воспоминанием в истории Олимпийских игр.

Такие виды спорта, как шорт-трек, бобслей и фристайл, предполагают чрезвычайно высокие скорости и большие движения. Традиционные модели искусственного интеллекта подвержены физическим ошибкам, таким как искажение конечностей, наложение текстур или телепортация при обработке этих сценариев.
В рамках глобального конкурса AIGC на зимних Олимпийских играх в Милане продолжительность видеороликов была ограничена 15 секундами, что фактически является самым требовательным «стресс-тестом» для технологии создания больших моделей Wanxiang. Более длинные видеоролики могут использовать повествовательную структуру для маскировки недостатков генерации, но в 15-секундном окне практически нет буферного пространства. Каждый кадр рассматривается под микроскопом, и допустимая погрешность крайне низка.
Это означает, что ИИ должен генерировать видеоролики, полностью соответствующие законам физики, обеспечивая не только непрерывность высокоскоростного движения без рывков, разрывов или двоения изображения, но и соответствие размытия движения реальным оптическим эффектам — эти требования создают гораздо большую нагрузку на производительность модели, чем генерация статичного видеоролика с пейзажем.

В ходе тестирования я сгенерировал изображение "Даван Чикен катается на лыжах" с помощью Wan2.6, а затем преобразовал его в видео с помощью Wan2.6. Траектория летящих снежинок, покачивающаяся поза тела, ощущение динамизма и детализации превзошли все мои ожидания. Практически невозможно было понять, что это создано искусственным интеллектом.
«Курица Даван» может свободно бродить по лыжным склонам и сохранять непрерывность и последовательность своих движений, используя множество различных стилей и тем. Я пробовал стиль Ван Гога, стиль комиксов, стиль научной фантастики и стиль масляной живописи, и все они были потрясающими!

Судя по динамическим эффектам, общие характеристики этого котенка довольно хороши, как с точки зрения текстуры его шерсти, так и динамики скольжения.

Расширяя границы стиля, этот сноубордист пробует себя в более динамичных сценариях катания. Очевидно, что эта яркая фигурка на видео сохраняет превосходное равновесие во время скольжения, демонстрируя легкость и мастерство опытного лыжника, без эффекта парения, часто встречающегося в сноубординге, созданном искусственным интеллектом.

Наиболее важный технологический прорыв заключается в способности генерировать мультимодальные референты.
Wanxiang 2.6 способен выполнять зеркальную реконструкцию персонажей, точно воспроизводя особенности изображения, загруженного пользователями. Он может напрямую использовать изображение и голос из входного видео для вторичного создания, будь то человек или антропоморфный персонаж, он может быть главным героем, и нет проблем с групповыми кадрами или кадрами, где люди и объекты находятся в одном кадре.

Более того, в нём есть собственная библиотека персонажей, созданных с помощью ИИ, включающая знакомые фигуры, такие как Царь обезьян, Гуань Юй, кошки и собаки, студенты физического воспитания и модные девушки. Я небрежно набрал "@Царь обезьян прыгает с трамплина с высотной платформы", и программа мгновенно сгенерировала связное и логичное видео с катанием на лыжах, основанное на изображении Царя обезьян.
В то же время, интеллектуальная многокамерная функция Wanxiang 2.6 решает проблему «ограничения одной камеры», присущую основным моделям видеомонтажа. Она позволяет выводить связный видеопоток, содержащий несколько кадров, в рамках одной задачи. В сочетании с встроенной функцией синхронизации аудио и видео, даже непрофессиональные пользователи могут легко создавать полноценные аудиовизуальные произведения.
видео
Затем сложность возрастает до чрезвычайно сложной сцены от первого лица, где лыжник, держа в руках экшн-камеру, стремительно спускается вниз. Камера должна запечатлеть едва уловимые выражения лица, одновременно следя за лыжником позади и справа. Удивительно, но даже в этой сложной динамичной сцене с множеством объектов видеоряд остается четким.
видео
Безусловно, зрелость технологий значительно снизила барьер для входа на рынок, но это не означает, что интенсивность конкуренции ослабла.
Традиционные соревнования по искусственному интеллекту часто требуют навыков программирования, профессионального оборудования и больших временных затрат, в то время как для этого соревнования достаточно одного предложения, браузера и нескольких минут. Когда барьер, связанный с инструментами, устраняется, суть соревнования смещается от «технических способностей» к «творческому самовыражению».
Когда инструменты достаточно мощны, они могут вернуть инициативу в соревновании человеческому воображению — в этом заключается основная логика глобального соревнования AIGC на зимних Олимпийских играх в Милане, и это также перекликается с главной идеей этих зимних Олимпийских игр: «Это ваш стиль».

Превратить свою креативность в олимпийскую историю не так просто, как кажется.
С развитием моделей генерации видео на основе ИИ, технология перестала быть самой большой проблемой. Большая модель Wanxiang способна обрабатывать сцены с высокоскоростным движением, выполнять многомодальную генерацию эталонных изображений и обеспечивать интеллектуальную многокамерную функциональность — этих возможностей уже достаточно.
Однако для полноценной реализации мощных технологий необходима поддерживающая инфраструктура. Это легко упускаемое из виду, но крайне важное различие: производители чистых моделей могут обеспечить только возможности генерации, но от ввода пользователем подсказок до окончательного отображения работы существует ряд промежуточных этапов, таких как хранение, рендеринг и распространение.
Масштабное применение компанией Alibaba Cloud технологий искусственного интеллекта олимпийского уровня для взаимодействия с болельщиками по сути создает совершенно новый механизм производства контента: разрушает барьеры между профессионалами и широкой публикой, давая возможность творческим идеям каждого обычного человека стать частью столетней истории Олимпийских игр.
Как сказала президент Международного олимпийского комитета Кирсти Ковентри: «Продолжайте творить, продолжайте делиться идеями и сделайте их частью олимпийской истории».
видео
Ценность этого сотрудничества заключается в предоставлении воспроизводимой модели сценариев "высокая частота + необходимые".
Как уже упоминалось в начале, обычные люди редко испытывают острую необходимость в создании видеороликов в повседневной жизни. Однако во время Олимпийских игр внимание всего мира резко возрастает, и у болельщиков возникает сильное желание выразить себя, но им не хватает удобных инструментов. Традиционные методы поддержки либо дорогостоящи, либо имеют высокий порог вхождения, в то время как персонализированный контент, созданный с помощью ИИ, является лучшим вариантом.

Более того, данные о поведении пользователей также подтверждают эту тенденцию. Отчет WSC Sports о поколении болельщиков на 2025-2026 годы показывает, что поколение Z и миллениалы больше не полагаются на традиционные телевизионные трансляции, а вместо этого потребляют короткие видеоролики, подборки лучших моментов и интерактивные фанатские материалы в социальных сетях, при этом лояльность определяется скорее «актуальностью», чем «доступностью контента».
Это означает, что логика распространения контента меняется: аудитория перестает быть конечной точкой потребления контента и становится его источником. Записи могут свободно распространяться без ограничений авторского права. Вы можете сделать цыпленка Да Ван главным героем, или же кремовый торт — ипподромом.

▲Как принять участие в конкурсе
Теперь достаточно зайти в раздел «Подключайтесь, соревнуйтесь, празднуйте» на официальном сайте Олимпийских игр (olympics.com) или перейти на страницу мероприятия непосредственно с сайта Alibaba Cloud. Выберите любой классический элемент из фигурного катания, шорт-трека, горнолыжного спорта или сноубординга в качестве шаблона, введите подсказку, проявив свою креативность, и вы сможете создать собственное уникальное олимпийское произведение искусства.
Экосистема продуктов Alibaba в области искусственного интеллекта предоставила ample пространство для этого конкурса. В нем приняли участие как сообщество разработчиков с открытым исходным кодом Modelscope, так и инструменты для создания ИИ, такие как Tongyi Wanxiang и Duiyou.
Ещё больше меня удивило то, что лучшие работы этого конкурса будут отправлены в Олимпийский музей для展示 рядом с историческими олимпийскими артефактами, что добавит новую нотку к вековому олимпийскому духу в эпоху искусственного интеллекта.

Вместо того чтобы обучать пользователей, как только у создателей появляется мотивация и у работ появляется место для размещения, предоставление им необходимых инструментов приближает видеомоделей на один шаг к их «моменту высадки на Луну».
Искусственный интеллект наконец-то сделал исходный код столетней Олимпиады открытым; мы больше не просто зрители.
Оглядываясь назад, можно сказать, что каждая революция в медиатехнологиях меняла то, как мы взаимодействуем с миром.
Если фотография дала нам право записывать происходящее, а телевещание — право присутствовать, то искусственный интеллект обеспечивает «равный доступ к воображению».
По словам сообщества специалистов по искусственному интеллекту, Олимпийские игры впервые за столетие стали проектом с открытым исходным кодом.
Глобальный конкурс AIGC на зимних Олимпийских играх в Милане, по сути, предоставил «дикую карту» миллиардам людей по всему миру, превратив «наблюдение» в «творчество». Для участия больше не требовались исключительные физические способности или превосходные навыки. Требовался лишь ум, не желающий быть посредственным, и стремление к самовыражению.

Это первый случай в истории Олимпийских игр, когда искусственный интеллект действительно вернул «право на участие» обычным людям. Впервые воображение и креативность приобрели культурный статус, равный спортивным достижениям; впервые работы обычных людей могут даже превзойти достижения спортсменов по уровню осведомленности и вовлеченности общественности.
Это посылает очень тонкий, но точный сигнал: ИИ не должен быть просто игрушкой для гиков; он должен принадлежать всем (ИИ для всех).
Когда технологии достигнут достаточного уровня развития, они должны быть подобны водопроводной воде — достаточно просто открыть кран и пользоваться. Нам не нужно поклоняться самим технологиям, а следует использовать их для раскрытия нашего внутреннего творческого потенциала.
На этом поле нет судей, нет нарушений, только безграничная свобода воображения. Вы можете превратить Великую Китайскую стену в горнолыжный склон, нарядить терракотовых воинов в коньки и скользить по полю, как Эйлин Гу.
Таким образом, ценность глобального конкурса AIGC, посвященного зимней Олимпиаде в Милане, заключается не только в количестве созданных работ или числе участников, но и в том, что он подтвердил бизнес-гипотезу, которая ранее никогда не проверялась на примере высококачественной интеллектуальной собственности.
Ценность традиционных спортивных событий основывается на трех столпах: редкость (проводятся только раз в четыре года, с ограниченным числом лучших спортсменов), непредсказуемость (неизвестные результаты соревнований) и эмоциональная связь (национальная честь, поклонение кумирам). Однако в эпоху интернета все три столпа ослабли.
Искусственный интеллект готов стать четвертым столпом интеллектуальной собственности в спорте.
Основная логика заключается в превращении интеллектуальной собственности из мимолетного потребительского товара, предназначенного лишь для просмотра и последующего забвения, в «средство производства», которое можно использовать для вторичного творчества. Вместо того чтобы тратить деньги на покупку трафика, лучше передать права на творчество, превратив каждого пользователя в бесплатный канал, приносящий собственные ресурсы.
Эта модель, вероятно, станет стандартом для всех супер-интеллектуальной собственности. Она будет многократно воспроизводиться и совершенствоваться, распространяясь от спортивных мероприятий до всех уголков человеческой культуры, пока в конечном итоге не станет универсальным билетом на все крупные события, знаменующие наступление эры искусственного интеллекта.
Представьте себе: болельщики чемпионата мира могли бы одним щелчком мыши создать свой собственный знаменательный момент поднятия трофея, зрители НБА могли бы «переместиться» на площадку, чтобы сделать победный бросок, и это могло бы распространиться даже на сферу развлечений и культуры — поклонники концертов могли бы создавать видеоролики, где они выступают на сцене со своими кумирами, посетители музеев могли бы «путешествовать» по историческим местам, а хранители нематериального культурного наследия могли бы использовать ИИ для демонстрации своих навыков.
Возможно, это новая интерпретация олимпийского духа в эпоху искусственного интеллекта: не только быстрее, выше, сильнее и сплоченнее, но и «смелость мыслить и смелость демонстрировать».
Авторы: Ли Чаофань, Мо Чунюй
#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.
ifanr | Оригинальная ссылка · Посмотреть комментарии · Sina Weibo