Инь Ци указывает путь к звездам: масштабная модель «Плей-офф» выходит в физический мир.

Как стало известно APPSO, компания Jieyue Xingchen недавно завершила раунд финансирования категории B+ на сумму более 5 миллиардов юаней. В число участвующих институциональных инвесторов вошли Shanghai International Trust & Investment Corporation (SITIC) Pilot Fund, China Life Equity Investment, Pudong Venture Capital, Xuhui Capital, Wuxi Liangxi Fund, Xiamen International Trade Group и Huaqin Technology, а также другие отраслевые инвесторы. Существующие акционеры, такие как Tencent, Qiming Venture Partners и 5Y Capital, также приняли участие в последующих инвестициях.

Стоит отметить, что этот раунд финансирования превосходит объявленный недавно компанией Moonlight Animation раунд серии C на сумму 500 миллионов долларов, устанавливая новый рекорд по объему единовременного финансирования на китайском рынке крупных моделей за последние 12 месяцев и даже превосходя суммы, привлеченные в ходе IPO компаний Zhipu и MiniMax.

В последний месяц новости о финансировании ИИ были очень актуальными: Manus был приобретен Meta, Ян Чжилинь из Moonlight Capital сделал громкое заявление о том, что у него «нет недостатка в деньгах», а Zhipu и MiniMax один за другим вышли на биржу в Гонконге. Сегодняшний раунд финансирования от Jieyue Capital вновь взбудоражил нервы сектора ИИ.

В отличие от них, StepLeap пошла несколько иным путем: в то время как другие крупные игроки на рынке моделей стремились к определенности и использовали благоприятную возможность для проведения IPO и выхода на биржу, StepLeap Star, располагая такой значительной суммой денег, выбрала более сложный и медленный путь: физический мир.

Нет правильного или неправильного подхода, но в отрасли существует консенсус относительно того, что регулярный сезон крупномасштабных модельных соревнований завершен. Последние два года были посвящены количеству параметров и токенам, но начиная с 2026 года, плей-офф будет вращаться вокруг новой ключевой концепции:

Как искусственный интеллект сможет выйти за пределы центров обработки данных и проникнуть в реальный мир, чтобы занять всё большее количество физических терминалов?

Люди и компании, которые выходят за рамки циклов.

APPSO считает, что помимо финансирования, кадровые изменения заслуживают большего внимания.

Ключевая фигура из «предыдущего цикла развития ИИ» официально вышла на первый план: Инь Ци, председатель совета директоров компании Qianli Technology.

Инь Ци долгое время принимал активное участие в стратегическом планировании компании Jieyue Xingchen, а на этот раз он также получил новую должность: председателя совета директоров Jieyue Xingchen, который несет полную ответственность за стратегию компании и ее реализацию, формируя позитивные и взаимодополняющие отношения с существующей командой.

Ранее команда StepLeap отличалась сильными техническими возможностями, но относительно слабым опытом работы в отрасли.

  • Генеральный директор Цзян Дасинь — бывший глобальный вице-президент Microsoft и главный научный сотрудник Азиатского института интернет-инженерии Microsoft. Он отвечал за разработку поисковой системы Bing, что означает, что он не только разбирается в технологиях, но и имеет опыт внедрения искусственного интеллекта в глобальный продукт с высоким трафиком. В прошлом году он стал единственным членом IEEE, представляющим крупный китайский стартап, занимающийся разработкой моделей.
  • Главный научный сотрудник Сянъюй Чжан является одним из четырех авторов ResNet, основополагающей работы в области глубокого обучения, и его вклад в отрасль очевиден.
  • Технический директор Чжу Ибо ранее занимал должность технического руководителя продуктов Google Cloud GPU, непосредственно поддерживая Anthropic. До этого он отвечал за создание инфраструктуры ИИ в ByteDance. Он является одним из немногих инженеров в Китае, имеющих практический опыт создания многокарточных кластеров с нуля.

Эта команда за два года пробилась сквозь «битву ста моделей», войдя в число лучших разработчиков крупномасштабных моделей в Китае. Сегодня Leap Forward — один из немногих стартапов в Китае, который по-прежнему настаивает на предварительном обучении и исследовании более высоких пределов интеллекта для базовых моделей, и обладает самой полной матрицей моделей.

Однако технологическое лидерство не равнозначно коммерческому успеху. Во второй половине конкуренции за крупномасштабные модели, которая стала еще более интенсивной, производительность модели больше не может быть единственной причиной рыночных предпочтений. Вопрос о том, как внедрить крупномасштабные модели в реальные приложения и создать коммерческую ценность, стал новым поворотным моментом.

Для того чтобы компания могла успешно преодолевать экономические циклы, ей нужны люди, которые понимают, как это делать. Инь Ци — именно тот недостающий элемент головоломки, который нужен компании Jieyue.

Более десяти лет назад «глубокие нейронные сети» были еще модным словом, и исследователи впервые осознали огромную пользу, которую их исследования и возможности приносят отрасли. В 2011 году Инь Ци и несколько его однокурсников из группы Яо Университета Цинхуа совместно основали компанию Megvii Technology .

Среди китайских предпринимателей в сфере ИИ Инь Ци — редкий «амфибийный вид». В отличие от основателей с чисто академическим образованием, таких как Юэань и Чжипу, и основателей с количественным образованием, таких как Лян Вэньфэн, главным достоинством Инь Ци является «практический опыт/компетенции». Бизнес Megvii в сфере IoT обслуживает более 100 городов Китая и расширился на более чем десять стран и регионов мира, а ее платформа AIoT охватывает сотни миллионов подключений.

Инь Ци

Инь Ци

Имя Инь Ци в последние годы редко упоминалось в сообществе специалистов по искусственному интеллекту, но, безусловно, мало кто понимает основную концепцию следующего цикла развития ИИ лучше, чем он:

Крупномасштабные модели выходят за рамки научных статей и рейтингов; они должны интегрироваться в физический мир и образовывать замкнутый цикл.

Это также объясняет еще одну главную тему стратегии StepLeap, выходящей за рамки расширения границ ее моделей: внедрение масштабных моделей в потребительские терминалы, такие как мобильные телефоны и автомобили. Данные показывают, что StepLeap установила прочные партнерские отношения с 60% ведущих китайских производителей смартфонов, а ее модели установлены более чем на 42 миллионах устройств, включая такие бренды, как OPPO, Honor и ZTE, обслуживая в среднем 20 миллионов пользователей ежедневно.

В автомобильном секторе компания Jieyue установила прочные партнерские отношения с Qianli Technology и Geely для интеграции комплексных голосовых моделей в интеллектуальную приборную панель AgentOS . Продажи Geely Galaxy M9 за три месяца с момента запуска составили почти 40 000 единиц; согласно плану Jieyue, в этом году целевое количество установленных в автомобилях моделей достигнет миллионов.

Инь Ци принимал активное участие в стратегическом планировании Jieyue с момента основания компании и с тех пор работает в ней. Теперь официальное присоединение Инь Ци означает, что его долгосрочная стратегия «ИИ + терминал» получает ускорение и вступает в стадию полномасштабной реализации.

Сочетание его собственных предприятий неизбежно напоминает комбинацию xAI Илона Маска и Tesla/Optimus: одно дает душу, а другое составляет тело.

Сосредоточение внимания на мультимодальности: единственный путь в физический мир.

Почему проекту "ИИ + Терминал" необходимо делать ставку на мультимодальность?

С чисто технической точки зрения, мультимодальные возможности представляют собой «сенсорную систему», посредством которой большие модели взаимодействуют с физическим миром. Если большая модель — это интеллектуальный агент, то текст — всего лишь символическая логика; мультимодальность же действительно представляет собой глаза, уши и рот. Только обладая мультимодальными возможностями, ИИ может по-настоящему воспринимать реальную человеческую жизнь и интегрироваться в неё.

Если посмотреть глубже, то существует два пути достижения этой способности к восприятию: один из них — это ведущая в отрасли модель «подключения», которая предполагает сначала визуальное кодирование, а затем передачу его в языковую модель для понимания. Хотя этот подход прост, он подобен предоставлению проводника слепому человеку — информация неизбежно теряется и задерживается в процессе преобразования.

StepLeap, с другой стороны, придерживается «нативного мультимодального» подхода, начиная непосредственно с корпусов, чередующих текст и изображения, и проводя сквозное обучение. Эта модель не ограничена архитектурами слияния, что позволяет достичь более естественного и интуитивно понятного мультимодального восприятия и генерации, давая ИИ возможность имитировать человеческие методы понимания причинно-следственной логики физического мира.

Помимо визуального аспекта, эта «нативность» также очевидна в аудиомоделях Step-Audio. Например, в последней версии Step-Audio-R1.1 используется технология MGRD (Modal Anchored Inference Distillation), позволяющая модели генерировать цепочки вывода, основанные исключительно на академических признаках, решая проблему, заключающуюся в том, что аудиомодели «делают больше ошибок, чем больше думают». Полученные результаты заняли первое место в мире в авторитетном рейтинге по искусственному анализу.

В настоящее время StepLeap внедрила свою модель обработки больших данных для обработки аудиоданных второго поколения в автомобили. Когда вы говорите «Мне немного холодно» в машине, традиционная интеллектуальная приборная панель преобразует вашу речь в текст, распознает ключевые слова, а затем выполнит предустановленные команды. Однако приборная панель нового поколения может объединять такую ​​информацию, как тон, эмоции и окружающий шум, чтобы определить истинные потребности пользователя, а не просто сопоставлять ключевые слова — например, если вы говорите, что вам холодно, когда дверь машины открыта, вам может потребоваться только закрыть дверь. Эта настойчивость в использовании мультимодальных вычислений — не просто следование тренду. Еще с момента своего основания в 2023 году StepLeap разработала параллельную стратегию одновременной разработки как моделей обработки больших данных для обработки языковых данных, так и мультимодальных моделей обработки больших данных. На этом пути нет коротких путей, и выбор StepLeap заложил основу для сегодняшнего взрывного роста «ИИ + терминал».

От понимания мира до активного взаимодействия

Врожденная мультимодализация призвана позволить крупным моделям «понимать мир», в то время как следующий шаг к физическому миру требует от крупных моделей научиться «взаимодействовать с миром».

Поэтому StepLeap с самого начала активно участвовала в разработке архитектуры VLA (Vision-Language-Motion). Ее значимость заключается в том, чтобы дать ИИ возможность видеть, слышать и, что более важно, принимать решения и выполнять действия в цифровой или физической среде, подобно людям.

Для реализации этой концепции Step-GUI выпустила первую в отрасли по-настоящему развертываемую серию моделей графического интерфейса пользователя с открытым исходным кодом. В частности, версия Edge, Step-GUI-Edge, с 4 миллиардами параметров, демонстрирует чрезвычайно мощные возможности «маленького, но могучего», превосходя даже модели с восьмикратным увеличением количества параметров в основных тестах производительности. Это означает, что даже при ограниченной вычислительной мощности потребительских терминалов большие модели могут комфортно функционировать, превращаясь в интеллектуальных агентов с возможностями чтения с экрана и управления. Это также означает, что все производители мобильных телефонов могут использовать эту возможность для разработки функций, аналогичных мобильному помощнику Doubao.

Эта эволюция от восприятия к действию подтверждена в крупномасштабных коммерческих проектах. На рынке мобильных устройств Leap считается ведущим производителем смартфонов с искусственным интеллектом. По данным APPSO, Leap уже установила прочные партнерские отношения с 60% ведущих китайских производителей мобильных телефонов, охватывая флагманские модели таких брендов, как OPPO, Honor и ZTE.

Сегодня функции искусственного интеллекта в коммерчески доступных мобильных телефонах давно вышли за рамки прошлогодних «диалоговых окон» и начали проникать на системный уровень. Например, «Вопрос к экрану в одно нажатие» от OPPO, «Вопрос к фотографии» от Honor и «Помощник по искусственному интеллекту для пожилых людей» от ZTE — все это примеры функций ИИ, которые могут не только понимать экран и генерировать контент, но и выполнять сложные задачи в различных приложениях.

Согласно данным IDC, к 2026 году уровень проникновения смартфонов с искусственным интеллектом на китайский рынок превысит 50%, при этом каждый второй смартфон будет обладать встроенными функциями ИИ на системном уровне.

Что касается общепринятого в отрасли мнения о том, что «конкуренция между крупномасштабными моделями вступила в следующую стадию», Инь Ци и Цзе Юэ сделали ставку на более сложный, но более надежный путь: для выживания в долгосрочной перспективе ИИ должен быть интегрирован в рамки физического мира.

В параллельной вселенной внутри Силиконовой долины Маск интегрирует xAI с Tesla/Optimus, чтобы создать замкнутый цикл от передовых моделей до физических устройств. Этот путь требует значительных активов, надежных операционных процессов и отраслевых ресурсов, которых большинству компаний, занимающихся разработкой моделей, не хватает. Но для тех, кто пережил экономические циклы, это, похоже, верный путь к AGI (асинхронному гению).

Для того, чтобы стать лидером рынка, не обязательно владеть всеми заводами, но необходимо активно в них присутствовать.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.

ifanr | Оригинальная ссылка · Посмотреть комментарии · Sina Weibo