Генеральный директор компании Zhuoyu выступил с речью, в которой обсудил два кризисных момента в истории компании и одну возможность, связанную с интеллектуальным вождением.

Подобно группе компаний "HuaMiOV" (Huawei, Xiaomi, OPPO и vivo) в отечественной индустрии мобильных телефонов, четыре ведущих отечественных поставщика решений для интеллектуального вождения также известны как "Большая четверка" (Horizon Robotics, DJI Automotive, Huawei и Momenta). Однако в быстро развивающейся отрасли эта параллельная взаимосвязь не является статичной; компании могут в любой момент отстать. Например, до "HuaMiOV" ведущими отечественными производителями мобильных телефонов были "ZTE, Huawei, Coolpad и Lenovo".
То же самое относится и к индустрии интеллектуального вождения, в которой работает «Китайский университет геологических наук». В условиях постоянно меняющейся внешней среды ни одна компания не смеет позволить себе расслабиться, потому что, если не проявлять осторожность, ее могут обогнать и превзойти.
Автомобильные решения DJI были воплощены в Zotye, но это только начало трудностей.
В июне 2024 года компания DJI Automotive была переименована в «Zhuoyu». Три месяца спустя Zhuoyu официально стала независимой от системы DJI, превратившись из подразделения в составе DJI в независимую компанию, ответственную за собственные прибыли и убытки.
Однако ситуация для компании Zhuoyu, которая в то время действовала самостоятельно, была неблагоприятной. В своей речи на церемонии запуска бренда Zhuoyu 2025 генеральный директор Zhuoyu Шэнь Шаоцзе объяснил свой на тот момент образ мышления:
Это чем-то похоже на процесс превращения человечества в космических существ в «Задаче трёх тел». После апокалиптической войны пять космических кораблей сбежали, но оказались бездомными и не смогли вернуться. Они прибыли в регион с ограниченными ресурсами; из пяти кораблей ресурсов хватило только на два, что привело к уничтожению трёх. Мы выросли в теплице, начав с нуля, и после раскола самой насущной проблемой стали деньги.
Шэнь Шаоцзе также заявил об этом в интервью LatePost. В день разделения компании с тысячами сотрудников на счету оставалось менее 500 миллионов юаней, чего было достаточно лишь для работы Zhuoyu в течение нескольких месяцев.

До этого Шэнь Шаоцзе был преимущественно университетским профессором и руководителем научно-исследовательских и опытно-конструкторских работ. Он также был доцентом кафедры электронной и компьютерной инженерии Гонконгского университета науки и технологий (HKUST) и директором совместной инновационной лаборатории HKUST-DJI. В качестве руководителя группы управления полетом DJI он помог компании занять лидирующие позиции в области беспилотных летательных аппаратов, превратив их из компании, не имевшей себе равных среди конкурентов, в компанию, чьи дроны DJI значительно превосходят конкурентов по таким параметрам, как управление полетом, предотвращение столкновений с препятствиями, передача изображений и качество съемки.
Теоретические основы управления полетом дронов и технологии предотвращения столкновений с препятствиями очень похожи на основы интеллектуального вождения автомобилей. Шэнь Шаоцзе говорит об этом так: «Дроны и автономное вождение очень похожи по своей логике; по сути, и то, и другое — мобильные интеллектуальные роботы».
Согласно распространенному мнению в сфере интеллектуального вождения и даже во всей индустрии воплощенного интеллекта, автомобили представляют собой относительно низкоразмерные воплощенные интеллектуальные роботы с низкой степенью свободы передвижения.
Компания DJI, цель которой — «создать по-настоящему мощного робота», и её основатели, Дж. Т. Шуо и Шен, надеются создать «элегантного, мощного и действительно способного решать задачи интеллектуального агента».
Однако после обретения независимости в 2024 году Чжуоюй столкнулся с риском значительного отставания в развитии.
В начале 2024 года Tesla начала внедрение FSD V12 в некоторые автомобили Tesla. В этой версии FSD Tesla полностью переписала архитектуру программного обеспечения, и комплексная модель стала основной технологией FSD V12.
Выпуск FSD V12 ознаменовал собой переломный момент для всей индустрии интеллектуального вождения, а также стал для неё своего рода «моментом ChatGPT». После этого, будь то такие бренды, как Li Auto и XPeng, разработавшие собственные системы интеллектуального вождения, или поставщики решений для интеллектуального вождения, такие как Horizon Robotics или Momenta, все они начали трансформировать свои технологии, переходя от подхода «восприятие-планирование-управление» к «комплексной модели», которая казалась настоящей алхимией.
Факты также доказали, что изменение технологических направлений дало отрасли возможность обогнать конкурентов. Путь «восприятие-планирование-контроль», который ранее в значительной степени опирался на инженерные ресурсы, стал преимуществом для таких богатых ресурсами брендов, как Huawei, которые выступали за командную работу. Компаниям, подобным Li Auto, стало трудно конкурировать с ними по таким ресурсам, как инженеры.
«Комплексная крупномасштабная модель» оказала волшебное воздействие на индустрию интеллектуального вождения, позволив многим брендам достичь высочайшего уровня интеллектуальных возможностей вождения при умеренных затратах ресурсов. Внезапно рынок технологий интеллектуального вождения оказался переполнен.
Однако компания Zhuoyu была одной из тех, кто относительно поздно перешел на другой технологический подход.
14 октября 2024 года компания Zhuoyu начала переориентировать свою стратегию развития интеллектуальных технологий вождения на «комплексный подход». До этого Zhuoyu провела почти год предварительных исследований.
К настоящему моменту идеальная двойная система "сквозное подключение + VLM" была выпущена два-три месяца назад, а прямой конкурент Zhuoyu, компания Momenta, уже более полугода переходит на системы "сквозное подключение".
Короче говоря, Чжуо Юй был слишком медлителен.
Шэнь Шаоцзе объяснил, почему Чжо Юй медлил:
Мы принадлежим к традиционной школе робототехники, чье основное предположение заключается в том, что «я построил модель физического мира», и мы одержимы правилами. Робототехника, основанная на данных, — это полная противоположность: вы не строите модели, вы используете данные для обучения моделей. Этот когнитивный сдвиг требует времени. Говоря прямо, если вы не можете победить их, присоединитесь к ним, но вы также должны признать, что не можете победить их первыми. В течение года, предшествовавшего 14 октября 2024 года, мы научно убедили себя в том, что мы действительно не можем их победить.
Однако на протяжении значительного периода времени создание сквозных моделей большого размера не было быстрым решением. Скорее, как описывали многие отраслевые эксперты, построение сквозных моделей большого размера подобно алхимии, требующей постоянной корректировки обучающих данных и стратегий обучения для поиска оптимального «соотношения» и «рецепта».
Шэнь Шаоцзе сказал, что модель, обученная Чжуоюй, поначалу была незрелой. Команда фронтенд-разработчиков прямо сказала бэкенд-разработчикам: «Что за мусор вы мне дали?» Эта ситуация продолжалась несколько месяцев, и Чжуоюй даже не знал, когда у него появится достойная модель.
Прежде чем перейти к новому технологическому подходу, Чжуоюй принял судьбоносное решение: он удалил весь код, основанный на методе правил, перекрыв все другие пути отступления и оставив единственным вариантом сквозную технологическую модель.

Обнаружив, что подход Чжуоюй на 90% схож с подходом Tesla, компания начала обретать уверенность.
Причина, по которой обучение сквозной модели большого размера похоже на «алхимию», заключается в том, что оно включает в себя механизм «черного ящика», полный необъяснимых явлений.
Будучи первой компанией, представившей комплексную крупномасштабную модель в индустрии интеллектуального вождения, Tesla также стремится к повышению объяснимости своих решений. Вот что сказал Шэнь Шаоцзе: он увидел в Tesla «поистине прекрасную архитектуру», систему, разработанную группой людей, понимающих физический мир, особенности вождения, информатику и нейронные сети.
По его мнению, «гениальный» подход Tesla позволил VLA (Vision-Language-Motion Big Model, обычно рассматриваемая как передовая архитектура сквозной технологической дорожной карты + VLM) состоять из нескольких интерпретируемых специализированных модулей. Это позволило решить две самые сложные проблемы в отрасли — причинно-следственное мышление и генерацию низкочастотных данных — с чрезвычайно низкими затратами.
Основываясь на аналогичном подходе, Чжуоюй разработал собственную модель AWM (Action World Model), представляющую собой авторегрессивную модель принятия решений и планирования — вместо того, чтобы немедленно предлагать действие при получении входных данных, она внутренне выводит несколько возможных путей, понимает причинно-следственную связь, а затем принимает решение.
После того как трансформация в Чжуоюй произошла на несколько месяцев позже, чем у конкурентов, город наконец-то преодолел трудности переходного периода.
В то же время начали проявляться некоторые из прежних преимуществ Zhuoyu, такие как способность максимально эффективно использовать вычислительную мощность, что позволяло продуктам со средней производительностью демонстрировать превосходные результаты в реальных условиях. Это то, что сама Zhuoyu называет «достижением эквивалентных возможностей при значительно меньших требованиях к вычислительной мощности, чем в среднем по отрасли, исследованием точки перелома, когда чрезвычайно низкая стоимость по-прежнему позволяет пользователям безопасно и повсеместно использовать продукт».
Например, компания Zhuoyu утверждает, что достигнутая ею производительность на процессоре Snapdragon 8650 (100 TOPS вычислительной мощности) сопоставима с производительностью двухъядерного Orin X (512 TOPS общей вычислительной мощности); благодаря развертыванию сетевого сжатия, на процессоре TDA4 (массовые модели имеют 32 TOPS вычислительной мощности) была успешно реализована сквозная сетевая инфраструктура, что обеспечивает единственное в своем классе решение для городской навигации со средней вычислительной мощностью и позволяет пользователям таких моделей, как Wuling и Jetour, оценить улучшенные функции и производительность. Исключительная экономичность и высокая вычислительная эффективность являются ключевыми конкурентными преимуществами Zhuoyu в расширении рынка.
В настоящее время у компании Zhuoyu Assisted Driving девять клиентов в сегменте серийного производства легковых автомобилей, более 50 серийных моделей и более 30 моделей, находящихся на стадии запуска в серийное производство. Zhuoyu добилась прорывов в решении ряда инженерных задач: компания первой реализовала систему помощи водителю уровня L2+ с использованием вычислительной мощности среднего уровня для обработки изображений; внедрила первое в мире решение для серийного производства, объединяющее кабину водителя и систему управления на базе Qualcomm 8775, используя один чип для управления интеллектуальной кабиной и вспомогательной системой вождения, что способствовало модернизации электронной и электрической архитектуры автомобиля, снижению затрат и повышению эффективности в отрасли; опровергла предположение о невозможности внедрения передовых систем помощи водителю в бензиновых автомобилях, став пионером в области интеллектуализации бензиновых автомобилей; и благодаря собственным разработкам в области комплексной интеграции аппаратного и программного обеспечения стала одним из двух поставщиков первого уровня в соответствующем сегменте, осуществивших серийное производство.
Что касается высокопроизводительных вычислительных решений, компания Zhuoyu выпустила два таких решения: одно — это решение уровня L3/L4, оснащенное двумя чипами NVIDIA Thor, в сочетании с собственной разработанной системой распознавания, ориентированной на возбуждение, и радаром для обнаружения слепых зон по периметру; другое — это интегрированное решение для кабины пилота, в котором используется Qualcomm SA8797 и интегрирован VLA в единую архитектуру.
Благодаря этим приготовлениям Шэнь Шаоцзе стал более уверен в своих прогнозах на будущее. Например, в одной из своих речей он сказал, что раньше, когда кто-то спрашивал: «Когда будут реализованы передовые системы помощи водителю?», ответ всегда был «N+5», то есть это всегда происходило скоро, всего через несколько лет. Но прошло уже несколько лет, а ответ по-прежнему «скоро».
Но теперь его ответ: В любое время.
Это новая возможность в области интеллектуального вождения, а значит, внедрение L4 может произойти в любой момент.

Укрепив свою технологическую базу, компания Zhuoyu смотрит в более широкое будущее. В своей речи Шэнь Шаоцзе объявил, что Zhuoyu создаст пространственную интеллектуальную мобильную платформу, которая возглавит эру автономных мобильных роботов. Он подчеркнул, что основное внимание Zhuoyu сосредоточено на мобильности, полностью замыкая цикл в физической сфере «мобильности» и доводя его до предела.
Это означает, что технологические возможности Zhuoyu больше не будут ограничиваться системами помощи водителю легковых автомобилей. Вместо этого, опираясь на парадигму разработки, основанную на данных, зрелую базовую модель и интегрированные возможности проектирования аппаратного и программного обеспечения, компания расширяет границы мобильного интеллекта, охватывая более широкий спектр бизнес-сценариев.
В настоящее время компания Zhuoyu запустила проект Heavy Truck Highway NOA, направленный на решение проблемы усталости водителей большегрузных автомобилей во время длительных поездок и повышение безопасности и эффективности магистральной логистики. Компания также установила сотрудничество с тремя ведущими клиентами в отрасли: XCMG, Shaanxi Automobile и Sinotruk. Первая партия моделей большегрузных автомобилей будет официально запущена в серийное производство в первой половине 2026 года.
Тем временем компания Zhuoyu сотрудничает с ведущими производителями коммерческого транспорта для проектирования и разработки беспилотных логистических транспортных средств, предназначенных для интеллектуальной трансформации в таких сценариях, как добыча полезных ископаемых и порты. Это означает, что Zhuoyu будет не только поставщиком первого уровня в этом проекте, но и примет участие в других аспектах, таких как разработка продукта.
Шэнь Шаоцзе больше не занимается исследованиями и разработками дронов, а Чжуоюй также отделился от DJI, но они присоединятся к большему числу компаний, подобных DJI.
#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.
ifanr | Оригинальная ссылка · Посмотреть комментарии · Sina Weibo