Не обманывайтесь танцующими роботами, мы всё ещё в эре GPT-2 Круглый стол миллиардеров по воплощенному интеллекту
Кстати о роботах, за последние два года мир технологий буквально заполонили видеоролики, на которых роботы делают «сальто назад».
Обсуждения в социальных сетях и рекламные видеоролики различных компаний создают впечатление, что нас отделяет всего один квартал от захвата власти роботами.
Только что на ежегодной встрече форума «Чжунгуаньцунь 2026» несколько основателей отечественных компаний, занимающихся воплощенным интеллектом, провели «Круглый стол по воплощенному интеллекту стоимостью в миллиард долларов». Ван Хэ из Galaxy General, Чжан Пэн из Zhipingfang, Гао Ян из Qianxun Intelligence, Тан Вэньбинь из Yuanli Lingji и Си Юэ из Xingdong Era собрались вместе, чтобы обсудить ключевые вопросы воплощенного интеллекта.
На каком этапе развития находится воплощенный интеллект, и в каких сценариях он получил подтверждение своей эффективности?
С технической точки зрения, какие проблемы необходимо решить для подлинной интеграции роботов в нашу жизнь, учебу и работу: данные, модели или аппаратное обеспечение роботов?
А в ближайшие год-два, на каких областях будут сосредоточены основные усилия в области воплощенного интеллекта, с большим упором на промышленное применение, или же ожидается его внедрение в быту?
В заключение они также обсудили развитие воплощенного интеллекта, заявив, что для регулирования уровня интеллекта всей робототехнической отрасли необходимы стандарты, аналогичные уровням L3 и L5, например, тем, которые используются в системах автономного вождения.
Добро пожаловать в эру робототехники GPT-2.0.
Как мы можем определить прошедший 2025 год и 2026 год как год полномасштабного прогресса в области робототехники?
Пять экспертов дали весьма согласованную оценку: 2025 год — это год «закладки фундамента» и наращивания темпов, а 2026 год станет первым годом улучшения способности робота к обобщению в различных сценариях и достижения крупномасштабного коммерческого внедрения.
Гао Ян из компании Qianxun Intelligence сравнил нынешний этап развития воплощенного интеллекта с эпохой GPT-2, эпохой больших языковых моделей.
▲Гао Ян, соучредитель Qianxun Intelligent
Он упомянул, что к 2025 году индустрия воплощенного интеллекта решила большое количество проблем инфраструктуры данных, и с улучшением параметров моделей и масштабов данных весьма вероятно, что в 2026 году произойдет скачок в эру 3.0.
Тан Вэньбинь из компании Yuanli Lingji также признал, что отрасль все еще находится на ранних этапах развития, но благодаря масштабам данных темпы ее роста чрезвычайно высоки.
Он откровенно заявил, что, несмотря на то, что мы сегодня здесь обсуждаем модели и алгоритмы, до сих пор нет крупномасштабного эталонного показателя, что делает невозможным точное измерение уровня различных форм воплощенного интеллекта.
▲ Си Юэ, соучредитель Star Era
Си Юэ, соучредитель Star Era, отметил, что безудержный приток капитала за последний год привел к внезапному появлению в 2026 году некоторых компаний, которые не ожидали своего появления в 2025 году; в то же время многие компании внезапно исчезли.
Это был год стремительного развития событий и ускорения.
Ван Хэ, основатель компании Galaxy General, упомянул их недавний проект с Университетом Цинхуа, в рамках которого роботы научились играть в теннис. Он сказал, что по мере того, как многие концепции становятся яснее, воплощенный интеллект выходит из лаборатории в реальный мир.
Тот, кто контролирует данные, контролирует мир.
Подобно ImageNet, масштабному набору данных изображений, созданному Фэй-Фэй Ли и ставшему важной частью развития глубокого обучения, развитие воплощенного интеллекта также требует большого объема данных.
По сравнению с крупными языковыми моделями, такими как ChatGPT, способными извлекать данные из огромных массивов текста в интернете, высококачественных интерактивных данных из реального мира по-прежнему не хватает.
Си Юэ из компании Star Era заявил: «В настоящее время самым большим узким местом является передача данных».
Для автономной работы роботов в сложных и специализированных условиях им необходимо собирать данные в реальных условиях. Однако стоимость проб и ошибок в реальных условиях слишком высока, и ни один руководитель завода не захочет позволить недоделанному роботу бесцельно возиться на сборочной линии.
Юаньли Линцзи выразился более прямолинейно: Тан Вэньбинь считает, что данные — это, по сути, вопрос денег; это не самый важный элемент, и деньги могут решить проблему. Настоящая сложность с данными заключается в том, чтобы заставить роботов предоставлять обратную связь на основе реальных сценариев.
Однако он также упомянул, что это проблема курицы и яйца. Современные роботы недостаточно зрелы для массового применения, но если мы хотим, чтобы роботы совершенствовались, нам необходимо использовать их в больших количествах.
▲ Чжан Пэн, соучредитель Zhifangping
Чжан Пэн из компании Zhipingfang считает, что истинную трансформацию модели обеспечивают данные, поступающие из реальных сценариев. Помимо самих данных, архитектура модели и системный дизайн имеют не меньшее значение.
Он считает, что воплощенный интеллект — это всестороннее сочетание «модели + физического оборудования + системы сценариев». Обеспечение способности роботов адаптироваться к большему количеству сценариев с меньшими затратами является серьезной задачей для промышленного применения воплощенного интеллекта.
Подобно Tesla и Waymo в области автономного вождения, тот, кто сможет запустить наибольшее количество роботов в реальном физическом мире с наименьшими затратами, получит билет в эру GPT-3.0.
В этом году уборка по дому не является приоритетом.
Если 2025 год был годом демонстрации показательных выступлений, балетных номеров и шоу боевых искусств, то 2026 год станет годом демонстрации различных сценариев.
Эти основатели единогласно отказались от сценариев элитного жилья, изображенных в научно-фантастических фильмах, и вместо этого с головой погрузились в логистику, общественные услуги и даже уличную розничную торговлю.
Чжан Пэн, Гао Ян и Си Юэ разделяют позитивный взгляд на сценарии полуструктурированного промышленного производства, простого обслуживания и логистики.
В частности, работа с ежедневной оплатой в секторе логистики, где «людям требуется лишь короткий период обучения, чтобы начать работать», характеризуется высокой стандартизацией и четкими требованиями к производительности, что делает ее наиболее простым способом замены и воспроизведения роботами в больших масштабах.
▲ Тан Вэньбинь, основатель Yuanli Lingji
Тан Вэньбинь предложил четыре чрезвычайно строгих стандарта реализации, которые можно описать как «руководство по избеганию ловушек» в области воплощенного интеллекта.
Во-первых, это должен быть сценарий, допускающий ошибки; во-вторых, он должен обладать достаточной эффективностью; в-третьих, необходима определенная степень обобщаемости, иначе можно будет напрямую использовать нестандартные автоматизированные машины; в-четвертых, он должен быть способен работать в течение длительного времени и достигать точки безубыточности.
Он с юмором упомянул, что, учитывая нынешние недостатки технологий, "танцы под видом работы" — это демонстративное приложение, способное вызвать эмоциональный отклик, а также отличный путь для бизнеса.
▲Ван Хэ, основатель Galaxy General
Ван Хэ из компании Galaxy General упомянул об их розничных магазинах в виде «космических капсул», которые открываются по всей стране. Внутри этих футуристических капсул роботы автономно доставляют товары покупателям.
Хотя роботы, возможно, не так эффективны, как продавцы-люди, в сборе товаров, их новизна и привлекательность обеспечивают покупателям высокую «эмоциональную ценность», и покупатели готовы платить за этот опыт.
Между тем, в ходе этого процесса компания Galaxy General накопила 80 000 часов реальных данных о выдаче товаров с полок магазинов.
Это не только отработанный бизнес-сценарий, но и чрезвычайно оригинальное, воплощенное в жизнь интеллектуальное решение для сбора данных.
В конце круглого стола участники также обсудили необходимость стандартов во всей индустрии воплощенного интеллекта.
Сегодня телеканал CCTV News сообщил, что Китайская академия информационных и коммуникационных технологий (CAICT) совместно с более чем 40 организациями выпустила первый отраслевой стандарт в области воплощенного интеллекта, который будет внедрен 1 июня 2026 года.
Этот стандарт не только объединяет систему эталонного тестирования (статическое моделирование, динамическое моделирование, реальная среда и их комбинация), но и создает банк вопросов, содержащий более 10 000 тестовых заданий, охватывающих 300 сценариев, включая промышленные и домашние, тем самым устраняя проблему «отсутствия стандартов, которым можно следовать» в отрасли.
▲ RoboChallenge — известная платформа для оценки алгоритмов воплощенного интеллекта.
Основатели также упомянули важность стандартов, законов и безопасности, утверждая, что только широко признанный набор отраслевых стандартов может привести к существенному и масштабному прогрессу в области воплощенного интеллекта.
В заключение ведущий сказал, что сегодняшняя отметка составляет «10 миллиардов», и выразил надежду, что в следующем году это число достигнет 100 миллиардов воплощенных в жизнь интеллектуальных диалогов.
Да, число роботов еще не достигло триллиона. Возможно, им потребуется еще несколько лет практики, прежде чем они смогут полностью захватить власть над человечеством.
#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.






