Невероятно! Робот наконец-то научился мыть посуду и даже закрывать ящики с помощью шарниров в области бедер.

Несколько часов назад компания Figure AI выпустила Helix 02, которую они называют «общей моделью визуально-языково-действенной обработки (VLA)».

Наиболее наглядная демонстрация? На рисунке 03 робот подходит к шкафу, открывает дверцу, берет тарелку из стопки, поворачивается и идет к посудомоечной машине, регулирует угол наклона и устойчиво ставит ее внутрь.

Весь процесс был автоматизирован, без дистанционного управления, и ни одно блюдо не было повреждено.

Мытье посуды: «адское» испытание телесного интеллекта.

Зачем показывать процесс приготовления? Потому что это «адская сложность» домашней работы.

Для человека перемещение кухонной утвари не представляет сложности, но для роботов движение каждого сустава является непростой задачей.

Мы можем понять это, разложив на составляющие цепочку действий по мытью посуды.

Во-первых, это серьезно проверяет возможности робота по распознаванию окружающей среды и пространственной мобильности :

Роботу (и используемой им модели) необходимо определить свое собственное местоположение, установить относительное положение шкафа, раковины и посудомоечной машины, а затем спланировать маршрут, чтобы добраться до них.

Когда вы подойдете к шкафу, нужно остановиться на правильном расстоянии — слишком близко, и вы не сможете открыть дверцу, слишком далеко, и вы не сможете дотянуться до мисок.

После осмотра посуды необходимо также определить ее тип: фарфоровые тарелки, стеклянные чашки и пластиковые миски, каждая из которых требует разного положения и давления.

После того, как вы заберете посуду, вам еще нужно определить, куда ее поставить в посудомоечную машину: тарелки на нижнюю полку, чашки на верхнюю, а другую посуду — сбоку.

Во-вторых, для Ся Чу Фан (下厨房) также необходима трехмерная визуальная и тактильная обратная связь :

Керамика хрупкая, стекло скользкое, а пластик деформируется. Роботам необходима точная тактильная обратная связь для управления силой воздействия — слишком слабая сила приведет к скольжению, слишком тяжелая — к поломке.

Прорыв модели Helix 02 заключается именно в этом.

Благодаря сочетанию нескольких датчиков, таких как визуальный, тактильный, датчик давления и индуктивный, устройство обладает возможностью многомерного стереоскопического зрения, позволяющей точно определять положение и глубину чаш в стопке.

Рисунок 03. В манипулятор робота также интегрирован механизм обратной связи по усилию, который может «распознавать» приложенную силу и определять момент контакта с фарфоровой поверхностью.

При работе с миской система в режиме реального времени определяет силу контакта. Миска наклонена? Отрегулируйте угол. Ударилась о дверцу шкафа? Отступите немного назад.

Наконец, есть функция визуальной памяти , которая также является важным преимуществом модели Helix 02:

Это означает, что робот может запомнить то, что только что увидел.

Когда шкаф открывается, даже если определенная миска не видна с текущего ракурса, существо помнит, что только что мельком увидело ее, и корректирует свои движения на основе этого воспоминания.

Когда вы неоднократно загружаете посуду в посудомоечную машину, она запоминает, какие отсеки заполнены, а где еще есть место.

Это устраняет необходимость повторного сканирования каждый раз , значительно повышая эффективность выполнения действий.

Бретт Эдкок, основатель и генеральный директор Figure AI, сделал акцент на X:

Дистанционного управления нет; роботом управляет Helix, выполняя все задачи, от ходьбы и захвата предметов до планирования.

Бретт Адкок также подтвердил, что та же самая общая архитектура ранее научила роботов складывать полотенца и сортировать посылки, а теперь научила их мыть посуду.

Не требуется никаких новых алгоритмов или специализированной разработки; необходимы только новые данные.

Единственным текущим ограничением являются данные для предварительного обучения. Чем больше данных мы передадим Helix, тем больше задач сможет выполнить робот. Аппаратная часть не нуждается в изменениях; она уже может выполнять большинство задач, с которыми справляются люди.

Под этим твитом пользователь X прокомментировал: «Увидев, как человекоподобный робот впервые выполняет задачи дома, я понимаю, насколько близки мы к этому будущему».

Компания-звезда, которая отправила роботов работать в BMW.

С другой стороны, Figure AI ни в коем случае не является той «креативной компанией», которая просто обсуждает теорию в лаборатории.

За три года рыночная капитализация Figure AI выросла с 0 до 39 миллиардов долларов благодаря инвестициям таких инвесторов, как Bezos Capital, OpenAI, Microsoft и Nvidia.

В феврале 2024 года компания Figure AI завершила раунд финансирования серии B на сумму 675 миллионов долларов, а в сентябре 2025 года – раунд серии C на сумму 1 миллиард долларов, продемонстрировав поразительно быстрые темпы прогресса.

Основатель компании Бретт Эдкок также является успешным серийным предпринимателем.

В 2018 году Эдкок продал свою платформу по подбору персонала Vettery за 100 миллионов долларов и основал компанию по производству электросамолетов Archer Aviation, которая вышла на биржу в 2021 году с общей оценкой почти в 3,8 миллиарда долларов через SPAC-компанию.

После выхода на рынок робототехники Эдкок привлек ряд лучших специалистов из Boston Dynamics, Tesla и Google DeepMind, и технический потенциал Figure AI быстро вырос.

▲ Бретт Эдкок (справа)

Эта модель развития талантов также является наиболее отличительной чертой Figure AI:

«Мозг» и «тело» созданы вместе, управляя как аппаратной частью, так и производственной системой.

Под "мозгом" здесь, естественно, подразумевается Helix AI.

Начиная с первоначального сотрудничества с OpenAI и заканчивая нынешней полностью самостоятельной разработкой модели, Figure AI успешно обеспечила себе контроль над повествованием, создаваемым этой моделью.

Например, робот на рисунке 03 использует многоуровневую архитектуру управления «Система 0, Система 1, Система 2».

▲ Рисунок 03

Система 0 отвечает за управление движением летательного аппарата, решая задачи управления низкого уровня, такие как балансировка летательного аппарата, контакт пальцев с поверхностью и воздействие внешних возмущений. Ее функции аналогичны функциям мозжечка человека.

Исходя из этого, Система 1 обрабатывает визуально-моторную политику, показанную на рисунке 02, в то время как Система 2 запускает модель визуального языка.

▲ На рисунке 02, который был продемонстрирован в прошлом году, использована модель верхней части тела системы 1+2.

Благодаря трехуровневому взаимодействию, Figure 03 смог автономно понимать инструкции, распознавать окружающую среду и определять, как должен двигаться летательный аппарат.

А под словом «тело» явно подразумевается аппаратная часть робота Figure.

Ранее выпущенная в небольших масштабах опытная версия модели Figure 02 оснащена 6 RGB-камерами, двумя модулями GPU, 16 степенями свободы в руке и максимальной грузоподъемностью 25 кг.

Время работы батареи устройства, показанного на рисунке 02, составляет около 5 часов, чего как раз достаточно для одной рабочей смены.

▲ Рисунок 02

В новейшей модели Figure 03 в каждую ладонь встроены камеры и тактильные датчики, позволяющие определять давление до 3g.

Иными словами, ладонь на рисунке 03 более нежная и гибкая:

▲ Рисунок 03

Что еще более важно, робот «Кенджин» от Figure AI способен быстро собирать и доставлять роботов для реальных задач.

В январе 2024 года компания Figure AI заключила партнерское соглашение с BMW для поставки партии автомобилей Figure 02 на сборочную линию BMW в Южной Каролине.

На рисунке 02 показано точное размещение деталей из листового металла в неподвижном устройстве — деликатная задача, с которой большие стационарные роботизированные манипуляторы с трудом справляются.

Эти автомобили Figure 02 проработали в BMW в общей сложности 11 месяцев, преодолев расстояние почти в 200 миль, перевезя более 90 000 деталей и оказав помощь в производстве более 30 000 автомобилей BMW X3.

Эдкок также опубликовал фотографии робота, покрытых царапинами и следами износа, что указывает на то, что это была коммерческая проверка в «реальных условиях»:

Увидев, как робот затягивает винты, Милан Неделькович, директор по производству BMW, подытожил:

В ходе предварительных испытаний мы определяем потенциальные области применения человекоподобных роботов в производстве. В будущем мы надеемся участвовать в этом процессе уже на этапе разработки технологий (роботов).

Взаимосвязь между Figure AI и OpenAI также имеет решающее значение.

Например, в 2024 году OpenAI не только инвестировала в Figure AI, но и помогла разработать модель речи, которая позволяет роботам получать команды на естественном языке.

Хотя компания Figure позже переключилась на разработку собственной модели Helix, это сотрудничество, по сути, заложило основу для модели VLA.

По стечению обстоятельств, на выставке CES в этом году мы увидели четкую тенденцию:

Гиганты рынка бытовой техники начинают бросать вызов рынку «домашних роботов».

Компании LG и Hisense представили прототипы роботов, способных автономно передвигаться по дому и помогать по хозяйству, что свидетельствует о том, что традиционные производители бытовой техники начинают осознавать:

Следующее поколение умной бытовой техники будет состоять не из холодильников или стиральных машин с более мощными вычислительными мощностями, а из роботов, способных напрямую управлять этими устройствами.

▲ Домашний робот LG CIOiD

Даже в этой гонке за «человеческую трансформацию» отечественные производители занимают более агрессивную позицию.

Только что компания Lingbo Technology, дочернее предприятие Ant Group, открыла исходный код крупномасштабной модели робота LingBot-VLA.

LingBot-VLA, как «интеллектуальная база» для реальных оперативных сценариев, позволяет роботам адаптироваться к различным типам тел и задачам.

Согласно данным компании Lingbo Technology, LingBot-VLA побил рекорд по наивысшему показателю успешности в ходе тестирования GM-100 на реальных устройствах, которое включало 100 реальных операционных задач.

▲ Роббиан-R1, первый робот компании Lingbo Technology

Это касается не только Ant Group; JD.com, Alibaba, Tencent, Huawei, BYD, Xiaomi — почти все технологические гиганты инвестируют в воплощенный интеллект.

В «Исследовательском отчете об индустрии человекоподобных роботов», представленном на Всемирной конференции по искусственному интеллекту 2024 года, отмечается:

Объем китайского рынка человекоподобных роботов в 2024 году достиг 2,76 млрд юаней, и ожидается, что к 2029 году он вырастет до 75 млрд юаней, а к 2035 году может достичь 300 млрд юаней.

Не говоря уже о далеком будущем, нынешний гала-концерт в честь Праздника весны может стать самым масштабным за всю историю по количеству роботов.

Ожидается, что несколько компаний, занимающихся разработкой систем «умного дома», продемонстрируют свою продукцию на сцене – не просто для показухи, а такую, которая действительно сможет петь, танцевать и читать рэп.

Робот оснащен как «мозгом», так и «телом» и готов войти в каждый дом.

На рисунке Helix 02 от Figure AI демонстрируется осуществимость «общей модели воплощенного интеллекта»:

Производителям на самом деле не нужно программировать каждую задачу по отдельности или собирать огромные объемы данных моделирования. Имея лишь достаточно мощную модель VLA, робот может понимать инструкции, знакомиться с окружающей средой и самостоятельно разрабатывать стратегии .

▲ Оно даже умеет экономить силы.

Подобно тому, как GPT является аналогом языка, а Helix — аналогом воплощенного интеллекта, сегодня робот может мыть посуду и закручивать винты, а завтра он сможет позаботиться о вашей повседневной жизни.

Наличие робота дома может оказаться не таким уж далёким будущим, как нам кажется.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.

ifanr | Оригинальная ссылка · Посмотреть комментарии · Sina Weibo