Появился робот, способный выполнять работу по дому во время ходьбы, и видеоролик, снятый одним кадром, на котором он убирает гостиную, стал вирусным за рубежом.

После того, как робот продемонстрировал свои разнообразные музыкальные способности на гала-концерте в честь Весеннего фестиваля, трудно не представить себе дальнейшее: поторопитесь, сможет ли легендарный робот для уборки дома сделать это еще быстрее?

В марте этого года компания Figure, занимающаяся производством человекоподобных роботов, выпустила новое видео, в котором не было танцев или сальто; оно просто демонстрировало навыки робота в выполнении домашних дел.

Робот Figure 03 входит в захламленную гостиную, осматривается, а затем приступает к работе: собирает игрушки с пола и складывает их в коробку, распыляет спрей на журнальный столик и вытирает его полотенцем, взбивает подушки на диване и возвращает их на место, и даже берет пульт и нажимает кнопку питания, чтобы выключить телевизор. Весь процесс выполняется без каких-либо команд со стороны человека или управления с помощью пульта дистанционного управления и снимается одним непрерывным кадром.

Видео быстро стало вирусным в социальных сетях. По сравнению с различными «крутыми» демонстрациями роботов, он делает совершенно обычные вещи — то, что вам не хочется делать после возвращения домой каждый день, но что приходится делать в любом случае.

Именно это и хочет донести Figure.

Это не новое оборудование, это новый «мозг».

Примечательно, что компания Figure не выпускает нового робота; аппаратная часть остаётся той же, что и у Figure 03, выпущенной в октябре прошлого года. Обновление связано с совершенно новой системой управления на основе искусственного интеллекта — Helix.

Главный прорыв Helix 02 заключается в одной концепции: полной автономности всего тела. Предыдущие человекоподобные роботы, включая систему Helix предыдущего поколения от Figure, могли управлять в основном только верхней частью тела; способность стоять неподвижно и дотягиваться до чего-либо считалась достаточной. При движении системе необходимо было сначала остановить движения рук, стабилизировать тело, сделать шаг, снова остановиться, а затем снова дотянуться.

Такой шаблон "ходьба-остановка-действие-остановка-ходьба" означает, что если робот что-либо делает, это может занять в десять раз больше времени, чем вам потребовалось бы сделать это самостоятельно, что является полным забеганием вперед.

Helix 02 полностью оптимизировал этот процесс. Он использует единую нейронную сеть для одновременного управления ходьбой, балансом и манипуляциями. Робот может ходить, неся миску, закрывать дверь бедрами, держа что-то в руках, и даже открывать дверцу посудомоечной машины ногами, когда его руки заняты.

Это звучит как самое естественное действие, которое человек совершил бы, занимаясь домашними делами, но для роботов это проблема, которая десятилетиями мучает академические круги и промышленность: локоманимация, то есть единое управление движением и манипуляцией.

Даже Маск не удержался и спросил: действительно ли он автономен?

Оборудование, разработанное для всей семьи.

Архитектура Helix 02 разделена на три слоя, что можно сравнить с тем, как мыслит человек:

Система 2 (медленное мышление) отвечает за семантическое понимание: осмотр гостиной, оценка беспорядка, определение мест, куда что следует поставить, а также определение того, что нужно сделать в первую очередь, а что — позже. Этот уровень отвечает за «понимание» и «планирование».

Система 1 (Быстрое мышление) отвечает за преобразование понимания в действие: она преобразует данные со всех датчиков, включая зрение, осязание и проприоцепцию, в целевые положения для всех суставов тела с частотой 200 раз в секунду. Этот слой отвечает за «принятие решений».

Система 0 (инстинктивный слой) — это самое значительное дополнение на этот раз. Она работает с частотой 1000 раз в секунду и отвечает за равновесие, контакт и координацию всего тела. Рисунок обучил этот базовый контроллер, используя более 1000 часов данных о движениях человека и обучение с подкреплением в смоделированных средах. По словам Рисунок, эта нейронная сеть с 10 миллионами параметров заменила исходные 109 504 строки написанного вручную кода на C++.

В результате такой трехслойной структуры робот больше не выглядит как машина, выполняющая запрограммированные инструкции, а скорее как человек, «занимающийся домашними делами» — его движения согласованы и ритмичны, и он иногда принимает, казалось бы, «интеллектуальные» спонтанные решения (например, отодвигает чашку, чтобы проверить наличие пятен).

Возможности Helix 02 также неразрывно связаны с поддержкой аппаратной платформы Figure 03. Этот робот имеет рост 168 см (5 футов 8 дюймов), весит 61 кг и может работать до 5 часов от одной зарядки. По сравнению со своим предшественником, Figure 02, он имеет несколько ключевых изменений:

Камеры и тактильные датчики, встроенные в ладони. В каждую ладонь встроена широкоугольная камера, обеспечивающая визуальную обратную связь на близком расстоянии, когда основная камера закрыта (например, при попытке дотронуться до чего-либо в шкафу). На каждом кончике пальца расположен тактильный датчик, достаточно чувствительный для обнаружения силы всего в 3 грамма. Это позволяет роботу точно брать одну цель из кучи разбросанных мелких предметов и даже точно дозировать 5 миллилитров жидкости с помощью шприца.

Весь корпус покрыт мягкими материалами. Это уже не холодная металлическая оболочка, а съемная, моющаяся мягкая ткань со стратегически расположенными вставками из пеноматериала различной плотности, предотвращающими травмы от защемления.

Беспроводная зарядка. В подошву его ног встроена индукционная катушка; для зарядки мощностью 2 киловатта достаточно просто встать на зарядную базу. Для подключения к сети не требуется вмешательство человека; робот может самостоятельно дойти до зарядной станции.

Эти детали указывают на четкое позиционирование продукта: Figure 03 — это не лабораторный прототип, а потребительский продукт, предназначенный для использования в домашних условиях.

Когда робот Figure был выпущен в конце года, в качестве демонстрационной площадки была выбрана кухня, где робот автономно выполнил целую задачу, длившуюся 4 минуты.

Он подходит к посудомоечной машине, открывает дверцу, достает посуду, идет к шкафу, чтобы убрать ее, затем возвращается, чтобы загрузить грязную посуду, закрывает дверцу и запускает машину. Весь процесс состоит из 61 последовательного, непрерывного движения. На рисунке это описывается как «самая длинная и сложная автономная задача, когда-либо выполненная человекоподобным роботом».

Демонстрация в марте еще больше усложнила ситуацию, переместившись в гостиную. Хотя кухня и сложна, расположение предметов там относительно стабильно, а пути передвижения предсказуемы. Гостиная же – это пространство, которое меняется каждый день.

Игрушки разбросаны в разных местах, подушки дивана находятся в разном состоянии, а количество чашек на журнальном столике варьируется. Физическое поведение мягких предметов (полотенец, подушек) непредсказуемо. Проходы между предметами мебели узкие, приходится протискиваться боком. Для многих действий требуются обе руки, в то время как для других необходимо временно освободить одну руку.

Кроме того, в ходе этой демонстрации также использовалось оборудование — распылитель и салфетки, кнопки дистанционного управления — что требовало от робота не только понимания того, «что» это за предмет, но и того, «как» его использовать.

Рисунок подчеркивает ключевой момент: от кухни до гостиной Helix 02 не менял никаких алгоритмов и не проводил никаких специальных инженерных оптимизаций; он просто увеличил объем обучающих данных. Используя ту же общую архитектуру, подача большего количества данных позволила ему освоить новые навыки.

Это наводит на интересную мысль: если для уборки гостиной достаточно «посмотреть демонстрацию еще несколько раз», то как насчет уборки спальни, наведения порядка в гардеробе, полива растений и кормления кошки? Делать есть чем!

Действительно ли наступила «эра домашних роботов»?

Сначала вылейте на него ведро холодной воды.

Ориентировочная цена Figure 03 в настоящее время составляет от 50 000 до 100 000 долларов. Даже с учетом предлагаемой компанией Figure бизнес-модели «робот как услуга», приносящей примерно 5000 долларов дохода с каждого робота в год, эта цена все еще недоступна для среднестатистической семьи. Более того, всегда будет существовать разрыв между демонстрационными видеороликами и реальными условиями в домашних условиях.

Кроме того, хотя гостиная на видео выглядит очень «обычной», это все же контролируемая обстановка. В реальных семьях есть домашние животные, дети, углы, заваленные коробками с доставкой, и горы одежды, которую вы не стирали три недели.

Однако, с другой точки зрения, значимость Helix 02 заключается не в его немедленном внедрении, а в доказательстве осуществимости следующего пути: использование единой универсальной архитектуры ИИ + больше данных = больше навыков для домохозяйств.

Это похоже на закон масштабирования больших языковых моделей. ChatGPT не был специально запрограммирован для написания стихов или кода — он просто развил эти способности, обучаясь на большем количестве текста.

Helix 02 демонстрирует ту же логику, что и в физическом мире: нейронная сеть, которую не нужно перестраивать для каждой новой задачи, а просто требуется больше данных о движении.

Если эта логика верна, то скорость эволюции человекоподобных роботов будет зависеть не от количества написанных инженерами строк кода, а от того, сколько домашних дел они «видят». А сбор данных о домашних делах — это как раз то, что проще всего масштабировать: в конце концов, каждый человек ежедневно генерирует эти данные у себя дома.

В настоящее время производственная мощность завода BotQ составляет 12 000 единиц в год, а цель – достичь общего объема производства в 100 000 единиц в течение четырех лет. Каждый отгруженный робот представляет собой терминал сбора данных, и каждый новый сценарий, с которым он сталкивается в разных домах, будет передаваться обратно по беспроводной связи миллиметрового диапазона со скоростью 10 Гбит/с в качестве обучающего материала для следующей версии Helix.

По словам Бретта Эдкока, причиной, сдерживающей их поставки, является не спрос — сегодня они могли бы продать миллиард единиц — а то, что искусственный интеллект недостаточно универсален. Однако демонстрация Helix 02 в гостиной приближает их на один шаг к этой цели «универсальности».

От танцев до уборки гостиной — шаг, который сделал Helix 02, возможно, ближе к будущему, чем любой сальто назад. Роботам больше не нужно доказывать, насколько они круты; им нужно доказывать, насколько они полезны.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете быстро найти еще больше интересного контента.