Мобильный помощник Doubao произвел фурор за рубежом, и иностранцы говорят: «Это первый по-настоящему полезный смартфон».

Удивительно, но в течение недели после выхода серии Huawei Mate 80 и первого складного телефона Samsung самым популярным устройством стал ZTE nubia M153, в котором представлена ​​предварительная версия мобильного голосового помощника Doubao.

Они не только были распроданы мгновенно после выпуска, но и первая партия инженерных прототипов была перепродана на платформах подержанных товаров на несколько сотен юаней дороже. По сравнению с официальной ценой в 3499 юаней, рыночный спрос действительно был высоким.

Несмотря на неоднократные заявления официальной команды Doubao Mobile Assistant о том, что текущая техническая предварительная версия не предназначена для обычных пользователей, она позиционируется скорее как полигон для демонстрации технологий и изучения экосистемы, привлекающий разработчиков и энтузиастов технологий к участию и ознакомлению с ней.

Но это не смогло ослабить энтузиазм публики по поводу возможности воспользоваться сервисом. Помимо таких простых операций, как заказ еды на вынос и публикация в социальных сетях, некоторые пользователи сети даже использовали его для отправки 30 резюме за 10 минут.

Однако это вызвало споры, и WeChat, Taobao и другие приложения начали исключать мобильный помощник Doubao, устанавливая «обнаружение аномалий» и другие барьеры.

В ответ на это были также внесены некоторые корректировки в возможности ИИ по работе с мобильными телефонами. В официальном заявлении указывается, что цель состоит в том, чтобы «способствовать формированию более четких и предсказуемых правил» и избежать повсеместного отрицания права пользователей на разумное использование ИИ.

Ло Юнхао опубликовал сообщение в поддержку, заявив, что это неудержимая технологическая революция, и люди запомнят этот исторический день. Компания Honor выразила свою поддержку, а Meizu выразила надежду на углубленное сотрудничество для создания более процветающей экосистемы.

После того, как Doubao Mobile Assistant завоевал популярность в Китае, он стал хитом и за рубежом. На платформе X множество иностранцев активно обсуждали его, а некоторые даже называли это «еще одним прорывом DeepSeek».

Интернет-пользователи за рубежом: первый по-настоящему значимый смартфон

Эта оценка давалась нелегко.

Тейлор Оган, генеральный директор Snow Bull Capital, опубликовал на платформе подробный отзыв, и его восторг буквально переполнял экран.

Его оценка была предельно ясна: это первый в мире по-настоящему значимый смартфон.

С помощью мобильного ассистента Doubao искусственный интеллект может полностью управлять телефоном — он может «понимать» интерфейс, выбирать или загружать приложения, нажимать кнопки, вводить текст, совершать телефонные звонки и даже выполнять целую цепочку многоэтапных задач.

Получив телефон, он перепробовал множество креативных приёмов. Например, он мог запросто сфотографировать станцию ​​замены батарей NIO и спросить: «Что это?», и искусственный интеллект мгновенно отвечал.

Сфотографировав вход в отель, Doubao может не только определить, какой это отель, но и забронировать номер в соответствии с потребностями Огана, а также проверить правила размещения с животными.

Чтобы добраться до парка на беспилотном такси, Doubao может спланировать маршрут и забронировать поездку от ближайшей точки отправления. Огану нужно лишь устно выразить свои намерения; Doubao позаботится обо всем остальном.

После того, как с помощью дрона было заказано два напитка, он быстро доставил заказ в ближайший отсек для хранения.

Идя по улице, Оган сфотографировал недавно открывшийся магазин и спросил, является ли он местным брендом. Доубао смог проверить информацию о регистрации предприятия и товарном знаке и решительно ответил: «Да».

Искусственный интеллект выполняет всю работу, а люди просто отдыхают.

После серии ловких маневров зарубежные пользователи сети были сильно шокированы.

Быстрый просмотр раздела комментариев показывает море лайков. Один пользователь сети заметил: «В этот момент операционная система стала менеджером, а телефон — исполнителем, а не просто инструментом». Другой неожиданно признался: «Мне и раньше нравились добао (разновидность паровых булочек), но теперь я люблю их еще больше».

Некоторые пользователи сети даже зашли так далеко, что стали называть себя "Wow Bro":

Это нечто совершенно иное. Я видел подобные вещи на корпоративном уровне, когда агент управляет вашим ПК и выполняет задачи, но действительно интересно иметь эту технологию на мобильном телефоне. Представьте, что произойдет, когда Google начнет внедрять это в устройства Pixel и практически во все телефоны Android…

Пиксель подумала про себя: «Что-то не так. Почему мне кажется, что кто-то на меня кликает?»

Конечно, были и несогласные. Один человек спросил: «Но действительно ли она умная? Может ли эта модель работать локально на устройстве?» Тейлор Оган ответил: «Она невероятно умная. Вы можете выбрать, запускать её на устройстве или в облаке».

На Reddit разгорелась не менее жаркая дискуссия.

Один пользователь сети прокомментировал: «Пока эти функции доступны только на устройстве (без использования облачных сервисов) и их использование необязательно, я поддерживаю это». Другой пользователь сети проницательно указал на истинное значение ИИ: «Именно этим и должен заниматься ИИ: экономить время людей, а не пытаться лишить их ценности».

Справедливости ради следует отметить, что после выхода мобильного помощника Doubao способы обмена информацией на платформе X стали всё более нетрадиционными. Некоторые использовали Doubao для заказа кофе, в то время как другие позволяли искусственному интеллекту Doubao управлять телефонами Android, имитируя жесты рук человека на страницах, стремясь к полной автоматизации.

Другой пользователь сети воспользовался мобильным помощником Doubao, чтобы заказать кокос. Поскольку сумма заказа не достигла минимальной суммы, Doubao любезно помог блогеру выбрать пакетик поваренной соли за 1,99 юаня, чтобы довести сумму заказа до минимальной.

В своем предыдущем обзоре мобильного помощника Doubao APPSO отметил, что его первое впечатление заключалось в том, что телефон стал «тоньше» и что он «упростил» возможности различных приложений, сделав взаимодействие более естественным, интуитивным и эффективным.

Вопрос в том, как это делается? И чем это отличается от агента, использующего «телефон»?

После недели использования мобильного помощника Doubao, APPSO также раскрыла дополнительные технические подробности о его работе.

Я раскрыл секреты использования мобильного помощника Doubao для управления вашим телефоном.

До выхода Doubao Mobile Assistant индустрия мобильных телефонов уже довольно давно экспериментировала с технологиями AI+.

Производители аппаратного обеспечения мобильных телефонов пытаются устранить барьеры между приложениями и обеспечить «доступ в один клик», используя возможности искусственного интеллекта на системном уровне. Например, агенты ИИ от ведущих производителей мобильных телефонов, таких как Huawei, Xiaomi, Vivo и Honor, продемонстрировали такие функции, как автоматическая отправка сообщений и выполнение многоэтапных задач в различных условиях.

Хотя эти демонстрации несколько различаются в конкретных сценариях и методах реализации, основная логика остается неизменной: понимание намерений пользователя с помощью больших моделей ИИ и их сочетание с моделированием действий пользователя для достижения автоматизированного выполнения задач в различных приложениях.

Звучит довольно неправдоподобно, но на самом деле… есть еще много возможностей для улучшения.

Судьба Doubao Mobile Assistant еще больше подогрела онлайн-дискуссии. Что еще важнее, судя по моему предыдущему опыту, Doubao Mobile Assistant действительно выводит управление телефоном с помощью ИИ на приемлемый уровень, не ограничиваясь несколькими сценариями, а способный плавно и естественно выполнять длительные и сложные задачи через графический интерфейс.

APPSO обнаружила технический отчет, опубликованный командой ByteDance на известной платформе препринтов ArXiv, информация из которого может объяснить ключевые принципы его работы.

Вот ссылка: https://arxiv.org/abs/2509.02544

Возможности графического пользовательского интерфейса Doubao Mobile Assistant основаны на модели UI-TARS, разработанной командой Seed компании ByteDance. Она объединяет визуальное восприятие экрана, логическое мышление, определение местоположения элементов интерфейса и управление ими, а её версия с открытым исходным кодом в настоящее время является самой популярной моделью многомодального интеллектуального агента с открытым исходным кодом.

Согласно техническому отчету UI-TARS 2.0, сила этой модели заключается в том, что она не является простой модульной сборкой, а скорее использует сквозной подход к обучению, интегрирующий восприятие, рассуждение, действие и память.

Данные не лгут; в тестах производительности графического интерфейса пользователя UI-TARS-2 показывает remarkably хорошие результаты.

  • Online-Mind2Web набрал 88,2 балла.
  • Оценка OSWorld: 47,5
  • Программа WindowsAgentArena набрала 50,6 балла.
  • Оценка AndroidWorld: 73,3

Эти результаты не только значительно превосходят показатели модели предыдущего поколения, но и превосходят сильные базовые модели, такие как Claude и OpenAI, в нескольких сценариях. В частности, оценка AndroidWorld в 73,3 балла более чем на 20 пунктов выше, чем у модели OpenAI CUA-o3, что демонстрирует высокую конкурентоспособность.

В игровой среде UI-TARS-2 показал средний стандартизированный результат 59,8 по набору из 15 игр, что составляет примерно 60% от результатов человека. По сравнению с OpenAI CUA и Claude Computer Use, UI-TARS-2 продемонстрировал улучшение производительности в 2,4 и 2,8 раза соответственно.

Что это значит? Это значит, что искусственный интеллект практически достиг уровня среднего игрока-человека в играх.

В LMGame-Bench он по-прежнему может конкурировать с самыми передовыми моделями с закрытым исходным кодом, что еще раз доказывает его надежность при длительном анализе игровых процессов.

Что еще более впечатляет, UI-TARS-2 может не только обрабатывать задачи графического интерфейса пользователя, но и расширять свои возможности за счет GUI-SDK, интегрируясь с системными ресурсами, такими как терминалы и внешние инструменты. Он конкурентоспособен в задачах поиска информации (BrowseComp 29,6 баллов) и задачах разработки программного обеспечения (Terminal Bench 45,3 балла, SWE-Bench Verified 68,7 баллов).

Одна и та же модель может использоваться где угодно; это свидетельствует о её универсальности.

Стоит отметить, что, по данным источников, близких к команде Doubao, Doubao Mobile Assistant использует собственную версию модели UI-TARS, которая отличается более высокой производительностью по сравнению с версией с открытым исходным кодом и специально оптимизирована для мобильных устройств. Это может объяснить, почему Doubao Mobile Assistant обеспечивает такой удобный пользовательский интерфейс.

Мобильный ассистент Doubao действительно обладает некоторыми полезными функциями.

В заключение: в технологической индустрии могло бы быть больше «исключений».

Для меня, как для редактора, давно специализирующегося на технологических продуктах, этот год стал поистине знаменательным. В индустрии, которая, кажется, стремится вместить в телефон всё подряд, появились два исключения, каждое из которых раздвигает границы дизайна и взаимодействия .

Один из примеров — iPhone Air. Поскольку серия Pro неизбежно движется к завершению наращивания функций, эта одержимость легкостью и тонкостью может оказаться бесполезной в глазах энтузиастов технических характеристик и даже может заставить людей не понять, является ли это регрессом или эволюцией, пока вы не возьмете его в руки и не поймете, что сама легкость — это функция.

С другой стороны, Doubao Mobile Assistant находится на противоположном полюсе дизайна пользовательского интерфейса. Он не требует от вас поиска сервисов; вместо этого он позволяет сервисам самим приходить к вам. Он может даже перевернуть парадигму GUI (графического пользовательского интерфейса), а это значит, что однажды этот экран может и вовсе перестать быть необходимым.

Одно — аппаратное обеспечение, другое — программное, но все они ведут к одной и той же цели. iPhone Air уменьшил физические габариты, а мобильный помощник Doubao устранил неудобные взаимодействия.

Вы обнаружите, что когда компании, занимающиеся искусственным интеллектом, участвуют в разработке аппаратного обеспечения, их подход к проектированию взаимодействия отличается от подхода традиционных производителей оборудования.

Компания OpenAI также сотрудничает с Джони Айвом, легендарным бывшим дизайнером Apple, для создания аппаратного обеспечения с использованием искусственного интеллекта. Сэм Альтман однажды заявил, что это устройство призвано переосмыслить взаимодействие: вместо набора приложений ИИ будет служить основным интерфейсом и операционным слоем.

Конечно, история показывает, что внедрение таких новых технологий неизбежно столкнется с трудностями роста: адаптация, конфиденциальность, экосистема… и взаимодействие интересов различных сторон. «Двусторонняя гонка» между передовыми технологиями и их широким применением займет время, но это неизбежная тенденция.

Андрей Карпати, соучредитель OpenAI, недавно поделился своими прогнозами относительно будущего интерактивных технологий:

В эпоху глубокого взаимодействия человека и машины продукты с чрезвычайно сложными пользовательскими интерфейсами (с большим количеством ползунков, переключателей и меню), не поддерживающие скрипты и построенные на непрозрачных, пользовательских бинарных форматах, обречены на провал (ngmi).

В будущем искусственный интеллект будет становиться все более искусным в понимании и манипулировании графическими интерфейсами пользователя (UI/UX) (как это видно на примере передовых проектов, таких как Operator). Однако я подозреваю, что продукты, которые просто ждут, пока это будущее материализуется, не адаптируясь к текущему уровню технологического развития, не добьются успеха.

Само по себе стремление быть первопроходцем достойно восхищения, и мы надеемся увидеть больше «нестандартных» личностей в технологической индустрии.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.

ifanr | Оригинальная ссылка · Посмотреть комментарии · Sina Weibo