Мобильный помощник Doubao произвел сенсацию за рубежом: иностранцы говорили: «Это первый по-настоящему осмысленный смартфон».

Удивительно, но на следующей неделе после выпуска серии Mate 80 от Huawei и первого тройного телефона Samsung самым популярным устройством стал ZTE Nubia M153, на котором реализована предварительная версия технологии мобильного помощника Doubao.
Они не только были распроданы сразу после выпуска, но и первая партия инженерных прототипов была перепродана на подержанных площадках на несколько сотен юаней дороже. По сравнению с официальной ценой в 3499 юаней, спрос на рынке действительно был высоким.
Несмотря на неоднократные заявления официальной команды Doubao Mobile Assistant о том, что текущая техническая предварительная версия не предназначена для обычных потребителей, она позиционируется скорее как испытательный полигон для демонстрации технологий и исследования экосистемы, привлекая разработчиков и технических энтузиастов к участию и тестированию.

Но это не могло охладить энтузиазм публики. Помимо базовых функций, таких как заказ еды на вынос и публикация постов в социальных сетях, некоторые пользователи сети даже использовали его для отправки 30 резюме за 10 минут.
Однако возникли разногласия: WeChat, Taobao и другие приложения начали исключать Doubao Mobile Assistant, устанавливая «обнаружение аномалий» и другие барьеры.
Официальная реакция также направлена на корректировку некоторых возможностей ИИ по управлению мобильными телефонами. В официальном заявлении указывается, что цель — «способствовать формированию более чётких и предсказуемых правил» и избежать тотального лишения пользователей права разумно использовать ИИ.
Ло Юнхао опубликовал сообщение в поддержку, заявив, что это неостановимая технологическая революция, и люди запомнят этот исторический день. Honor выразила своё приветствие, а Meizu выразила надежду на глубокое сотрудничество для создания более процветающей экосистемы.

Завоевав популярность в Китае, мобильный помощник Doubao стал хитом и за рубежом. На платформе X его активно обсуждали иностранцы, а некоторые даже назвали его «ещё одним моментом DeepSeek».
Зарубежные пользователи сети: первый по-настоящему значимый смартфон
Эта оценка далась нелегко.
Тейлор Оган, генеральный директор Snow Bull Capital, опубликовал на платформе длинный обзор, его восторг буквально выплеснулся на экран.
Его оценка была однозначной: это первый в мире по-настоящему осмысленный смартфон.

С помощью Doubao Mobile Assistant ИИ может полностью контролировать телефон — он может «понимать» интерфейс, выбирать приложения или загружать приложения, нажимать кнопки, вводить текст, совершать телефонные звонки и даже выполнять целую цепочку многошаговых задач.
Получив телефон, он перепробовал множество креативных трюков. Например, он мог мимоходом сфотографировать станцию замены аккумуляторов NIO и спросить: «Что это?», и ИИ мгновенно отвечал.

Просто сфотографировав вход в отель, Doubao может не только определить, какой это отель, но и забронировать номер в соответствии с потребностями Огана, а также проверить политику отеля в отношении домашних животных.

Чтобы добраться до парка на беспилотном такси, Дубао может спланировать маршрут и забронировать поездку от ближайшего места посадки. Огану нужно лишь устно выразить своё намерение; Дубао сделает всё остальное.

После того, как я заказал с его помощью два напитка, дрон-доставщик быстро доставил заказ в ближайший шкафчик.

Прогуливаясь по улице, Оган сфотографировал недавно открывшийся магазин и спросил, местный ли это бренд. Дубао проверил информацию о регистрации компании и товарном знаке и решительно ответил: «Да».

ИИ делает всю работу, пока люди просто отдыхают.
После серии плавных маневров зарубежные пользователи сети были сильно шокированы.

Быстрый просмотр комментариев открывает море лайков. Один пользователь сети заметил: «Сейчас операционная система стала менеджером, а телефон — исполнителем, а не просто инструментом». Другой неожиданно признался: «Мне и раньше нравились дубао (паровые булочки), но теперь я люблю их ещё больше».
Некоторые пользователи сети даже зашли так далеко, что назвали себя «Ух ты, бро»:
Это нечто совершенно новое. Я видел подобное на корпоративном уровне, где агент управляет вашим ПК и выполняет задачи, но очень интересно использовать эту технологию на мобильном телефоне. Представьте, что произойдёт, когда Google начнёт делать то же самое на устройствах Pixel и практически на каждом Android-смартфоне…

Пиксель подумала про себя: «Что-то не так. Почему у меня такое чувство, будто на меня кто-то нажимает?»
Конечно, были и несогласные. Один из них спросил: «Но действительно ли это интеллектуально? Может ли эта модель работать локально на устройстве?» Тейлор Оган ответил: «Она невероятно интеллектуальна. Вы можете выбрать, запускать её на устройстве или в облаке».

Не менее бурная дискуссия разгорелась и на Reddit.
Один из пользователей сети прокомментировал: «Пока эти функции доступны локально на устройстве (без использования облачных сервисов) и их использование необязательно, я поддерживаю это». Другой пользователь сети проницательно указал на истинное предназначение ИИ: «Вот чем должен заниматься ИИ: экономить время людей, а не пытаться обесценить их».

Справедливости ради, после выхода Doubao Mobile Assistant пользователи сети стали использовать всё более необычные способы обмена информацией на платформе X. Некоторые использовали Doubao для заказа кофе, в то время как другие использовали искусственный интеллект Doubao для управления телефонами Android, имитируя жесты человеческой руки на страницах, стремясь к полной автоматизации.
Другой пользователь сети воспользовался мобильным помощником Doubao, чтобы заказать кокос. Поскольку сумма заказа не достигала минимальной, Doubao заботливо помог блогеру выбрать пакет поваренной соли за 1,99 юаня, чтобы достичь минимальной суммы заказа.

В своем предыдущем обзоре Doubao Mobile Assistant APPSO упомянул, что его самое первое впечатление было то, что телефон стал «тоньше» и что он «упростил» возможности различных приложений, сделав взаимодействие более естественным, интуитивно понятным и эффективным.
Вопрос в том, как это делается? И чем это отличается от агента «использования телефона»?
После недельного использования мобильного помощника Doubao компания APPSO раскрыла дополнительные технические подробности его работы.
Я раскрыл секреты использования мобильного помощника Doubao для управления вашим телефоном.
До выхода Doubao Mobile Assistant индустрия мобильных телефонов уже довольно давно экспериментировала с AI+.
Производители мобильных телефонов пытаются устранить барьеры между приложениями и добиться «доступа в один клик», используя возможности системного ИИ. Например, ИИ-агенты от ведущих производителей мобильных телефонов, таких как Huawei, Xiaomi, Vivo и Honor, продемонстрировали такие функции, как автоматическая отправка сообщений и выполнение многоэтапных задач в различных условиях.
Хотя эти демонстрации немного различаются по конкретным сценариям и методам реализации, основная логика остается той же: понимание намерений пользователя с помощью больших моделей ИИ и объединение его с моделируемыми пользовательскими операциями для достижения автоматизированного выполнения задач в приложениях.
Это звучит довольно неправдоподобно, но на самом деле… есть еще много возможностей для совершенствования.

Судьба Doubao Mobile Assistant ещё больше разожгла онлайн-дискуссии. Что ещё важнее, судя по моему предыдущему опыту, Doubao Mobile Assistant действительно выводит работу телефона с искусственным интеллектом на практический уровень, не ограничиваясь несколькими сценариями, а способный плавно и естественно выполнять длительные и сложные задачи через графический интерфейс.
APPSO обнаружила технический отчет, опубликованный командой ByteDance на известной платформе препринтов ArXiv, информация из которого может объяснить ключевые принципы, лежащие в его основе.
Вот ссылка: https://arxiv.org/abs/2509.02544

Возможности графического пользовательского интерфейса Doubao Mobile Assistant основаны на модели UI-TARS, разработанной командой Seed компании ByteDance. Она объединяет в себе понимание визуальной составляющей экрана, логическое мышление, расположение элементов интерфейса и их функционирование, а её версия с открытым исходным кодом в настоящее время является самой популярной моделью многомодального интеллектуального агента с открытым исходным кодом.
Согласно техническому отчету UI-TARS 2.0, сила этой модели заключается в том, что она не является простой модульной сборкой, а использует комплексный подход к обучению, объединяющий восприятие, рассуждение, действие и память.

Данные не лгут: в тестах производительности графического интерфейса UI-TARS-2 показывает себя исключительно хорошо.
- Online-Mind2Web набрал 88,2 балла.
- Оценка OSWorld: 47,5
- WindowsAgentArena набрал 50,6 балла.
- Оценка AndroidWorld: 73,3
Эти результаты не только значительно превосходят результаты модели предыдущего поколения, но и превосходят сильные базовые модели, такие как Claude и OpenAI, в нескольких сценариях. В частности, оценка AndroidWorld, равная 73,3, более чем на 20 баллов превышает оценку модели OpenAI CUA-o3, что свидетельствует о высокой конкурентоспособности.

В игровой среде UI-TARS-2 показал средний стандартизированный результат 59,8 в тестовом наборе из 15 игр, что составляет примерно 60% от производительности человека. По сравнению с OpenAI CUA и Claude Computer Use, UI-TARS-2 продемонстрировал прирост производительности в 2,4 и 2,8 раза соответственно.
Что это значит? Это означает, что ИИ практически достиг уровня среднестатистического игрока-человека в играх.

В LMGame-Bench он по-прежнему может конкурировать с самыми передовыми моделями с закрытым исходным кодом, что еще раз доказывает его надежность в долгосрочных игровых рассуждениях.
Ещё более впечатляюще то, что UI-TARS-2 способен не только решать задачи графического интерфейса, но и расширять свои возможности благодаря GUI-SDK, интегрируясь с системными ресурсами, такими как терминалы и внешние инструменты. Он конкурентоспособен в задачах поиска информации (BrowseComp 29,6 балла) и программной инженерии (Terminal Bench 45,3 балла, SWE-Bench Verified 68,7 балла).
Одну и ту же модель можно использовать где угодно; это свидетельствует о ее универсальности.
Стоит отметить, что, по словам источников, близких к команде Doubao, Doubao Mobile Assistant использует собственную версию UI-TARS, которая обеспечивает превосходную производительность по сравнению с версией с открытым исходным кодом и специально оптимизирована для мобильных приложений. Это может объяснять столь плавный пользовательский опыт Doubao Mobile Assistant.
У мобильного помощника Doubao есть некоторые реальные возможности.
В заключение: в технологической отрасли может быть больше «отличников».
Для меня, как редактора, долгое время занимающегося технологическими продуктами, этот год стал поистине знаменательным. В индустрии, которая, похоже, стремится втиснуть всё в телефон, появились два аутсайдера, каждый из которых раздвигает границы дизайна и взаимодействия .
Один из них — iPhone Air. Поскольку серия Pro неизбежно подходит к концу, наращивая функциональность, эта одержимость лёгкостью и тонкостью может оказаться бесполезной в глазах энтузиастов, и люди могут даже не понять, регресс это или эволюция, пока не возьмут устройство в руки и не поймут, что лёгкость сама по себе — это функция.

Doubao Mobile Assistant, с другой стороны, представляет собой противоположную крайность в дизайне пользовательского интерфейса. Он не требует от вас поиска услуг, а позволяет им прийти к вам. Он может даже перевернуть парадигму графического пользовательского интерфейса (GUI), а это значит, что однажды этот экран может вообще не понадобиться.

Один из них — аппаратный, другой — программный, но они ведут к одной и той же цели. iPhone Air уменьшил физические размеры, а Doubao Mobile Assistant устранил громоздкие взаимодействия.
Вы обнаружите, что когда компании, занимающиеся разработкой ИИ, занимаются разработкой оборудования, их подход к проектированию взаимодействия отличается от подхода традиционных производителей оборудования.
OpenAI также работает с Джони Айвом, легендарным бывшим дизайнером Apple, над созданием оборудования для искусственного интеллекта. Сэм Альтман как-то рассказал, что это устройство призвано переосмыслить взаимодействие: вместо множества приложений основным интерфейсом и рабочим уровнем станет ИИ.
Конечно, история показывает, что внедрение таких новых технологий неизбежно столкнётся с трудностями роста: адаптацией, конфиденциальностью, экосистемой… и взаимодействием интересов различных сторон. «Двусторонняя гонка» между передовыми технологиями и их широким применением займёт время, но это неизбежная тенденция.

Соучредитель OpenAI Андрей Карпати недавно высказал свои прогнозы относительно будущего взаимодействия:
В эпоху тесного взаимодействия человека и машины продукты с чрезвычайно сложными пользовательскими интерфейсами (с большим количеством ползунков, переключателей и меню), не поддерживающие скрипты и созданные на основе непрозрачных, специальных двоичных форматов, обречены на провал (ngmi).
В будущем ИИ будет всё лучше понимать и использовать человеческие графические интерфейсы (UI/UX) (как это видно на примере таких передовых проектов, как Operator). Однако я подозреваю, что продукты, которые просто ждут, когда это будущее материализуется, не адаптируясь к текущему уровню развития технологий, вряд ли будут иметь успех.
Смелость быть пионером сама по себе достойна восхищения, и мы надеемся увидеть больше «отличников» в технологической отрасли.
#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (WeChat ID: ifanr), где вы сможете как можно скорее ознакомиться с еще более интересным контентом.
ifanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo