Только что бизнес-группа ATH (Alibaba’s Internet Technology and Services) компании Alibaba преподнесла сенсационную новость: «Укун» (Царь обезьян)! С участием элитных сил корпоративного уровня, «лобстеры» (имеется в виду технологические гиганты Alibaba) действительно устроят настоящий переполох.

Вчера вечером Alibaba неожиданно объявила о создании бизнес-группы Alibaba Token Hub (ATH), непосредственно возглавив которую генеральный директор У Юнмин. Это может стать самой важной организационной реструктуризацией Alibaba в эпоху искусственного интеллекта.

Токены: универсальная валюта эпохи искусственного интеллекта.

Логика У Юнмина заключается в том, что в будущем значительная часть цифровой работы будет поддерживаться и выполняться «сотнями миллиардов агентов искусственного интеллекта», а работа этих агентов будет управляться токенами, генерируемыми моделью.

Создание, распределение и применение токенов станут новым основным направлением деятельности Alibaba.

Во внутренней служебной записке также фигурировало название, впервые появившееся в открытом доступе: Wukong Business Unit. Официальное позиционирование Wukong Business Unit звучит так: «Создание рабочей платформы для B2B-бизнеса, основанной на искусственном интеллекте, с глубокой интеграцией возможностей моделей в корпоративные рабочие процессы».

Иными словами, оригинальный DingTalk занял более важную стратегическую позицию, работая вместе с Qianwen для поддержки целей Alibaba в области искусственного интеллекта в секторах B2B и B2C соответственно.

На этой пресс-конференции бизнес-подразделение WuKong представило свой первый проект с момента своего основания – флагманское приложение AI toB «WuKong», которое также является первой рабочей платформой, изначально разработанной для искусственного интеллекта и ориентированной на корпоративных интеллектуальных агентов.

Сегодня второй день с момента создания бизнес-группы ATH, и генеральный директор Alibaba Group У Юнмин также присутствовал на сегодняшнем мероприятии по запуску проекта «Укун».

Недавно, после того как в социальных сетях заполонил тренд "разведение лобстеров", у всех более или менее сложилось впечатление, что искусственный интеллект действительно может управлять компьютерами и помогать в решении задач.

Однако, наряду с этим хаосом, омары продолжали удалять электронные письма, ИИ мог произвольно считывать конфиденциальные данные, и большинство корпоративных пользователей на этом останавливались, получая от ИТ-отдела компании простое сообщение: «Эта штука не соответствует требованиям».

Текущее состояние ИИ-агентов и их потенциал для широкого внедрения по-прежнему остаются техническими вопросами. Реальная проблема заключается в том, осмелятся ли организации их использовать .

Компания APPSO вкратце изложила основные моменты пресс-конференции для всех присутствующих:

  • WuKong: Первая в мире рабочая платформа, созданная на основе искусственного интеллекта и использующая интеллектуальных агентов для корпоративного использования, обеспечивающая повышенную безопасность и коммерческие результаты.
  • RealDoc — первая файловая система, разработанная специально для искусственного интеллекта: каждая операция отслеживается и может быть отменена.
  • Теперь DingTalk полностью поддерживает интерфейс командной строки: базовый код был переписан для создания собственного языка программирования для ИИ, что обеспечивает безопасный доступ к приложениям и данным DingTalk через интерфейс командной строки.
  • Топ-10 решений для индустрии OPT: электронная коммерция от одного человека, магазин от одного человека, блогер, делящийся знаниями от одного человека… Навыки — залог производительности.
  • Торговая площадка возможностей ИИ: запущена полноценная экосистема навыков корпоративного уровня, полностью интегрированная в единую систему сканирования безопасности и иерархического управления.
  • Аппаратное обеспечение с поддержкой ИИ: дебют карты записи A1 Pro и наушников Cleer H1 AI.
  • Архитектура корпоративной безопасности нативного уровня: изоляция в изолированной среде и сквозной аудит, позволяющие предприятиям смело использовать ИИ.

DingTalk создан для искусственного интеллекта.

Прежде чем понять, что такое Wukong, нам нужно развеять стереотип: это определенно не «DingTalk с добавленным диалоговым окном ИИ». Это утверждение стоит повторить — Wukong — это не DingTalk с добавленной функцией ИИ .

За последние два года мы видели слишком много примеров «продуктов плюс ИИ»: Word добавил Copilot, WeChat — Yuanbao (функция для добавления ИИ в продукты), а веб-страницы — кнопки для создания кратких обзоров. Логика этих продуктов такова: исходные функции остаются неизменными, а ИИ добавляется сверху в качестве вспомогательного слоя, помогающего писать, редактировать и создавать краткие обзоры.

Логика Укуна совершенно иная.

Wukong — это рабочая платформа, изначально созданная на основе искусственного интеллекта и ориентированная на корпоративных интеллектуальных агентов . Она может управлять нашими компьютерами, редактировать локальные файлы, вызывать настольные приложения и подключаться ко всему набору продуктов DingTalk, включая документы, согласования, расписания и заметки.

Когда вы говорите Укуну: «Помогите мне собрать все записи о посещениях клиентов за прошлую неделю в еженедельный отчет и отправить его генеральному директору Чжану для подтверждения».

Wukong не предоставит вам шаблон для самостоятельного заполнения. Вместо этого он напрямую откроет папку с журналами посещений на вашем компьютере, прочтет каждый журнал, сгенерирует еженедельный отчет, сохранит его в указанном месте, а затем отправит г-ну Чжану на утверждение через DingTalk.

За весь разговор вы произнесли всего одно предложение.

Что еще более важно, ваш телефон может удаленно отдавать команды Вуконгу для выполнения задач в вашем локальном окружении. Вам не нужно сидеть за компьютером. По дороге на встречу с клиентом просто отправьте сообщение, и Вуконг завершит работу за вас дома.

Это архитектура работы агента, основанная на принципе «локальное выполнение + удаленное управление», что также является новым способом работы, который определяет Вуконг — вы можете добиться результата, просто произнеся предложение.

▲Попробуйте здесь: https://www.dingtalk.com/wukong

Wukong и OpenClaw: Решение одной и той же задачи с использованием разных бланков ответов.

Первая реакция многих людей: разве это не "китайская версия OpenClaw"?

На первый взгляд, в обоих случаях речь идёт об искусственном интеллекте, управляющем компьютерами, но их взаимоотношения ближе к отношениям между «сообществом открытого исходного кода Linux» и «Red Hat Enterprise Edition». Они используют одни и те же базовые технологии, но нацелены на совершенно разные сферы деятельности.

OpenClaw доказал концепцию, согласно которой агенты искусственного интеллекта могут управлять компьютерами . Он использует «визуальное моделирование» и встроенную командную строку операционной системы, позволяя ИИ смотреть на экран и щелкать мышью, как человек. Этот подход интересен, но и ненадежен. В конце концов, если интерфейс будет обновлен или команды изменены, весь процесс может завершиться с ошибкой.

Что еще более важно, OpenClaw при локальном запуске обладает практически идентичными системными привилегиями по сравнению с пользователем. Теоретически, компьютер стажера, на котором запущен OpenClaw, может прочитать любые данные, к которым он не должен иметь доступа. Агентства безопасности обнаружили сотни вредоносных программ на его платформе для поиска специалистов, а Gartner оценила его корпоративное развертывание как «неприемлемый риск кибербезопасности».

OpenClaw — это «момент Linux» для агентов: открытый исходный код, бесплатное программное обеспечение, ориентированное на энтузиастов, с процветающей экосистемой, но ни одна компания не осмеливается использовать его напрямую.

Проблема, которую предстоит решить Вуконгу, иная : обеспечить совместимость со всеми возможностями Skill в экосистеме открытого исходного кода и внедрить безопасность в архитектуру, а не исправлять её впоследствии.

Единая корпоративная аутентификация личности, выделенная изоляция в изолированной среде, управление сетевыми прокси и сквозные журналы аудита — каждый уровень безопасности отвечает на один и тот же вопрос: предоставление ИТ-отделам возможности принимать решения, а руководителям — брать на себя ответственность .

В этом заключается принципиальное различие между корпоративным агентом и «фреймворками агентов с открытым исходным кодом».

На пресс-конференции генеральный директор DingTalk У Чжао заявил: «Сегодня мы разобрали DingTalk, перестроили его с помощью ИИ и создали Wukong. Раньше люди использовали DingTalk для работы; в будущем ИИ будет использовать DingTalk для работы. В отличие от всех этих «агентств-омаров» на рынке, Wukong органично интегрирован в корпоративные организации и может безопасно использоваться в реальных корпоративных средах».

На основе командной строки: создание собственного языка программирования для ИИ.

Чтобы понять, почему Wukong "действительно способен на многое", ключевой момент заключается в том, что у него есть язык, позволяющий ИИ "понимать" программное обеспечение.

В прошлом почти все агенты искусственного интеллекта пытались имитировать действия человека с клавиатурой и мышью. Это все равно что использовать компьютер с завязанными глазами, полагаясь на чьи-то указания типа «немного сдвинься влево, щелкни» — это не только крайне неэффективно, но и очень подвержено ошибкам.

Чтобы Вуконг действительно мог "добиваться результатов", DingTalk приняла довольно безумное решение: весь базовый код был переписан .

Они полностью адаптировали существующие возможности DingTalk для работы через командную строку, превратив его из «графического интерфейса для людей» в «интерфейс командной строки для ИИ».

Искусственному интеллекту больше не нужно «понимать», где находится кнопка, он может напрямую вызывать функции с помощью стандартизированных инструкций, что равносильно имплантации нервных окончаний в ИИ .

Это включает в себя все продукты DingTalk, в том числе документы, расписания, согласования, совещания и даже электронные таблицы с использованием ИИ, которые были переписаны с использованием стандартных команд командной строки.

Это означает, что Вуконгу больше не нужно «нажимать» кнопки, как человеку, а он может напрямую получать доступ ко всем возможностям и данным DingTalk с помощью встроенных команд.

Помимо приложения DingTalk, основные бизнес-возможности Alibaba Group, включая Taobao, Tmall, Alipay и Alibaba Cloud, будут постепенно интегрированы в Wukong в качестве инструментов Skills. Wukong становится единым каналом для использования возможностей искусственного интеллекта Alibaba в корпоративных рабочих сценариях.

Когда пользователь говорит: «Помогите мне упорядочить записи о посещениях клиентов на следующую неделю и сгенерировать еженедельный отчет», Wukong не просто «понимает» предложение; вместо этого он напрямую запускает серию команд CLI: вызов API расписания → получение данных CRM → анализ диктовки → запись в документ → запуск процесса утверждения. Весь процесс не включает в себя имитацию щелчков мышью, визуальное распознавание, только точные межмашинные вызовы.

Эта логика очень точно изложена в отраслевом отчете под названием «Будущее принадлежит интеллектуальным агентам: триллионный ИИ меняет представление о программном обеспечении»:

Все, что вы разрабатываете, должно быть ориентировано на API. Если у функции нет API, это как если бы её не существовало. Если вы не можете предоставить к ней доступ через CLI или MCP-сервер, вы оказываетесь в невыгодном положении.

Иными словами, в эпоху, когда агенты ИИ становятся «основными пользователями» программного обеспечения, программное обеспечение, которое не может быть вызвано ИИ напрямую, по сути, перестаёт существовать .

▲Источник изображения: X@karpathy

Компания DingTalk понимала эту логику, поэтому выбрала чрезвычайно дорогостоящий подход — переписала базовый программный слой, обслуживающий 800 миллионов пользователей и 27 миллионов предприятий по всему миру. Только после того, как DingTalk получил полную поддержку командной строки, агент смог превратиться из простого средства «общения» в средство «работы».

Realdoc: У ИИ наконец-то появился собственный язык для работы с файлами.

Однако реализация CLI решает лишь проблему «может ли ИИ вызывать DingTalk». Существует более фундаментальный и часто упускаемый из виду вопрос — как ИИ манипулирует файлами ?

В настоящее время на рынке практически нет продуктов для ИИ-агентств, которые имели бы файловую систему, специально разработанную для ИИ. Все обходятся традиционными файловыми системами, и к чему это приводит?

Чтобы ИИ исправил хотя бы одно слово в документе, он должен сначала прочитать весь документ в память, внести исправление, а затем записать весь документ обратно. Это как исправлять опечатку в книге, но при этом переписывать всю книгу заново — абсурдно, но такова реальность.

Это приводит к трем цепным реакциям.

Во-первых, существует проблема чрезмерного расхода токенов. Каждая операция потребляет весь документ, что приводит к резкому росту затрат. Один пользователь протестировал создание презентации PowerPoint с помощью ИИ, что потребовало 270 миллионов токенов, что эквивалентно примерно 500 долларам.

Во-вторых, отменить изменения невозможно. Искусственный интеллект перезаписывает данные, и они вступают в силу немедленно. Если вы допустите ошибку, архива для её отмены не будет, и вам придётся начинать всё сначала.

Наконец, существует проблема выхода файлов из-под контроля. Агенты создают файлы случайным образом, и компании понятия не имеют, где именно ИИ генерирует тот или иной файл, что приводит к хаотичному и неуправляемому беспорядку.

С этой целью Вуконг с нуля разработал собственную файловую систему для ИИ под названием Realdoc. Это первый случай в отрасли, когда кто-то переработал язык файловых операций специально для ИИ .

В RealDoc Вуконг может работать как хирург, находя информацию по номеру строки и ключевому слову, внося изменения только в необходимые части, оставляя остальное без изменений. Расход токенов значительно сокращается, что исключает необходимость перечитывать весь документ только для того, чтобы изменить одно слово.

Что еще более важно, есть система управления версиями. Realdoc автоматически сохраняет полный снимок для каждого шага, который предпринимает ИИ — как точка автосохранения в игре. Каждое действие записывается, что позволяет в любое время вернуться к любой версии. Он также может автоматически сравнивать различия между двумя снимками, вплоть до изменений в каждой строке.

Существует также проблема владения файлами. Realdoc выделяет каждому агенту ИИ независимое облачное рабочее пространство, предоставляя каждому документу, созданному ИИ, четкую «учетную запись» — где он хранится, кто его создал, какой агент его изменил и когда, что делает его легкодоступным для руководителей предприятий.

На этом этапе Вуконг внес изменение, которое большинство корпоративных продуктов еще не реализовали: вместо применения ИИ к существующим инструментам, компания решила создать новый набор инструментов для ИИ .

Компания Wukong запускает десять пакетов OPT Skills с поддержкой нативного взаимодействия на языке DingTalk.

Если решения на основе командной строки решают проблему "как работает ИИ", то следующий вопрос: какие задачи должен выполнять ИИ и кто будет указывать ему, как их выполнять ?

Ответ: Мастерство.

Skill — это самая маленькая единица повышения производительности в Wukong — модуль компетенций, который включает в себя стандартные операционные процедуры (СОП) экспертов отрасли и может быть вызван напрямую. Нам не нужно разбираться в ИИ, нам не нужно писать подсказки; одним щелчком мыши команда ИИ мгновенно подключается к работе.

Это не новая концепция, но Укун вывел её на совершенно новый уровень.

Компания Wukong выпустила первую партию комплектов навыков OPT (One Person Team — команда из одного человека) для десяти отраслей, охватывающих десять сценариев: электронная коммерция с одним сотрудником, трансграничная электронная коммерция, блогеры, занимающиеся обменом знаниями, разработка программного обеспечения, розничная торговля, дизайн, производство, юриспруденция, финансы и налогообложение, а также подбор персонала. Каждый отраслевой пакет включает несколько предварительно заданных последовательных навыков, которые сжимают рабочие процессы, ранее требовавшие командного взаимодействия, в операционную последовательность, которую может выполнить один человек самостоятельно.

Возьмем в качестве примера трансграничную электронную торговлю. Раньше владельцу магазина приходилось каждый день искать самые продаваемые товары на Amazon, сравнивать цены на 1688, подтверждать наличие товара у поставщиков и ломать голову над оптимизацией описаний товаров. Один человек мог управлять максимум тремя товарами.

Теперь, после интеграции программы Wukong OPT, система "Product Selection Radar" регулярно собирает самые популярные данные Amazon и записывает их в электронную таблицу с использованием ИИ; как только обнаруживается бестселлер, система "AI Finds Similar Products" мгновенно сопоставляет его с внутренней цепочкой поставок; специалисты на уровне отрасли помогают напрямую подтверждать образцы, создавать описания товаров и сценарии видеороликов. От выявления потребностей до отслеживания цепочки поставок один человек может за один день сделать то, что небольшая команда сделала бы за неделю.

Ситуация с «магазином, которым управляет один человек» еще более показательна. Владельцы автомастерских и маникюрных салонов на улице заняты оказанием услуг днем, а затем вынуждены заставлять себя бодрствовать ночью, чтобы просматривать Xiaohongshu (китайскую социальную сеть), изучать конкурентов и писать рекламные тексты. Теперь, благодаря объединению множества функций, ИИ автоматически отслеживает самые продаваемые товары конкурентов, извлекает многоразовые креативные шаблоны, автоматически генерирует и публикует оригинальные, адаптированные для интернета тексты, и даже может интеллектуально отвечать на личные сообщения клиентов круглосуточно.

«Когда владелец магазина использует ИИ для управления своим аккаунтом и добивается более высокого качества результата, чем компании, предоставляющие аутсорсинговые услуги его конкурентам, — это больше, чем просто повышение эффективности. Это переосмысление логики выживания малых и микромагазинов».

Именно в этом и заключается основная логика концепции «навык как производительность»: преобразование неявного опыта отраслевых экспертов в стандартизированные навыки, которые может использовать каждый . Навык — это не просто повышение эффективности; это перераспределение возможностей, позволяющее людям без профессионального образования достигать результатов профессионального уровня.

Более масштабные амбиции, лежащие в основе этой логики, отражены в торговой площадке возможностей искусственного интеллекта, запущенной одновременно компанией DingTalk.

После того, как компания Anthropic выпустила открытый стандарт Claude Skills, такие гиганты, как Microsoft, OpenAI и Cursor, быстро последовали её примеру. В отрасли формируется консенсус: следующий этап конкуренции будет заключаться не в том, «чья модель сильнее», а в том, «чья экосистема навыков более полная».

Торговая площадка DingTalk, посвященная возможностям искусственного интеллекта, охватывает всю систему навыков, агентов и услуг, объединяя всю цепочку от разработки, проверки, размещения и распространения до управления.

Предприятия могут закрепить методики опытных сотрудников в качестве собственных навыков, полностью исключив негативные последствия потери талантов; тысячи готовых решений из сообщества открытого исходного кода также могут быть использованы в любое время в рамках архитектуры безопасности корпоративного уровня.

Это самая оригинальная часть проекта «Укун»: создание инфраструктуры повышения производительности для эпохи искусственного интеллекта — навыки являются «валютой», циркулирующей в этой инфраструктуре. Тот, кто овладеет большим количеством высококачественных навыков, будет контролировать более высокую производительность в эпоху ИИ.

Новое оборудование для искусственного интеллекта

Помимо программного обеспечения, на этом мероприятии компания DingTalk также представила несколько аппаратных продуктов, использующих искусственный интеллект.

DingTalk A1 Pro : карта записи, разработанная для совещаний и рабочих ситуаций, поддерживает многомикрофонную запись, транскрипцию в реальном времени с помощью ИИ, перевод и суммирование, полностью исключая неэффективный цикл «необходимости организовывать протокол после совещания».

Наушники Cleer H1 AI : результат сотрудничества DingTalk и Cleer, это первые наушники с искусственным интеллектом, глубоко интегрированные с Укуном (китайское идиоматическое название Царя обезьян). Надев наушники, вы можете напрямую общаться с Укуном и отдавать команды голосом, не открывая экран, достигая истинного принципа «что думаешь, то и получаешь».

Более примечательным является аппаратное обеспечение Real AI (Realbox) : оно включает в себя среду для 1 ПК и 5 мобильных телефонов, поддерживающую многопользовательский доступ и одновременную обработку задач. Развертывание одного Realbox позволяет предприятию одновременно запускать несколько экземпляров Wukong для нескольких сотрудников; развертывание нескольких Realbox позволяет создать кластер вычислений ИИ, обеспечивающий параллельную обработку задач и эластичное масштабирование.

Совершенно очевидно, что аппаратное обеспечение DingTalk для ИИ не конкурирует с другими аналогичными продуктами на рынке; его основная цель — лучше интегрировать рабочие процессы ИИ и стать нативной рабочей платформой для ИИ, объединяющей программное и аппаратное обеспечение.

OpenClaw работает на компьютере и делает то, что может делать компьютер; Wukong, оснащенный кластером Realbox, официально заявляет, что вычислительная мощность ИИ может циркулировать внутри предприятий подобно водоснабжению и электроснабжению в виде инфраструктуры .

Производительность труда в организациях в эпоху искусственного интеллекта

Во время просмотра этой пресс-конференции мне вспомнилось высказывание Сэма Альтмана в недавнем интервью: «Вот-вот появится первая в истории компания с миллиардным оборотом, которой будет управлять один человек».

В то время омары ещё не были востребованным товаром, и концепция команды для прохождения дополнительной практической подготовки (OPT) существовала только в сообществе специалистов по искусственному интеллекту. Он не объяснил, какие инструменты будет использовать этот человек, где он будет находиться и в какой отрасли будет работать. Но после просмотра этой презентации это утверждение стало более конкретным.

Скорее всего, рядом с этим человеком будет что-то вроде Сунь Укуна. Последние одиннадцать лет DingTalk обучает людей использованию инструментов. Цель Укуна — постепенно сделать так, чтобы инструменты действительно понимали людей.

По мере того, как инструменты начинают понимать людей, становится возможным то, что раньше казалось невозможным: производительность организации впервые может быть по-настоящему оцифрована, упакована, распространена и расширена . Когда навыки преобразуют опыт отраслевых экспертов в универсально доступную валюту компетенций, и когда платформы, созданные на основе ИИ, станут операционной системой для доступа отдельных лиц к возможностям организации, границы того, что может сделать отдельный человек или организация, будут полностью переопределены.

Сэм Альтман считал «компанию, состоящую из одного человека» конечной целью, и цель Wukong — дать большему числу обычных людей возможность пройти этот путь. Это не инструмент, специально разработанный для гениев, а скорее набор инфраструктуры для повышения организационной производительности в эпоху ИИ для всех, кто «хочет делать больше, но сталкивается с ограничениями, связанными с энергией одного человека».

Рабочие платформы, созданные на основе искусственного интеллекта, становятся важнейшим организационным фактором нашего времени. Тот, кто первым запустит их в работу, получит доступ в эпоху сверх-индивидуализма.

Ранее существовало мнение, что скорость сжигания токенов определяет скорость человеческой эволюции. А версия 1.0 Укуна указывает на следующую версию человеческой и организационной эволюции.

Ли Чаофань

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.