Сжигание 120 триллионов токенов ежедневно — это новейший Версаль в мире искусственного интеллекта.

Сегодня Volcano Engine опубликовала данные, свидетельствующие о том, что ежедневное использование токенов крупной модели Doubao превысило 120 триллионов.

Три месяца назад эта цифра составляла 60 триллионов. Когда Doubao Big Model впервые вышел в мае 2024 года, она составляла лишь одну тысячную от этой суммы.

Что представляет собой концепция 120 триллионов токенов?

На основе приблизительных расчетов, исходя из входной цены примерно в 2-4 юаня за миллион токенов для основных отечественных моделей в марте, это означает, что ежедневно на графические процессоры тратится от 300 до 500 миллионов юаней. За год это составит сотни миллиардов юаней расходов, эквивалентных всей годовой выручке NetEase (чистая выручка NetEase за весь 2025 год составила 112,6 миллиарда юаней). И это только объем одной компании, одной платформы и одного дня.

Эта цифра представляет больший интерес в более широком контексте.

23 марта на ежегодном форуме развития Китая 2026 года было объявлено, что в марте этого года среднесуточное использование токенов в Китае превысило 140 триллионов, что более чем в 1000 раз больше по сравнению со 100 миллиардами в начале 2024 года. В том же месяце еженедельное использование токенов в Китае для крупномасштабных моделей ИИ три недели подряд превышало аналогичный показатель в США. Данные OpenRouter показывают, что на третьей неделе марта общее глобальное использование токенов для крупномасштабных моделей ИИ достигло 20,4 триллиона, при этом на Китай пришлось 7,359 триллиона, что составляет 36% от общемировой доли.

Ранее LatePost сообщал еще одну деталь: только три компании в мире ежедневно потребляют более 100 триллионов токенов: OpenAI, Google и ByteDance.

Ещё более интригующим является тот факт, что потребление токенов OpenAI и Google приходится на глобальный рынок, в то время как у ByteDance это в основном Китай. Платформа, ориентированная на внутренний рынок, уже достигла объёма обработки токенов, сопоставимого с двумя мировыми гигантами. Её присутствие за рубежом продолжает расти.

Президент Volcano Engine Тан Дай выделил два основных фактора, лежащих в основе роста: взрывной рост создания видеоконтента с использованием ИИ и ускоренное распространение интеллектуальных агентов на основе ИИ.

Оба этих явления передавались от человека к человеку одновременно в течение последних трех месяцев.

▲ Тан Дай, президент компании Volcano Engine

Омары появились, и способ сжигания токенов изменился.

После того, как OpenClaw стал хитом, все заговорили об агентах. «Лобстер» заставил всю индустрию осознать, что логика потребления токенов в эпоху агентов совершенно отличается от логики в эпоху чатов.

Раньше взаимодействие с крупной моделью представляло собой простую сессию вопросов и ответов, и нескольких сотен токенов было достаточно. Теперь же агенту приходится думать, планировать, настраивать инструменты, проверять результаты и исправлять ошибки. Выполнение сложной задачи потребляет в десятки или даже сотни раз больше токенов, чем обычный разговор.

Собственный ArkClaw от Volcano Engine — это микрокосм этого процесса. Он подключается к Lark за считанные секунды, а также может взаимодействовать с WeChat, DingTalk и Weibo, одновременно расширяя свое облачное хранилище для комплексного облачного сотрудничества. За каждой «автоматической» функцией стоит высокоскоростное обращение токенов.

Тан вынес заключение: ключ к эффективному использованию агентов предприятиями заключается в трех вещах: моделях, безопасности и навыках.

Модель — это мозг агента. Doubao Big Model 2.0, выпущенная в феврале этого года, уже вошла в число лучших в мире и занимает первое место в Китае по визуальному восприятию. Безопасность имеет первостепенное значение; Volcano Engine только что получила двойную сертификацию от Китайской академии информационных и коммуникационных технологий (CAICT): «Сертификат надежности продукта интеллектуального помощника и интеллектуального агента» и «Сертификат эффективности продукта защиты», что делает ее единственной в своем роде в Китае.

Но умного мозга и надежной клетки недостаточно; агенту нужны руки и ноги, чтобы выполнять задачи. Широта экосистемы навыков напрямую определяет потолок возможностей агента.

Это также стало предпосылкой для еще одного важного объявления в тот же день: основатель OpenClaw Питер Штайнбергер и компания Volcano Engine совместно объявили о начале работы китайского зеркального сайта ClawHub (mirror-cn.clawhub.com), созданного совместно двумя сторонами.

Ранее отечественные разработчики, использующие Skills на ClawHub, часто сталкивались с проблемами медленного и нестабильного доступа. Зеркальный сайт решает эту проблему: частый доступ больше не тормозит, а обновления Skills синхронизируются своевременно. Питер Штайнбергер даже использовал «лобстера» для создания видеоролика, чтобы объявить об этом на презентации.

На платформе Volcano Engine число корпоративных клиентов, суммарное использование токенов которых превысило один триллион, выросло со 100 в конце прошлого года до 140. Всего за три месяца к «Клубу триллиона» присоединились еще 40 человек.

Seedance 2.0 Открытое бета-тестирование: создание видео на корпоративном уровне теперь с надежной основой.

В тот же день Volcano Engine также объявила об официальном открытии API Seedance 2.0 для публичного бета-тестирования среди корпоративных пользователей.

Seedance 2.0 — это передовая мировая модель в области генерации видео, но её истинная полезность для предприятий заключается не только в качестве генерируемого контента. Volcano Engine разработала комплексный набор стандартов защиты изображений и авторских прав, охватывающий весь процесс: от проверки соответствия входных материалов требованиям и защиты прав на изображения во время генерации до перехвата рисков нарушения авторских прав в выходном контенте. Такие проблемы, как дипфейки и нарушение авторских прав, которые не дают покоя юридическим отделам корпораций, перехватываются на уровне модели.

Этот механизм безопасности охватывает все способы создания видео и все этапы до и после создания. Проще говоря, Volcano Engine решила отключить защиту, когда модель была наиболее популярна, прежде чем передать ключ API предприятиям.

Для бизнеса это решает очень важную проблему: готовность использовать такие технологии. Брендовая реклама, видеоролики для электронной коммерции и маркетинговые материалы крайне чувствительны к вопросам авторского права и прав на использование изображений. Без надежных мер безопасности даже самые мощные технологии не смогут побудить компании к их широкому внедрению.

Тан Дай описал два пути построения корпоративных агентов: гибкий и стабильный. Гибкие агенты, такие как ArkClaw, служат «полигоном для тестирования инноваций» для сотрудников, позволяя каждому специалисту по кадрам стать лучше, а каждому аналитику — лучше. Стабильные агенты, с другой стороны, обрабатывают и масштабируют проверенные лучшие практики, внедряя их в такие сценарии, как заключение контрактов и управление производством — сценарии, где нет места иллюзиям.

Эти два пути не исключают друг друга, а скорее образуют замкнутый цикл: индивидуальные инновации зарождаются в ArkClaw, в HiAgent преобразуются в организационные возможности, а затем через навыки и API-интерфейсы доходят до каждого сотрудника, работающего непосредственно с клиентами.

За отметкой в ​​120 триллионов юаней — рост числа фабрик токенов.

Дженсен Хуанг недавно задал тон, предсказав, что к 2027 году глобальный спрос на вычислительные ресурсы превысит 1 триллион долларов. Он заявил, что токены станут базовой валютой новой эры, и центры обработки данных перестанут быть складами для хранения файлов, а превратятся в фабрики по производству токенов.

Следующий вопрос, который необходимо задать: кто оплачивает эти токены?

Совокупный объем звонков 140 компаний на платформе Volcano Engine превысил один триллион. С другой стороны, структура затрат на ИИ меняется: от «единовременной покупки модели» к «оплате за каждый шаг». И цена токенов стремительно растет.

В течение последнего месяца новости о повышении цен сыпались одна за другой.

Компания Zhipu дважды за месяц корректировала цены: стоимость GLM-5-Turbo выросла на 20%, а GLM Coding Plan — на 30% в Китае и более чем на 100% за рубежом. В первом квартале общая стоимость API выросла на 83% по сравнению с предыдущим поколением. Генеральный директор Zhipu Чжан Пэн сделал важное заявление на конференции по итогам отчетного периода: «Даже при 83-процентном увеличении объем вызовов вырос на 400%, что указывает на то, что предложение не может удовлетворить спрос».

Кроме того, в тот же день, 18 марта, Alibaba Cloud и Baidu AI Cloud одновременно объявили о повышении цен, увеличив стоимость вычислительных мощностей для ИИ на 5-30% и хранилищ на 30%. Tencent Cloud пошла еще дальше, скорректировав 13 марта свою стратегию выставления счетов для платформы разработки интеллектуальных агентов, при этом цены на некоторые модели выросли более чем в четыре раза.

Если посмотреть на более ранний период, то в январе Amazon AWS повысила цену на блоки мощностей для машинного обучения на 15%, а Google Cloud также незаметно увеличила цену на свою услугу передачи данных в тот же период.

Тот факт, что три крупнейших отечественных облачных гиганта и два крупнейших зарубежных гиганта повысили цены в одном и том же квартале, не случаен. Кто-то подсчитал, что среднее ежедневное потребление токенов пользователями OpenClaw в 20-50 раз выше, чем у пользователей традиционных чатов.

Когда огромное количество пользователей одновременно запускает агенты, темпы роста спроса значительно превышают темпы роста предложения — для производства графических процессоров, электроэнергии и центров обработки данных необходима надежная основа. Дженсен Хуанг говорит, что токены — это форма базовой валюты. Но валюту можно хранить, накапливать и позволять ей расти в цене. Токены — нет. Токены потребляются в момент их производства, подобно электроэнергии.

Термин «электроэнергия» никогда не был просто техническим вопросом. Тот, кто контролирует производство и передачу электроэнергии, обладает правом устанавливать цены. Электросети нуждаются в регулировании, а телекоммуникации — в лицензировании. А что насчет токенов? На этот вопрос пока никто не ответил, но каждая компания хочет дать на него ответ.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете быстро найти еще больше интересного контента.