100 триллионов токенов показывают, как пользователи по всему миру используют ИИ: половина вычислительной мощности используется в «неописуемых» местах

Только что опубликована самая масштабная запись поведения пользователей в области искусственного интеллекта.

Этот отчёт опубликован OpenRouter, глобальной платформой агрегации моделей, совместно с a16z, ведущей венчурной компанией Кремниевой долины. Он основан на 100 триллионах реальных вызовов API по всему миру, охватывающих более 300 моделей ИИ, более 60 поставщиков и более 50% пользователей за пределами США .

Из этого мы можем видеть, как люди на самом деле используют ИИ, особенно в тех разговорах, которые не будут отражены в официальных документах или описаны в технических документах.

APPSO обнаружила три наиболее противоречивых вывода из этого исследования:

1. Самые настоящие и фундаментальные потребности человечества — не производительность, а «гормоны» и «игровой дом». Более 50% вычислительной мощности моделей с открытым исходным кодом используется для ролевых игр, виртуальных знакомств и контента, не предназначенного для работы с людьми. Написание кода? Это второстепенно.

2. По-настоящему продвинутые пользователи даже не смотрят на цену, в то время как модели, которые настолько дешёвые, что практически бесплатны, как правило, выходят из строя ещё быстрее. Модели, которые решают болевые точки пользователей на ранних этапах, с большей вероятностью удержат их.

3. Китайские модели прорвали оборону всего за год. От 1,2% до 30% китайских моделей, представленных DeepSeek и Qwen, стали королями открытого исходного кода.

Важно отметить, что этот отчет неизбежно содержит «предвзятость».

Пользователями OpenRouter в основном являются индивидуальные разработчики, малые и средние предприятия и энтузиасты открытого исходного кода, а не компании из списка Fortune 500. Крупные компании, которые ежемесячно тратят миллионы долларов на Azure и AWS AI, не включены в эти данные. Следовательно:

  • Доля китайских моделей будет увеличиваться (малые и средние разработчики охотнее пробуют решения с открытым исходным кодом и недорогие решения).
  • Доля моделей с открытым исходным кодом будет выше (корпоративные пользователи предпочитают стабильность API с закрытым исходным кодом).
  • Ролевые игры и другие «развлекательные» сценарии будут иметь значительно более высокий уровень использования (крупные компании не будут использовать для них публичные API).
  • Фактическое использование гибридных развертываний на уровне предприятия не отображается (все они используют частные серверы и службу Azure OpenAI).

Но оглядываясь назад, можно сказать, что именно в этом и заключается ценность этого отчета.

Пока все на пресс-конференциях расхваливают то, как ИИ изменит производительность, становится ясно, кто остался голышом, кто забирает себе всю добычу, а кто тихо доминирует в этих невыразимых областях.

От 1% до 30% китайские модели пробили трещины в империи OpenAI.

Если рассматривать рынок ИИ как карту мира, то до 2024 года это была империя с закрытым исходным кодом, принадлежавшая OpenAI и Anthropic. Они возвели высокие стены вокруг API, взимали пошлины и устанавливали правила.

Но стена рухнула.

Если взглянуть на эту диаграмму распределения использования, то можно увидеть, что использование токенов в модели с открытым исходным кодом (OSS) выросло до одной трети от общего числа, и это число продолжает расти с тревожной скоростью.

Лето 2024 года стало переломным моментом.

До этого рынок находился в состоянии стагнации. На рынке доминировали серии GPT от OpenAI и Claude от Anthropic, а модели с открытым исходным кодом играли лишь вспомогательную роль.

После этого, с быстрым выпуском Llama 3.3 70B, DeepSeek V3 и Qwen 3 Coder, ситуация мгновенно кардинально изменилась. Некогда доминирующий объём вызовов API начал стремительно падать.

Здесь необходимо обсудить подъем китайской модели, поскольку она стала самой агрессивной темой обсуждения за последний год.

Данные показывают:

  • Начало 2024 г.: доля Китая в мировом использовании моделей с открытым исходным кодом составила всего 1,2%, что практически ничтожно мало.
  • К концу 2025 года: этот показатель вырастет до 30%, достигнув пика в некоторые недели.

От 1,2% до 30% — это окружение снизу вверх.

DeepSeek прочно удерживает первое место в рейтинге проектов с открытым исходным кодом, используя в общей сложности 14,37 трлн токенов. Несмотря на то, что его доминирующее положение ослабевает, его масштабы по-прежнему поражают. Qwen идёт следом за ним, занимая второе место с 5,59 трлн токенов, и его показатели в области программирования чрезвычайно впечатляют, напрямую соперничая с Claude.

Но что ещё важнее, темп. Китайские модели выпускаются невероятно часто. DeepSeek выпускает крупные обновления практически каждый квартал, а Qwen обновляется ещё быстрее. Из-за такого «высокочастотного подхода» гигантам Кремниевой долины сложно поспевать за развитием: они едва успевают выпустить новую модель, как их конкуренты уже выпустили три её варианта.

Лопнуть пузырь искусственного интеллекта: три упущенные из виду истины

Давайте теперь развеем эти ложные предположения и посмотрим, для чего на самом деле используется ИИ в реальном мире.

Правда №1: «Маленькие модели умирают, средние модели набирают популярность».

Рынок голосует ногами, отказываясь от «быстрых и глупых» микромоделей.

Данные показывают, что доля рынка моделей с параметрами менее 15 байт стремительно падает. Пользователи обнаруживают, что скорость бесполезна, если ИИ туп, как заезженная пластинка; лучше его вообще не использовать.

Модели среднего размера (параметры 15B–70B) стали новым фаворитом. Этот рынок был открыт Qwen2.5 Coder 32B в ноябре 2024 года. До этого этот диапазон параметров был практически пуст; с тех пор такие модели, как Mistral Small 3 и GPT-OSS 20B, быстро появились на рынке, образовав новое поле битвы.

Модели, которые недостаточно дешевы и не достаточно мощны, теряют долю рынка. Вам нужно либо добиться максимальной мощности, либо максимальной экономичности.

Правда №2: Это не программирование, это скорее игра.

Хотя мы часто видим новостные репортажи о том, как ИИ повышает производительность, при использовании моделей с открытым исходным кодом более 50% трафика уходит на «ролевые игры» .

Говоря более прямо:

Более половины вычислительной мощности ИИ с открытым исходным кодом используется для следующих целей:

  • Виртуальный любовный разговор («Общайся со мной, помни о моих предпочтениях»)
  • Ролевая игра («Теперь ты — принцесса эльфов…»)
  • Интерактивная генерация романа («Продолжите историю и добавьте больше деталей»)
  • Создание контента для взрослых (в отчете отмечено как «Для взрослых», на долю которого приходится 15,4%).

Это результат анализа сотен миллионов реальных запросов с помощью API классификации естественного языка Google Cloud. Запрос помечается тегом, когда ИИ определяет, что он относится к категории /Для взрослых или /Искусство и развлечения/Ролевые игры.

Это означает, что для огромного числа конечных пользователей ИИ — это в первую очередь «объект эмоциональной проекции» и только во вторую очередь — инструмент .

Тем временем стриминговые сервисы и гиганты Кремниевой долины, из соображений безопасности бренда, намеренно избегали или даже подавляли этот спрос. Но это создало огромный «вакуум спроса и предложения». Потребность пользователей в эмоциональном взаимодействии, захватывающих сюжетах и ​​даже в контенте с пометкой «NSFW» (не предназначенном для детей или для работы) была вытеснена из общественного мнения и в конечном итоге выплеснулась в сообщество разработчиков ПО с открытым исходным кодом.

Программирование — вторая по значимости сфера применения, на неё приходится 15–20%. Всё верно, написание кода, которое так рекламируют СМИ, в реальном мире занимает лишь второе место.

Так в чем же правда?

Перестаньте притворяться. Две самые настоящие и фундаментальные потребности человечества — это гормоны и код. Первые обеспечивают общение и радость, а вторые позволяют нам зарабатывать. Все эти прочие формы «обмена знаниями», «конспектирования документов» и «обучающих занятий» в совокупности составляют лишь малую долю от этих двух.

Это также объясняет, почему модели с открытым исходным кодом получили столь быстрое распространение, поскольку они, как правило, подвергаются меньшей цензуре, предоставляя пользователям больше свободы в настройке персонажей и сюжетных линий, что делает их идеальными для эмоционально окрашенных взаимодействий.

Правда №3: ​​Пользователи DeepSeek, одержимые развлечениями

Если мы извлечем данные DeepSeek отдельно, то обнаружим еще более экстремальное распределение:

– Ролевая игра + неформальное общение: примерно 67%
– Программирование: лишь малая часть

В этом отчёте DeepSeek представлен скорее как инструмент для развлечения потребителей, чем инструмент для повышения производительности. Его пользователи не пишут код, а «встречаются» с искусственным интеллектом.

Это резко контрастирует с Клодом.

Есть только один шанс: победитель забирает все.

Почему некоторые модели обретают лишь кратковременную популярность, а другие прилипают к пользователям как клей?

В докладе представлена ​​концепция: эффект «хрустальной туфельки» Золушки .

Определение: Если при выпуске новой модели она идеально решает давнюю проблему пользователей (например, хрустальная туфелька идеально подходит Золушке по ноге), то эти пользователи станут «ярыми поклонниками» модели (основными постоянными пользователями), и им будет сложно перейти на новую модель, независимо от того, сколько новых моделей будет выпущено в будущем.

Важно отметить, что такая возможность предоставляется раз в жизни. Если на начальном этапе запуска (в период Frontier) не будет достигнут технологический прорыв, который позволит закрепить за этими ключевыми пользователями, то, как бы вы ни старались в дальнейшем, уровень удержания будет крайне низким.

Почему?

Потому что пользователи уже выстроили полный рабочий процесс вокруг этой модели:

– Разработчики интегрировали Клода в процесс CI/CD.
Создатели контента сохранили десятки версий персоны DeepSeek.
Издержки переключения носят не только технический, но также когнитивный и привычный характер.

Профиль победителя: «Эффект бумеранга» DeepSeek

Кривая удержания DeepSeek очень странная:

Пользовательский пробный период → Отток (чтобы попробовать другие модели) → Через некоторое время они возвращаются с жалобами.

Это известно как «эффект бумеранга». Данные показывают, что в апреле 2025 года база пользователей DeepSeek R1 значительно увеличила показатель удержания уже в третий месяц.

Почему они вернулись?

Потому что он «действительно хорош». Перепробовав все модели на рынке, я обнаружил, что DeepSeek по-прежнему предлагает лучшее соотношение цены и качества.

  • Бесплатно или по очень низким ценам
  • Достаточно хорошие способности к ролевой игре
  • Никакой раздражающей цензуры контента

Портрет проигравших: трагедия Llama 4 Mavericks

Напротив, такие модели, как Llama 4 Maverick и Gemini 2.0 Flash, демонстрируют душераздирающе низкие показатели удержания.

С первой недели все пошло по нисходящей спирали, и пути назад нет.

Почему? Потому что они появились слишком поздно и не обладали какими-либо особыми функциями. К моменту их выхода пользователи уже нашли свои «хрустальные туфельки», и новые модели могли стать лишь «запасным вариантом».

На рынке моделей ИИ опоздание означает постоянную маргинализацию.

Дизайн персонажей каждого ИИ

В этой войне никто не может победить всех; каждый либо страдает, либо наслаждается под свою фоновую музыку. Давайте дадим каждому игроку наиболее точное название:

Клод (антрополог): «Бог» инженеров-гетеросексуалов

Персонаж: Ученый и инженер, преуспевающий только в программировании и напрочь лишенный романтики.

Данные не лгут: доля Клода на рынке программирования уже давно превышает 60%. Хотя в последнее время она немного снизилась, она остаётся непреодолимым препятствием для написания кода.

Профиль пользователя:
Более 80% трафика Клода связано с технологиями и кодом.
– Почти никто не использует его для непринужденного общения или ролевых игр.

Клод — как лучший ученик в вашем классе: вы ищете его только во время экзаменов; в остальное время вы с ним никогда не общаетесь.

OpenAI: от «Единственного Бога» до «Посредственного Старого Короля»

Профиль персонажа: бывший Повелитель, теперь — ящик с инструментами

Изменения доли рынка OpenAI оказались чрезвычайно значительными:
– Начало 2024 г.: запросы, связанные с наукой, составили более 50%
– К концу 2025 года: доля специальностей, связанных с наукой, сократится до менее 15%.

Из «единственного и неповторимого бога» он превращается в «набор инструментов, который может всё, но не хорош ни в чём». Хотя GPT-4o Mini по-прежнему может похвастаться высоким уровнем удержания, он уже не единственный вариант на вертикальных рынках.

Основная проблема в том, что он попал в ловушку собственного успеха. ChatGPT превратился в массовый бренд, но это также привело к потере им конкурентных преимуществ в профессиональной сфере.

Google (Gemini): тревога универсалов

Черты характера: Хочет всего, но ни в чем не преуспевает.

Google — это как растерянный универсал. Он присутствует в вопросах и ответах по юриспруденции, науке, переводу и общим знаниям, но:
– Всего 15% доли рынка в сфере программирования.
– Практически не встречается в сфере ролевых игр

Однако на все более вертикальном рынке универсальность означает посредственность.

DeepSeek: Победа варваров

Характер: Нарушитель порядка, играющий не по правилам, король развлечений C-End.

DeepSeek занял свою нишу благодаря исключительной экономической эффективности, доказав, что даже без самых веских логических доводов можно завоевать рынок, будучи «весёлым» и «бесплатным».

Основные данные:
– Общее использование: 14,37 триллиона токенов (первый в открытом исходном коде)
– 67% трафика – это развлечения и ролевые игры.
– Эффект бумеранга очевиден: пользователи возвращаются даже после того, как попробовали что-то другое.

Его успех доказывает одно: на потребительском рынке «достаточно хороший» + «достаточно дешевый» + «неограниченный» могут победить во всем.

xAI (Grok): подход Маска «случайный кулак»

Характер: Неожиданная атака толпы, захват доли рынка путем предложения бесплатных услуг.

Данные Грока очень интересны:
– В первые дни 80% пользователей были программистами (Grok Code Fast оптимизирован для программирования).
– После бесплатной акции внезапно хлынул поток обычных пользователей, что мгновенно усложнило профиль пользователя.

Предложение бесплатных услуг может привлечь трафик, но трафик ≠ лояльность. Как только вы начнёте взимать плату, эти пользователи сразу же уйдут.

Давайте, наконец, поймем этот мир с помощью одного образа.

Современный рынок крупных моделей имеет четко сформированную четырехзвенную структуру:

Во-первых, это лагерь «гигантов эффективности», представленных DeepSeek и Gemini Flash. Их главное преимущество заключается в высоком соотношении цены и производительности — «дешевые и доступные», разработанные специально для больших объёмов данных. Они особенно подходят для повторяющейся «грязной и утомительной работы», не требующей сложных логических рассуждений, что делает их лучшим выбором для тех, кто ищет баланс между эффективностью и стоимостью.

Во-вторых, существует категория «экспертов высокого уровня», где эталонными инструментами являются Claude 3.7 и GPT-4. Несмотря на высокую цену, они завоевали популярность у корпоративных пользователей благодаря своей высочайшей точности и способности решать сложные задачи.

В то же время жизненное пространство лагеря «длинного хвоста» сокращается, а большое количество малых моделей постепенно вытесняется с рынка из-за отсутствия дифференцированных преимуществ и технологических барьеров.

Кроме того, лагерь «разрушителей», в основе которого лежат китайские модели, стремительно растёт. Благодаря частым технологическим обновлениям, экономически эффективным ценовым стратегиям и глубоким возможностям локализации, доля рынка компании продолжает расти, что делает её ключевой силой в преобразовании отраслевого ландшафта.

Тенденция, скрытая за 100 триллионами токенов

В качестве наблюдателей APPSO отметила некоторые тенденции в этом отчете, которые могут определить будущий конкурентный ландшафт ИИ:

1. Многомодельная экосистема — это норма; поклонение одной модели — патология . Разработчики будут строить как блоки, используя Claude для написания кода, DeepSeek для полировки документации и Llama для локального развёртывания. Лояльность? Её не существует.

2. Агенты уже захватили половину рынка. Модели рассуждений теперь занимают более 50% рынка. Мы хотим, чтобы ИИ не просто давал ответы; мы хотим, чтобы ИИ обеспечивал «мыслительный процесс». Многошаговые рассуждения, вызовы инструментов и длинные контексты — вот новые поля битвы.

3. Удержание > Рост <br /> Помимо показателя удержания ранних пользователей, другие показатели роста являются метриками тщеславия.

4. Специализация в вертикальной области более ценна, чем универсальность.
Клод преуспел в программировании, а DeepSeek — в сфере развлечений. Модель, которая пытается сделать всё, в итоге не делает ничего хорошего.

5. Цена — не единственная переменная, но «простота использования» всегда имеет значение . Данные показывают очень слабую корреляцию между ценой и использованием. Пользователи действительно высокого класса нечувствительны к цене, в то время как пользователи бюджетного сегмента признают лишь несколько устройств с «выгодным соотношением цены и качества». Посредственные модели, оказавшиеся посередине, выходят из строя быстрее всего.

6. Наступление китайской модели только началось . Потребовался всего год, чтобы подняться с 1,2% до 30%. Что же дальше? Китай прочно обосновался, установив правила игры или же будет им подчиняться? Это станет самой примечательной историей 2026 года.

Мир ИИ определяется не видением, представленным на презентации продукта, а триллионами токенов, которые пользователи фактически отправляют каждый день.

Среди этих токенов некоторые люди пишут код, чтобы изменить мир, в то время как другие желают спокойной ночи виртуальным подружкам; рациональный код и эмоциональные разговоры гармонично сосуществуют.

Возможно, мы должны признать, что развитие ИИ также является продолжением человеческих желаний.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (WeChat ID: ifanr), где вы сможете как можно скорее ознакомиться с еще более интересным контентом.

ifanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo