100 триллионов токенов показывают, как пользователи по всему миру используют ИИ: половина вычислительной мощности используется в «неописуемых» местах

9 декабря, 2025 Дядя Влад

Только что опубликована самая масштабная запись поведения пользователей в области искусственного интеллекта.

Этот отчёт опубликован OpenRouter, глобальной платформой агрегации моделей, совместно с a16z, ведущей венчурной компанией Кремниевой долины. Он основан на 100 триллионах реальных вызовов API по всему миру, охватывающих более 300 моделей ИИ, более 60 поставщиков и более 50% пользователей за пределами США .

Из этого мы можем видеть, как люди на самом деле используют ИИ, особенно в тех разговорах, которые не будут отражены в официальных документах или описаны в технических документах.

APPSO обнаружила три наиболее противоречивых вывода из этого исследования:

1. Самые настоящие и фундаментальные потребности человечества — не производительность, а «гормоны» и «игровой дом». Более 50% вычислительной мощности моделей с открытым исходным кодом используется для ролевых игр, виртуальных знакомств и контента, не предназначенного для работы с людьми. Написание кода? Это второстепенно.

2. По-настоящему продвинутые пользователи даже не смотрят на цену, в то время как модели, которые настолько дешёвые, что практически бесплатны, как правило, выходят из строя ещё быстрее. Модели, которые решают болевые точки пользователей на ранних этапах, с большей вероятностью удержат их.

3. Китайские модели прорвали оборону всего за год. От 1,2% до 30% китайских моделей, представленных DeepSeek и Qwen, стали королями открытого исходного кода.

Важно отметить, что этот отчет неизбежно содержит «предвзятость».

Пользователями OpenRouter в основном являются индивидуальные разработчики, малые и средние предприятия и энтузиасты открытого исходного кода, а не компании из списка Fortune 500. Крупные компании, которые ежемесячно тратят миллионы долларов на Azure и AWS AI, не включены в эти данные. Следовательно:

Доля китайских моделей будет увеличиваться (малые и средние разработчики охотнее пробуют решения с открытым исходным кодом и недорогие решения).
Доля моделей с открытым исходным кодом будет выше (корпоративные пользователи предпочитают стабильность API с закрытым исходным кодом).
Ролевые игры и другие «развлекательные» сценарии будут иметь значительно более высокий уровень использования (крупные компании не будут использовать для них публичные API).
Фактическое использование гибридных развертываний на уровне предприятия не отображается (все они используют частные серверы и службу Azure OpenAI).

Но оглядываясь назад, можно сказать, что именно в этом и заключается ценность этого отчета.

Пока все на пресс-конференциях расхваливают то, как ИИ изменит производительность, становится ясно, кто остался голышом, кто забирает себе всю добычу, а кто тихо доминирует в этих невыразимых областях.

От 1% до 30% китайские модели пробили трещины в империи OpenAI.

Если рассматривать рынок ИИ как карту мира, то до 2024 года это была империя с закрытым исходным кодом, принадлежавшая OpenAI и Anthropic. Они возвели высокие стены вокруг API, взимали пошлины и устанавливали правила.

Но стена рухнула.

Если взглянуть на эту диаграмму распределения использования, то можно увидеть, что использование токенов в модели с открытым исходным кодом (OSS) выросло до одной трети от общего числа, и это число продолжает расти с тревожной скоростью.

Лето 2024 года стало переломным моментом.

До этого рынок находился в состоянии стагнации. На рынке доминировали серии GPT от OpenAI и Claude от Anthropic, а модели с открытым исходным кодом играли лишь вспомогательную роль.

После этого, с быстрым выпуском Llama 3.3 70B, DeepSeek V3 и Qwen 3 Coder, ситуация мгновенно кардинально изменилась. Некогда доминирующий объём вызовов API начал стремительно падать.

Здесь необходимо обсудить подъем китайской модели, поскольку она стала самой агрессивной темой обсуждения за последний год.

Данные показывают:

Начало 2024 г.: доля Китая в мировом использовании моделей с открытым исходным кодом составила всего 1,2%, что практически ничтожно мало.
К концу 2025 года: этот показатель вырастет до 30%, достигнув пика в некоторые недели.

От 1,2% до 30% — это окружение снизу вверх.

DeepSeek прочно удерживает первое место в рейтинге проектов с открытым исходным кодом, используя в общей сложности 14,37 трлн токенов. Несмотря на то, что его доминирующее положение ослабевает, его масштабы по-прежнему поражают. Qwen идёт следом за ним, занимая второе место с 5,59 трлн токенов, и его показатели в области программирования чрезвычайно впечатляют, напрямую соперничая с Claude.

Но что ещё важнее, темп. Китайские модели выпускаются невероятно часто. DeepSeek выпускает крупные обновления практически каждый квартал, а Qwen обновляется ещё быстрее. Из-за такого «высокочастотного подхода» гигантам Кремниевой долины сложно поспевать за развитием: они едва успевают выпустить новую модель, как их конкуренты уже выпустили три её варианта.

Лопнуть пузырь искусственного интеллекта: три упущенные из виду истины

Давайте теперь развеем эти ложные предположения и посмотрим, для чего на самом деле используется ИИ в реальном мире.

Правда №1: «Маленькие модели умирают, средние модели набирают популярность».

Рынок голосует ногами, отказываясь от «быстрых и глупых» микромоделей.

Данные показывают, что доля рынка моделей с параметрами менее 15 байт стремительно падает. Пользователи обнаруживают, что скорость бесполезна, если ИИ туп, как заезженная пластинка; лучше его вообще не использовать.

Модели среднего размера (параметры 15B–70B) стали новым фаворитом. Этот рынок был открыт Qwen2.5 Coder 32B в ноябре 2024 года. До этого этот диапазон параметров был практически пуст; с тех пор такие модели, как Mistral Small 3 и GPT-OSS 20B, быстро появились на рынке, образовав новое поле битвы.

Модели, которые недостаточно дешевы и не достаточно мощны, теряют долю рынка. Вам нужно либо добиться максимальной мощности, либо максимальной экономичности.

Правда №2: Это не программирование, это скорее игра.

Хотя мы часто видим новостные репортажи о том, как ИИ повышает производительность, при использовании моделей с открытым исходным кодом более 50% трафика уходит на «ролевые игры» .

Говоря более прямо:

Более половины вычислительной мощности ИИ с открытым исходным кодом используется для следующих целей:

Виртуальный любовный разговор («Общайся со мной, помни о моих предпочтениях»)
Ролевая игра («Теперь ты — принцесса эльфов…»)
Интерактивная генерация романа («Продолжите историю и добавьте больше деталей»)
Создание контента для взрослых (в отчете отмечено как «Для взрослых», на долю которого приходится 15,4%).

Это результат анализа сотен миллионов реальных запросов с помощью API классификации естественного языка Google Cloud. Запрос помечается тегом, когда ИИ определяет, что он относится к категории /Для взрослых или /Искусство и развлечения/Ролевые игры.

Это означает, что для огромного числа конечных пользователей ИИ — это в первую очередь «объект эмоциональной проекции» и только во вторую очередь — инструмент .

Тем временем стриминговые сервисы и гиганты Кремниевой долины, из соображений безопасности бренда, намеренно избегали или даже подавляли этот спрос. Но это создало огромный «вакуум спроса и предложения». Потребность пользователей в эмоциональном взаимодействии, захватывающих сюжетах и даже в контенте с пометкой «NSFW» (не предназначенном для детей или для работы) была вытеснена из общественного мнения и в конечном итоге выплеснулась в сообщество разработчиков ПО с открытым исходным кодом.

Программирование — вторая по значимости сфера применения, на неё приходится 15–20%. Всё верно, написание кода, которое так рекламируют СМИ, в реальном мире занимает лишь второе место.

Так в чем же правда?

Перестаньте притворяться. Две самые настоящие и фундаментальные потребности человечества — это гормоны и код. Первые обеспечивают общение и радость, а вторые позволяют нам зарабатывать. Все эти прочие формы «обмена знаниями», «конспектирования документов» и «обучающих занятий» в совокупности составляют лишь малую долю от этих двух.

Это также объясняет, почему модели с открытым исходным кодом получили столь быстрое распространение, поскольку они, как правило, подвергаются меньшей цензуре, предоставляя пользователям больше свободы в настройке персонажей и сюжетных линий, что делает их идеальными для эмоционально окрашенных взаимодействий.

Правда №3: Пользователи DeepSeek, одержимые развлечениями

Если мы извлечем данные DeepSeek отдельно, то обнаружим еще более экстремальное распределение:

– Ролевая игра + неформальное общение: примерно 67%
– Программирование: лишь малая часть

В этом отчёте DeepSeek представлен скорее как инструмент для развлечения потребителей, чем инструмент для повышения производительности. Его пользователи не пишут код, а «встречаются» с искусственным интеллектом.

Это резко контрастирует с Клодом.

Есть только один шанс: победитель забирает все.

Почему некоторые модели обретают лишь кратковременную популярность, а другие прилипают к пользователям как клей?

В докладе представлена концепция: эффект «хрустальной туфельки» Золушки .

Определение: Если при выпуске новой модели она идеально решает давнюю проблему пользователей (например, хрустальная туфелька идеально подходит Золушке по ноге), то эти пользователи станут «ярыми поклонниками» модели (основными постоянными пользователями), и им будет сложно перейти на новую модель, независимо от того, сколько новых моделей будет выпущено в будущем.

Важно отметить, что такая возможность предоставляется раз в жизни. Если на начальном этапе запуска (в период Frontier) не будет достигнут технологический прорыв, который позволит закрепить за этими ключевыми пользователями, то, как бы вы ни старались в дальнейшем, уровень удержания будет крайне низким.

Почему?

Потому что пользователи уже выстроили полный рабочий процесс вокруг этой модели:

– Разработчики интегрировали Клода в процесс CI/CD.
Создатели контента сохранили десятки версий персоны DeepSeek.
Издержки переключения носят не только технический, но также когнитивный и привычный характер.

Профиль победителя: «Эффект бумеранга» DeepSeek

Кривая удержания DeepSeek очень странная:

Пользовательский пробный период → Отток (чтобы попробовать другие модели) → Через некоторое время они возвращаются с жалобами.

Это известно как «эффект бумеранга». Данные показывают, что в апреле 2025 года база пользователей DeepSeek R1 значительно увеличила показатель удержания уже в третий месяц.

Почему они вернулись?

Потому что он «действительно хорош». Перепробовав все модели на рынке, я обнаружил, что DeepSeek по-прежнему предлагает лучшее соотношение цены и качества.

Бесплатно или по очень низким ценам
Достаточно хорошие способности к ролевой игре
Никакой раздражающей цензуры контента

Портрет проигравших: трагедия Llama 4 Mavericks

Напротив, такие модели, как Llama 4 Maverick и Gemini 2.0 Flash, демонстрируют душераздирающе низкие показатели удержания.

С первой недели все пошло по нисходящей спирали, и пути назад нет.

Почему? Потому что они появились слишком поздно и не обладали какими-либо особыми функциями. К моменту их выхода пользователи уже нашли свои «хрустальные туфельки», и новые модели могли стать лишь «запасным вариантом».

На рынке моделей ИИ опоздание означает постоянную маргинализацию.

Дизайн персонажей каждого ИИ

В этой войне никто не может победить всех; каждый либо страдает, либо наслаждается под свою фоновую музыку. Давайте дадим каждому игроку наиболее точное название:

Клод (антрополог): «Бог» инженеров-гетеросексуалов

Персонаж: Ученый и инженер, преуспевающий только в программировании и напрочь лишенный романтики.

Данные не лгут: доля Клода на рынке программирования уже давно превышает 60%. Хотя в последнее время она немного снизилась, она остаётся непреодолимым препятствием для написания кода.

Профиль пользователя:
Более 80% трафика Клода связано с технологиями и кодом.
– Почти никто не использует его для непринужденного общения или ролевых игр.

Клод — как лучший ученик в вашем классе: вы ищете его только во время экзаменов; в остальное время вы с ним никогда не общаетесь.

OpenAI: от «Единственного Бога» до «Посредственного Старого Короля»

Профиль персонажа: бывший Повелитель, теперь — ящик с инструментами

Изменения доли рынка OpenAI оказались чрезвычайно значительными:
– Начало 2024 г.: запросы, связанные с наукой, составили более 50%
– К концу 2025 года: доля специальностей, связанных с наукой, сократится до менее 15%.

Из «единственного и неповторимого бога» он превращается в «набор инструментов, который может всё, но не хорош ни в чём». Хотя GPT-4o Mini по-прежнему может похвастаться высоким уровнем удержания, он уже не единственный вариант на вертикальных рынках.

Основная проблема в том, что он попал в ловушку собственного успеха. ChatGPT превратился в массовый бренд, но это также привело к потере им конкурентных преимуществ в профессиональной сфере.

Google (Gemini): тревога универсалов

Черты характера: Хочет всего, но ни в чем не преуспевает.

Google — это как растерянный универсал. Он присутствует в вопросах и ответах по юриспруденции, науке, переводу и общим знаниям, но:
– Всего 15% доли рынка в сфере программирования.
– Практически не встречается в сфере ролевых игр

Однако на все более вертикальном рынке универсальность означает посредственность.

DeepSeek: Победа варваров

Характер: Нарушитель порядка, играющий не по правилам, король развлечений C-End.

DeepSeek занял свою нишу благодаря исключительной экономической эффективности, доказав, что даже без самых веских логических доводов можно завоевать рынок, будучи «весёлым» и «бесплатным».

Основные данные:
– Общее использование: 14,37 триллиона токенов (первый в открытом исходном коде)
– 67% трафика – это развлечения и ролевые игры.
– Эффект бумеранга очевиден: пользователи возвращаются даже после того, как попробовали что-то другое.

Его успех доказывает одно: на потребительском рынке «достаточно хороший» + «достаточно дешевый» + «неограниченный» могут победить во всем.

xAI (Grok): подход Маска «случайный кулак»

Характер: Неожиданная атака толпы, захват доли рынка путем предложения бесплатных услуг.

Данные Грока очень интересны:
– В первые дни 80% пользователей были программистами (Grok Code Fast оптимизирован для программирования).
– После бесплатной акции внезапно хлынул поток обычных пользователей, что мгновенно усложнило профиль пользователя.

Предложение бесплатных услуг может привлечь трафик, но трафик ≠ лояльность. Как только вы начнёте взимать плату, эти пользователи сразу же уйдут.

Давайте, наконец, поймем этот мир с помощью одного образа.

Современный рынок крупных моделей имеет четко сформированную четырехзвенную структуру:

Во-первых, это лагерь «гигантов эффективности», представленных DeepSeek и Gemini Flash. Их главное преимущество заключается в высоком соотношении цены и производительности — «дешевые и доступные», разработанные специально для больших объёмов данных. Они особенно подходят для повторяющейся «грязной и утомительной работы», не требующей сложных логических рассуждений, что делает их лучшим выбором для тех, кто ищет баланс между эффективностью и стоимостью.

Во-вторых, существует категория «экспертов высокого уровня», где эталонными инструментами являются Claude 3.7 и GPT-4. Несмотря на высокую цену, они завоевали популярность у корпоративных пользователей благодаря своей высочайшей точности и способности решать сложные задачи.

В то же время жизненное пространство лагеря «длинного хвоста» сокращается, а большое количество малых моделей постепенно вытесняется с рынка из-за отсутствия дифференцированных преимуществ и технологических барьеров.

Кроме того, лагерь «разрушителей», в основе которого лежат китайские модели, стремительно растёт. Благодаря частым технологическим обновлениям, экономически эффективным ценовым стратегиям и глубоким возможностям локализации, доля рынка компании продолжает расти, что делает её ключевой силой в преобразовании отраслевого ландшафта.

Тенденция, скрытая за 100 триллионами токенов

В качестве наблюдателей APPSO отметила некоторые тенденции в этом отчете, которые могут определить будущий конкурентный ландшафт ИИ:

1. Многомодельная экосистема — это норма; поклонение одной модели — патология . Разработчики будут строить как блоки, используя Claude для написания кода, DeepSeek для полировки документации и Llama для локального развёртывания. Лояльность? Её не существует.

2. Агенты уже захватили половину рынка. Модели рассуждений теперь занимают более 50% рынка. Мы хотим, чтобы ИИ не просто давал ответы; мы хотим, чтобы ИИ обеспечивал «мыслительный процесс». Многошаговые рассуждения, вызовы инструментов и длинные контексты — вот новые поля битвы.

3. Удержание > Рост <br /> Помимо показателя удержания ранних пользователей, другие показатели роста являются метриками тщеславия.

4. Специализация в вертикальной области более ценна, чем универсальность.
Клод преуспел в программировании, а DeepSeek — в сфере развлечений. Модель, которая пытается сделать всё, в итоге не делает ничего хорошего.

5. Цена — не единственная переменная, но «простота использования» всегда имеет значение . Данные показывают очень слабую корреляцию между ценой и использованием. Пользователи действительно высокого класса нечувствительны к цене, в то время как пользователи бюджетного сегмента признают лишь несколько устройств с «выгодным соотношением цены и качества». Посредственные модели, оказавшиеся посередине, выходят из строя быстрее всего.

6. Наступление китайской модели только началось . Потребовался всего год, чтобы подняться с 1,2% до 30%. Что же дальше? Китай прочно обосновался, установив правила игры или же будет им подчиняться? Это станет самой примечательной историей 2026 года.

Мир ИИ определяется не видением, представленным на презентации продукта, а триллионами токенов, которые пользователи фактически отправляют каждый день.

Среди этих токенов некоторые люди пишут код, чтобы изменить мир, в то время как другие желают спокойной ночи виртуальным подружкам; рациональный код и эмоциональные разговоры гармонично сосуществуют.

Возможно, мы должны признать, что развитие ИИ также является продолжением человеческих желаний.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (WeChat ID: ifanr), где вы сможете как можно скорее ознакомиться с еще более интересным контентом.

ifanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo