100 триллионов токенов показывают, как пользователи по всему миру используют ИИ: половина вычислительной мощности используется в «неописуемых» местах

Только что опубликована самая масштабная запись поведения пользователей в области искусственного интеллекта.
Этот отчёт опубликован OpenRouter, глобальной платформой агрегации моделей, совместно с a16z, ведущей венчурной компанией Кремниевой долины. Он основан на 100 триллионах реальных вызовов API по всему миру, охватывающих более 300 моделей ИИ, более 60 поставщиков и более 50% пользователей за пределами США .

Из этого мы можем видеть, как люди на самом деле используют ИИ, особенно в тех разговорах, которые не будут отражены в официальных документах или описаны в технических документах.
APPSO обнаружила три наиболее противоречивых вывода из этого исследования:
1. Самые настоящие и фундаментальные потребности человечества — не производительность, а «гормоны» и «игровой дом». Более 50% вычислительной мощности моделей с открытым исходным кодом используется для ролевых игр, виртуальных знакомств и контента, не предназначенного для работы с людьми. Написание кода? Это второстепенно.
2. По-настоящему продвинутые пользователи даже не смотрят на цену, в то время как модели, которые настолько дешёвые, что практически бесплатны, как правило, выходят из строя ещё быстрее. Модели, которые решают болевые точки пользователей на ранних этапах, с большей вероятностью удержат их.
3. Китайские модели прорвали оборону всего за год. От 1,2% до 30% китайских моделей, представленных DeepSeek и Qwen, стали королями открытого исходного кода.
Важно отметить, что этот отчет неизбежно содержит «предвзятость».
Пользователями OpenRouter в основном являются индивидуальные разработчики, малые и средние предприятия и энтузиасты открытого исходного кода, а не компании из списка Fortune 500. Крупные компании, которые ежемесячно тратят миллионы долларов на Azure и AWS AI, не включены в эти данные. Следовательно:
- Доля китайских моделей будет увеличиваться (малые и средние разработчики охотнее пробуют решения с открытым исходным кодом и недорогие решения).
- Доля моделей с открытым исходным кодом будет выше (корпоративные пользователи предпочитают стабильность API с закрытым исходным кодом).
- Ролевые игры и другие «развлекательные» сценарии будут иметь значительно более высокий уровень использования (крупные компании не будут использовать для них публичные API).
- Фактическое использование гибридных развертываний на уровне предприятия не отображается (все они используют частные серверы и службу Azure OpenAI).
Но оглядываясь назад, можно сказать, что именно в этом и заключается ценность этого отчета.
Пока все на пресс-конференциях расхваливают то, как ИИ изменит производительность, становится ясно, кто остался голышом, кто забирает себе всю добычу, а кто тихо доминирует в этих невыразимых областях.
От 1% до 30% китайские модели пробили трещины в империи OpenAI.
Если рассматривать рынок ИИ как карту мира, то до 2024 года это была империя с закрытым исходным кодом, принадлежавшая OpenAI и Anthropic. Они возвели высокие стены вокруг API, взимали пошлины и устанавливали правила.
Но стена рухнула.
Если взглянуть на эту диаграмму распределения использования, то можно увидеть, что использование токенов в модели с открытым исходным кодом (OSS) выросло до одной трети от общего числа, и это число продолжает расти с тревожной скоростью.
Лето 2024 года стало переломным моментом.
До этого рынок находился в состоянии стагнации. На рынке доминировали серии GPT от OpenAI и Claude от Anthropic, а модели с открытым исходным кодом играли лишь вспомогательную роль.
После этого, с быстрым выпуском Llama 3.3 70B, DeepSeek V3 и Qwen 3 Coder, ситуация мгновенно кардинально изменилась. Некогда доминирующий объём вызовов API начал стремительно падать.
Здесь необходимо обсудить подъем китайской модели, поскольку она стала самой агрессивной темой обсуждения за последний год.
Данные показывают:
- Начало 2024 г.: доля Китая в мировом использовании моделей с открытым исходным кодом составила всего 1,2%, что практически ничтожно мало.
- К концу 2025 года: этот показатель вырастет до 30%, достигнув пика в некоторые недели.
От 1,2% до 30% — это окружение снизу вверх.
DeepSeek прочно удерживает первое место в рейтинге проектов с открытым исходным кодом, используя в общей сложности 14,37 трлн токенов. Несмотря на то, что его доминирующее положение ослабевает, его масштабы по-прежнему поражают. Qwen идёт следом за ним, занимая второе место с 5,59 трлн токенов, и его показатели в области программирования чрезвычайно впечатляют, напрямую соперничая с Claude.

Но что ещё важнее, темп. Китайские модели выпускаются невероятно часто. DeepSeek выпускает крупные обновления практически каждый квартал, а Qwen обновляется ещё быстрее. Из-за такого «высокочастотного подхода» гигантам Кремниевой долины сложно поспевать за развитием: они едва успевают выпустить новую модель, как их конкуренты уже выпустили три её варианта.
Лопнуть пузырь искусственного интеллекта: три упущенные из виду истины
Давайте теперь развеем эти ложные предположения и посмотрим, для чего на самом деле используется ИИ в реальном мире.
Правда №1: «Маленькие модели умирают, средние модели набирают популярность».
Рынок голосует ногами, отказываясь от «быстрых и глупых» микромоделей.
Данные показывают, что доля рынка моделей с параметрами менее 15 байт стремительно падает. Пользователи обнаруживают, что скорость бесполезна, если ИИ туп, как заезженная пластинка; лучше его вообще не использовать.
Модели среднего размера (параметры 15B–70B) стали новым фаворитом. Этот рынок был открыт Qwen2.5 Coder 32B в ноябре 2024 года. До этого этот диапазон параметров был практически пуст; с тех пор такие модели, как Mistral Small 3 и GPT-OSS 20B, быстро появились на рынке, образовав новое поле битвы.
Модели, которые недостаточно дешевы и не достаточно мощны, теряют долю рынка. Вам нужно либо добиться максимальной мощности, либо максимальной экономичности.
Правда №2: Это не программирование, это скорее игра.
Хотя мы часто видим новостные репортажи о том, как ИИ повышает производительность, при использовании моделей с открытым исходным кодом более 50% трафика уходит на «ролевые игры» .
Говоря более прямо:
Более половины вычислительной мощности ИИ с открытым исходным кодом используется для следующих целей:
- Виртуальный любовный разговор («Общайся со мной, помни о моих предпочтениях»)
- Ролевая игра («Теперь ты — принцесса эльфов…»)
- Интерактивная генерация романа («Продолжите историю и добавьте больше деталей»)
- Создание контента для взрослых (в отчете отмечено как «Для взрослых», на долю которого приходится 15,4%).
Это результат анализа сотен миллионов реальных запросов с помощью API классификации естественного языка Google Cloud. Запрос помечается тегом, когда ИИ определяет, что он относится к категории /Для взрослых или /Искусство и развлечения/Ролевые игры.
Это означает, что для огромного числа конечных пользователей ИИ — это в первую очередь «объект эмоциональной проекции» и только во вторую очередь — инструмент .
Тем временем стриминговые сервисы и гиганты Кремниевой долины, из соображений безопасности бренда, намеренно избегали или даже подавляли этот спрос. Но это создало огромный «вакуум спроса и предложения». Потребность пользователей в эмоциональном взаимодействии, захватывающих сюжетах и даже в контенте с пометкой «NSFW» (не предназначенном для детей или для работы) была вытеснена из общественного мнения и в конечном итоге выплеснулась в сообщество разработчиков ПО с открытым исходным кодом.
Программирование — вторая по значимости сфера применения, на неё приходится 15–20%. Всё верно, написание кода, которое так рекламируют СМИ, в реальном мире занимает лишь второе место.
Так в чем же правда?
Перестаньте притворяться. Две самые настоящие и фундаментальные потребности человечества — это гормоны и код. Первые обеспечивают общение и радость, а вторые позволяют нам зарабатывать. Все эти прочие формы «обмена знаниями», «конспектирования документов» и «обучающих занятий» в совокупности составляют лишь малую долю от этих двух.
Это также объясняет, почему модели с открытым исходным кодом получили столь быстрое распространение, поскольку они, как правило, подвергаются меньшей цензуре, предоставляя пользователям больше свободы в настройке персонажей и сюжетных линий, что делает их идеальными для эмоционально окрашенных взаимодействий.
Правда №3: Пользователи DeepSeek, одержимые развлечениями
Если мы извлечем данные DeepSeek отдельно, то обнаружим еще более экстремальное распределение:
– Ролевая игра + неформальное общение: примерно 67%
– Программирование: лишь малая часть
В этом отчёте DeepSeek представлен скорее как инструмент для развлечения потребителей, чем инструмент для повышения производительности. Его пользователи не пишут код, а «встречаются» с искусственным интеллектом.
Это резко контрастирует с Клодом.
Есть только один шанс: победитель забирает все.
Почему некоторые модели обретают лишь кратковременную популярность, а другие прилипают к пользователям как клей?
В докладе представлена концепция: эффект «хрустальной туфельки» Золушки .
Определение: Если при выпуске новой модели она идеально решает давнюю проблему пользователей (например, хрустальная туфелька идеально подходит Золушке по ноге), то эти пользователи станут «ярыми поклонниками» модели (основными постоянными пользователями), и им будет сложно перейти на новую модель, независимо от того, сколько новых моделей будет выпущено в будущем.
Важно отметить, что такая возможность предоставляется раз в жизни. Если на начальном этапе запуска (в период Frontier) не будет достигнут технологический прорыв, который позволит закрепить за этими ключевыми пользователями, то, как бы вы ни старались в дальнейшем, уровень удержания будет крайне низким.
Почему?
Потому что пользователи уже выстроили полный рабочий процесс вокруг этой модели:
– Разработчики интегрировали Клода в процесс CI/CD.
Создатели контента сохранили десятки версий персоны DeepSeek.
Издержки переключения носят не только технический, но также когнитивный и привычный характер.
Профиль победителя: «Эффект бумеранга» DeepSeek
Кривая удержания DeepSeek очень странная:
Пользовательский пробный период → Отток (чтобы попробовать другие модели) → Через некоторое время они возвращаются с жалобами.
Это известно как «эффект бумеранга». Данные показывают, что в апреле 2025 года база пользователей DeepSeek R1 значительно увеличила показатель удержания уже в третий месяц.
Почему они вернулись?
Потому что он «действительно хорош». Перепробовав все модели на рынке, я обнаружил, что DeepSeek по-прежнему предлагает лучшее соотношение цены и качества.
- Бесплатно или по очень низким ценам
- Достаточно хорошие способности к ролевой игре
- Никакой раздражающей цензуры контента
Портрет проигравших: трагедия Llama 4 Mavericks
Напротив, такие модели, как Llama 4 Maverick и Gemini 2.0 Flash, демонстрируют душераздирающе низкие показатели удержания.
С первой недели все пошло по нисходящей спирали, и пути назад нет.
Почему? Потому что они появились слишком поздно и не обладали какими-либо особыми функциями. К моменту их выхода пользователи уже нашли свои «хрустальные туфельки», и новые модели могли стать лишь «запасным вариантом».
На рынке моделей ИИ опоздание означает постоянную маргинализацию.
Дизайн персонажей каждого ИИ
В этой войне никто не может победить всех; каждый либо страдает, либо наслаждается под свою фоновую музыку. Давайте дадим каждому игроку наиболее точное название:
Клод (антрополог): «Бог» инженеров-гетеросексуалов
Персонаж: Ученый и инженер, преуспевающий только в программировании и напрочь лишенный романтики.
Данные не лгут: доля Клода на рынке программирования уже давно превышает 60%. Хотя в последнее время она немного снизилась, она остаётся непреодолимым препятствием для написания кода.
Профиль пользователя:
Более 80% трафика Клода связано с технологиями и кодом.
– Почти никто не использует его для непринужденного общения или ролевых игр.
Клод — как лучший ученик в вашем классе: вы ищете его только во время экзаменов; в остальное время вы с ним никогда не общаетесь.
OpenAI: от «Единственного Бога» до «Посредственного Старого Короля»
Профиль персонажа: бывший Повелитель, теперь — ящик с инструментами
Изменения доли рынка OpenAI оказались чрезвычайно значительными:
– Начало 2024 г.: запросы, связанные с наукой, составили более 50%
– К концу 2025 года: доля специальностей, связанных с наукой, сократится до менее 15%.
Из «единственного и неповторимого бога» он превращается в «набор инструментов, который может всё, но не хорош ни в чём». Хотя GPT-4o Mini по-прежнему может похвастаться высоким уровнем удержания, он уже не единственный вариант на вертикальных рынках.
Основная проблема в том, что он попал в ловушку собственного успеха. ChatGPT превратился в массовый бренд, но это также привело к потере им конкурентных преимуществ в профессиональной сфере.
Google (Gemini): тревога универсалов
Черты характера: Хочет всего, но ни в чем не преуспевает.
Google — это как растерянный универсал. Он присутствует в вопросах и ответах по юриспруденции, науке, переводу и общим знаниям, но:
– Всего 15% доли рынка в сфере программирования.
– Практически не встречается в сфере ролевых игр
Однако на все более вертикальном рынке универсальность означает посредственность.
DeepSeek: Победа варваров
Характер: Нарушитель порядка, играющий не по правилам, король развлечений C-End.
DeepSeek занял свою нишу благодаря исключительной экономической эффективности, доказав, что даже без самых веских логических доводов можно завоевать рынок, будучи «весёлым» и «бесплатным».
Основные данные:
– Общее использование: 14,37 триллиона токенов (первый в открытом исходном коде)
– 67% трафика – это развлечения и ролевые игры.
– Эффект бумеранга очевиден: пользователи возвращаются даже после того, как попробовали что-то другое.
Его успех доказывает одно: на потребительском рынке «достаточно хороший» + «достаточно дешевый» + «неограниченный» могут победить во всем.
xAI (Grok): подход Маска «случайный кулак»
Характер: Неожиданная атака толпы, захват доли рынка путем предложения бесплатных услуг.
Данные Грока очень интересны:
– В первые дни 80% пользователей были программистами (Grok Code Fast оптимизирован для программирования).
– После бесплатной акции внезапно хлынул поток обычных пользователей, что мгновенно усложнило профиль пользователя.
Предложение бесплатных услуг может привлечь трафик, но трафик ≠ лояльность. Как только вы начнёте взимать плату, эти пользователи сразу же уйдут.
Давайте, наконец, поймем этот мир с помощью одного образа.
Современный рынок крупных моделей имеет четко сформированную четырехзвенную структуру:
Во-первых, это лагерь «гигантов эффективности», представленных DeepSeek и Gemini Flash. Их главное преимущество заключается в высоком соотношении цены и производительности — «дешевые и доступные», разработанные специально для больших объёмов данных. Они особенно подходят для повторяющейся «грязной и утомительной работы», не требующей сложных логических рассуждений, что делает их лучшим выбором для тех, кто ищет баланс между эффективностью и стоимостью.
Во-вторых, существует категория «экспертов высокого уровня», где эталонными инструментами являются Claude 3.7 и GPT-4. Несмотря на высокую цену, они завоевали популярность у корпоративных пользователей благодаря своей высочайшей точности и способности решать сложные задачи.
В то же время жизненное пространство лагеря «длинного хвоста» сокращается, а большое количество малых моделей постепенно вытесняется с рынка из-за отсутствия дифференцированных преимуществ и технологических барьеров.
Кроме того, лагерь «разрушителей», в основе которого лежат китайские модели, стремительно растёт. Благодаря частым технологическим обновлениям, экономически эффективным ценовым стратегиям и глубоким возможностям локализации, доля рынка компании продолжает расти, что делает её ключевой силой в преобразовании отраслевого ландшафта.
Тенденция, скрытая за 100 триллионами токенов
В качестве наблюдателей APPSO отметила некоторые тенденции в этом отчете, которые могут определить будущий конкурентный ландшафт ИИ:
1. Многомодельная экосистема — это норма; поклонение одной модели — патология . Разработчики будут строить как блоки, используя Claude для написания кода, DeepSeek для полировки документации и Llama для локального развёртывания. Лояльность? Её не существует.
2. Агенты уже захватили половину рынка. Модели рассуждений теперь занимают более 50% рынка. Мы хотим, чтобы ИИ не просто давал ответы; мы хотим, чтобы ИИ обеспечивал «мыслительный процесс». Многошаговые рассуждения, вызовы инструментов и длинные контексты — вот новые поля битвы.
3. Удержание > Рост <br /> Помимо показателя удержания ранних пользователей, другие показатели роста являются метриками тщеславия.
4. Специализация в вертикальной области более ценна, чем универсальность.
Клод преуспел в программировании, а DeepSeek — в сфере развлечений. Модель, которая пытается сделать всё, в итоге не делает ничего хорошего.
5. Цена — не единственная переменная, но «простота использования» всегда имеет значение . Данные показывают очень слабую корреляцию между ценой и использованием. Пользователи действительно высокого класса нечувствительны к цене, в то время как пользователи бюджетного сегмента признают лишь несколько устройств с «выгодным соотношением цены и качества». Посредственные модели, оказавшиеся посередине, выходят из строя быстрее всего.
6. Наступление китайской модели только началось . Потребовался всего год, чтобы подняться с 1,2% до 30%. Что же дальше? Китай прочно обосновался, установив правила игры или же будет им подчиняться? Это станет самой примечательной историей 2026 года.
Мир ИИ определяется не видением, представленным на презентации продукта, а триллионами токенов, которые пользователи фактически отправляют каждый день.
Среди этих токенов некоторые люди пишут код, чтобы изменить мир, в то время как другие желают спокойной ночи виртуальным подружкам; рациональный код и эмоциональные разговоры гармонично сосуществуют.
Возможно, мы должны признать, что развитие ИИ также является продолжением человеческих желаний.
#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (WeChat ID: ifanr), где вы сможете как можно скорее ознакомиться с еще более интересным контентом.
ifanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo




