100 триллионов токенов показывают, как пользователи по всему миру используют ИИ: половина вычислительной мощности используется в «невообразимых» местах.

11 декабря, 2025 Дядя Влад

Опубликованы самые масштабные в истории данные о поведении пользователей в области искусственного интеллекта.

Это отчет, опубликованный OpenRouter, глобальной платформой агрегации моделей, совместно с a16z, ведущей венчурной компанией Кремниевой долины. Он основан на 100 триллионах реальных вызовов API по всему миру, охватывающих более 300 моделей ИИ, более 60 поставщиков и более 50% пользователей за пределами США .

Из этого мы можем увидеть, как люди действительно используют ИИ, особенно те диалоги, которые не будут фигурировать в официальных отчетах или в аналитических документах.

APPSO сделала три наиболее нелогичных вывода:

1. Самые подлинные и фундаментальные потребности человечества — это не продуктивность, а «гормоны» и «игра в семью». Более 50% вычислительной мощности моделей с открытым исходным кодом используется для ролевых игр, виртуальных знакомств и контента для взрослых. Написание кода? Это второстепенно.

2. Пользователи действительно продвинутых устройств даже не смотрят на ценник, в то время как модели, которые настолько дешевы, что практически бесплатны, как правило, терпят неудачу еще быстрее. Модели, которые решают проблемы пользователей на ранних этапах, с большей вероятностью удержат пользователей.

3. Китайские модели прорвали защиту всего за один год. С 1,2% до 30% разработанные внутри страны модели, представленные DeepSeek и Qwen, стали королями открытого исходного кода.

Важно отметить, что данный отчет неизбежно содержит «предвзятость».

В основном пользователями OpenRouter являются индивидуальные разработчики, малые и средние предприятия, а также энтузиасты открытого исходного кода, а не компании из списка Fortune 500. Крупные компании, которые ежемесячно тратят миллионы долларов на бюджеты Azure и AWS в области ИИ, в эти данные не включены. Поэтому:

Доля китайских моделей увеличится (малые и средние разработчики охотнее пробуют решения с открытым исходным кодом и недорогие варианты).
Доля рынка моделей с открытым исходным кодом переоценена (корпоративные пользователи, как правило, предпочитают стабильность API с закрытым исходным кодом).
Ролевые игры и другие «развлекательные» сценарии будут использоваться значительно чаще (крупные компании не будут использовать для этого общедоступные API).
Фактическое использование гибридных развертываний корпоративного уровня не отображается (все они используют частные серверы и службу Azure OpenAI).

Но, оглядываясь назад, понимаешь, что именно в этом и заключается ценность этого отчета.

Пока все на пресс-конференции расхваливали, как искусственный интеллект преобразует производительность, мы ясно видели, кто плавает голым, кто доминирует, а кто тихо правит в этих невыразимых областях.

Китайские модели, демонстрирующие эффективность от 1% до 30%, вскрыли трещины в империи OpenAI.

Если рассматривать рынок ИИ как карту мира, то до 2024 года это была империя закрытого исходного кода, принадлежавшая компаниям OpenAI и Anthropic. Они возвели высокие стены вокруг API, взимали плату и определяли правила.

Но стена рухнула.

Судя по диаграмме распределения использования, доля токенов, используемых в модели с открытым исходным кодом (OSS), выросла до одной трети от общего числа, и эта цифра продолжает расти с пугающей скоростью.

Лето 2024 года стало переломным моментом.

До этого рынок находился в состоянии стагнации. Серия GPT от OpenAI и Claude от Anthropic доминировали на рынке, а модели с открытым исходным кодом играли лишь вспомогательную роль.

Впоследствии, с быстрым выпуском Llama 3.3 70B, DeepSeek V3 и Qwen 3 Coder, ситуация мгновенно резко изменилась. Некогда доминирующий объем вызовов API начал резко падать.

Здесь необходимо обсудить рост популярности китайской модели, поскольку это стало наиболее агрессивной темой за последний год.

Данные показывают:

Начало 2024 года: доля Китая в глобальном использовании моделей с открытым исходным кодом составляла всего 1,2%, что практически ничтожно мало.
К концу 2025 года этот показатель резко возрастет до 30%, достигнув пика даже в отдельные недели.

От 1,2% до 30% — это битва за окружение снизу вверх.

DeepSeek прочно удерживает первое место в рейтинге проектов с открытым исходным кодом, используя в общей сложности 14,37 триллиона токенов. Хотя его доминирующее положение постепенно ослабевает, масштаб проекта остается поразительным. За ним следует Qwen, занимающий второе место с 5,59 триллионами токенов, и его показатели в области программирования чрезвычайно высоки, напрямую конкурируя с Claude.

Что еще более важно, так это темп. Китайские модели выпускаются чрезвычайно часто. DeepSeek выпускает крупные обновления почти каждый квартал, а Qwen обновляется еще быстрее. Такой «высокочастотный подход» приводит к тому, что гигантам Кремниевой долины трудно угнаться за ними: они едва выпустили новую модель, как их конкуренты уже выпустили три варианта.

Развенчание мифа об искусственном интеллекте: три упущенные из виду истины

Давайте развеем эти иллюзии и посмотрим, для чего на самом деле используется ИИ в реальном мире.

Истина №1: «Маленькие модели устарели, средние модели набирают популярность».

Рынок голосует ногами, отказываясь от этих "быстрых и глупых" микромоделей.

Данные показывают, что рыночная доля моделей с параметрами менее 15 байт резко падает. Пользователи обнаруживают, что скорость бесполезна, если ИИ настолько глуп, насколько заезжена пластинка; лучше вообще его не использовать.

Модели среднего размера (15–70 параметров) стали новыми фаворитами. Этот рынок был создан еще в ноябре 2024 года моделью Qwen2.5 Coder 32B. До этого диапазон параметров был практически пуст; с тех пор быстро появились такие модели, как Mistral Small 3 и GPT-OSS 20B, сформировав новое поле битвы.

Модели, которые не являются ни достаточно дешевыми, ни достаточно мощными, теряют долю рынка. Вам нужно либо достичь максимальной мощности, либо максимальной экономической эффективности.

Истина №2: Дело не в программировании, а скорее в игре.

Хотя мы часто видим новостные сообщения о том, как ИИ повышает производительность, более 50% трафика при использовании моделей с открытым исходным кодом приходится на «ролевые игры» .

Говоря прямо:

Более половины вычислительных мощностей в области искусственного интеллекта с открытым исходным кодом используется для этих целей:

Виртуальный разговор с возлюбленным («Пообщайся со мной, запомни мои предпочтения»)
Ролевая игра («Теперь ты эльфийская принцесса…»)
Интерактивное создание романов («Продолжите историю и добавьте подробности»)
Создание контента, ориентированного на взрослую аудиторию (отмеченного в отчете как «Для взрослых», на него приходится 15,4%)

Это результат анализа сотен миллионов реальных запросов с использованием API классификации естественного языка Google Cloud. Запрос помечается, когда ИИ определяет, что он относится к /Adult или /Arts & Entertainment/Roleplaying Games.

Это означает, что для огромного числа конечных пользователей ИИ является прежде всего «объектом эмоциональной проекции», и лишь во вторую очередь инструментом .

Тем временем стриминговые сервисы и гиганты Кремниевой долины, из соображений безопасности бренда, намеренно избегали или даже подавляли этот спрос. Но это создало огромный «вакуум спроса и предложения». Желание пользователей к эмоциональному взаимодействию, захватывающим сюжетным линиям и даже контенту, не предназначенному для детей или для просмотра на работе (NSFW), было вытеснено из поля зрения широкой публики и в конечном итоге вылилось в жизнь сообщества разработчиков открытого программного обеспечения.

Программирование — второй по величине вариант применения, на него приходится 15-20%. Да, написание кода, которое так часто рекламируют СМИ, в реальном мире занимает лишь второе место.

Так в чём же правда?

Прекратите притворяться. Две самые подлинные и фундаментальные потребности человечества — это гормоны и программирование. Первая обеспечивает общение и удовольствие, а вторая позволяет нам зарабатывать деньги. Все остальные формы «обмена знаниями», «составления резюме документов» и «обучения» вместе взятые составляют лишь малую долю от этих двух.

Это также объясняет, почему модели с открытым исходным кодом так быстро получили распространение, поскольку они, как правило, подвергаются меньшей цензуре, предоставляя пользователям больше свободы в настройке персонажей и сюжетных линий, что делает их идеальными для эмоционально сложных взаимодействий.

Правда №3: Пользователи DeepSeek, одержимые развлечениями.

Если мы выделим данные DeepSeek отдельно, то обнаружим еще более экстремальное распределение:

– Ролевые игры + Неформальное общение: Примерно 67%
– Программирование: лишь малая часть

В этом отчете DeepSeek представлен скорее как развлекательный инструмент для потребителей, чем как инструмент повышения производительности. Его пользователи не пишут код; они «встречаются» с искусственным интеллектом.

Это резко контрастирует с Клодом.

Шанс только один; победитель забирает всё.

Почему одни модели пользуются популярностью лишь мимолетный момент, а другие прилипают к пользователям как приклеенные?

В докладе представлена концепция: эффект «хрустальной туфельки» Золушки .

Определение: Если при выпуске новой модели она идеально решает давнюю проблему пользователей (например, хрустальная туфелька идеально подходит к ногам Золушки), эти пользователи становятся «преданными поклонниками» этой модели (обычными пользователями, которые продолжают пользоваться сервисом), и им будет сложно перейти на другую платформу, независимо от того, сколько новых моделей будет выпущено в будущем.

Важно отметить, что это уникальная возможность. Если на начальном этапе запуска (период «передового опыта») не будет достигнут технологический прорыв, позволяющий удержать этих ключевых пользователей, то, как бы вы ни старались впоследствии, уровень удержания будет крайне низким.

Почему?

Поскольку пользователи уже выстроили полноценный рабочий процесс на основе этой модели:

– Разработчики интегрировали Клода в процесс CI/CD.
Создатели контента сохранили десятки версий образа DeepSeek.
Затраты на смену поставщика обусловлены не только техническими факторами, но и когнитивными процессами, а также особенностями привычек.

Профиль победителя: «Эффект бумеранга» от DeepSeek

Кривая удержания пользователей DeepSeek выглядит очень странно:

Пробный период использования → Отток пользователей (для тестирования других моделей) → Через некоторое время они возвращаются с жалобами.

Это явление известно как «эффект бумеранга». Данные показывают, что в апреле 2025 года пользовательская база DeepSeek R1 продемонстрировала значительное увеличение показателя удержания пользователей на третьем месяце.

Почему они вернулись?

Потому что это "действительно хорошо". После тестирования всех моделей, представленных на рынке, я обнаружил, что DeepSeek по-прежнему предлагает лучшее соотношение цены и качества.

Бесплатно или по очень низким ценам
Достаточно хорошие навыки ролевой игры
Отсутствие раздражающей цензуры контента.

Портрет проигравших: Трагедия «Ламы 4 Маверикс»

Напротив, у таких моделей, как Llama 4 Maverick и Gemini 2.0 Flash, показатель удержания внимания крайне низок.

С первой недели всё идёт по нисходящей спирали, и пути назад нет.

Почему? Потому что они появились слишком поздно и не обладали никакими особыми функциями. К моменту их выпуска пользователи уже нашли свои «хрустальные туфельки», и новые модели могли стать лишь «запасными вариантами».

На рынке моделей искусственного интеллекта опоздание означает пожизненную маргинализацию.

Дизайн персонажей каждого ИИ

В этой войне никто не может победить всех; каждый либо страдает, либо наслаждается собственной жизнью. Давайте присвоим каждому игроку наиболее точное обозначение:

Клод (антропический): «Бог» инженеров-гетеросексуалов.

Персонаж: Парень из сферы науки и техники, который преуспевает только в программировании и совершенно не склонен к романтическим отношениям.

Данные не лгут; Claude долгое время занимал более 60% рынка программирования. Хотя в последнее время его позиции несколько снизились, он по-прежнему остается непреодолимым препятствием для написания кода.

Профиль пользователя:
Более 80% трафика Claude связано с технологиями и программированием.
– Практически никто не использует его для непринужденного общения или ролевых игр.

Клод — как лучший ученик в классе: вы ищете с ним встречи только во время экзаменов, в остальное время вы с ним никогда не общаетесь.

OpenAI: от «Единственного Бога» до «Посредственного старого короля»

Описание персонажа: Бывший повелитель, теперь — мастер на все руки.

Изменения рыночной доли OpenAI были чрезвычайно резкими:
– Начало 2024 года: запросы, связанные с наукой, составили более 50%
– К концу 2025 года: доля студентов, обучающихся по естественнонаучным специальностям, сократится до менее чем 15%.

Он превращается из «единственного в своем роде бога» в «набор инструментов, который может все, но ни в чем не хорош». Хотя GPT-4o Mini по-прежнему может похвастаться высоким уровнем удержания пользователей, он больше не является единственным вариантом на вертикальных рынках.

Главная проблема в том, что компания оказалась в ловушке собственного успеха. ChatGPT создала себе бренд для массового рынка, но это также привело к потере конкурентных преимуществ в профессиональной сфере.

Google (Близнецы): Тревога универсалов

Характерные черты: Хочет всего, но ни в чём не преуспевает.

Google подобен растерянному специалисту широкого профиля. Он присутствует в юриспруденции, науке, переводе и вопросах и ответах на общие вопросы, но:
– Доля рынка в сфере программирования составляет всего 15%.
– Практически отсутствует в сфере ролевых игр.

Но на все более вертикально интегрированном рынке универсальность означает посредственность.

DeepSeek: Победа варваров

Персонаж: бунтарь, не играющий по правилам, король развлечений для среднего и высокого уровня.

DeepSeek занял свою нишу благодаря исключительной экономичности, доказав, что даже без самых веских логических рассуждений можно завоевать рынок, будучи «веселым» и «бесплатным».

Ключевые данные:
– Общее использование: 14,37 триллионов токенов (первое место в открытом исходном коде)
– 67% трафика приходится на развлекательный контент и ролевые игры.
– Эффект бумеранга очевиден; пользователи вернутся, даже попробовав что-то другое.

Его успех доказывает одно: на потребительском рынке сочетание «достаточно хорошего качества» + «достаточно дешевого качества» + «отсутствие ограничений» может обеспечить победу во всем.

xAI (Grok): подход Маска «случайный кулак»

Персонаж: Внезапная атака толпы, захватывающая долю рынка путем предложения бесплатных услуг.

Данные Грока очень интересны:
– На начальном этапе 80% пользователей были программистами (Grok Code Fast оптимизирован для программирования).
– После бесплатной акции внезапно хлынул поток обычных пользователей, что мгновенно усложнило пользовательский профиль.

Предложение бесплатных услуг может привлечь трафик, но трафик ≠ лояльность. Как только вы начнете взимать плату, эти пользователи немедленно уйдут.

Наконец, давайте поймем этот мир с помощью одного-единственного изображения.

Современный рынок крупных моделей четко сформировал четырехкомпонентную структуру:

Во-первых, есть лагерь «гигантов эффективности», представленный DeepSeek и Gemini Flash. Их главное преимущество заключается в высоком соотношении цены и производительности, «дешевизне и доступности», разработанных специально для сценариев с большими объемами данных. Они особенно подходят для повторяющейся «грязной и утомительной работы», не требующей сложных логических рассуждений, что делает их лучшим выбором для тех, кто ищет баланс между эффективностью и стоимостью.

Во-вторых, существует категория «высококлассных экспертов», эталонами в которой являются Claude 3.7 и GPT-4. Несмотря на высокую цену, они завоевали популярность среди корпоративных пользователей благодаря своей высочайшей точности и способности справляться со сложными задачами.

В то же время жилое пространство «длиннохвостого» сегмента сокращается, и большое количество малолитражных моделей постепенно вытесняются с рынка из-за отсутствия отличительных преимуществ и технологических барьеров.

Кроме того, стремительно набирает силу лагерь «подрывных компаний», в основе которого лежат китайские модели. Благодаря частым технологическим обновлениям, экономически эффективным ценовым стратегиям и широким возможностям локализации, ее рыночная доля продолжает расти, что делает ее ключевой силой в изменении ландшафта отрасли.

Тенденция, скрытая за 100 триллионами токенов.

В качестве наблюдателей APPSO выявила в этом отчете ряд тенденций, которые могут определить будущую конкурентную среду в сфере искусственного интеллекта:

1. Многомодельная экосистема — это норма; поклонение одной модели — это патология . Разработчики будут создавать как блоки, используя Claude для написания кода, DeepSeek для улучшения документации и Llama для локального развертывания. Лояльность? Ее не существует.

2. Агенты уже захватили половину рынка. На долю моделей рассуждений сейчас приходится более 50% рынка. Нам больше не нужно просто, чтобы ИИ давал ответ; нам нужен ИИ, который будет обеспечивать «мыслительный процесс». Многоэтапные рассуждения, вызовы инструментов и длинные контексты — это новые поля битвы.

3. Удержание > Рост <br /> За исключением показателя удержания пользователей на ранних этапах, другие показатели роста являются лишь показателями тщеславия.

4. Специализация в определенной вертикальной области ценнее, чем универсальность.
Клод преуспевает в программировании, а DeepSeek безраздельно правит в индустрии развлечений. Модель, которая пытается делать всё, в итоге ничего не делает хорошо.

5. Цена — не единственный фактор, но «удобство использования» всегда является ценным активом . Данные показывают очень слабую корреляцию между ценой и использованием. Пользователи действительно продвинутых устройств нечувствительны к цене, в то время как пользователи бюджетных устройств видят лишь немногие устройства, предлагающие оптимальное соотношение цены и качества. Модели среднего уровня, оказавшиеся посередине, исчезают быстрее всего.

6. Наступление китайской модели только начинается . Потребовался всего один год, чтобы подняться с 1,2% до 30%. Укрепив свои позиции, что дальше? Будет ли она определять правила игры или будет ими подчинена? Это станет самой примечательной историей 2026 года.

Мир искусственного интеллекта определяется не концепцией, представленной на презентации продукта, а триллионами токенов, которые пользователи фактически отправляют каждый день.

Среди этих символов одни люди пишут код, чтобы изменить мир, а другие желают спокойной ночи виртуальным подругам; рациональный код и эмоциональные разговоры гармонично сосуществуют.

Возможно, нам следует признать, что развитие ИИ также является продолжением человеческих желаний.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.

ifanr | Оригинальная ссылка · Посмотреть комментарии · Sina Weibo