Маск потратил 10 миллиардов долларов, чтобы выяснить одну вещь: не становиться программистом — это все равно что ждать смерти.

1.
Два главных соперника OpenAI, Anthropic и Маск, наконец, в начале месяца сформировали альянс, отбросив свои предрассудки.
До этого отношения между Anthropic и Маском были напряженными: в феврале этого года Маск обвинил Anthropic в своем аккаунте на X в том, что компания «прогрессивна», «зла» и «мизантропична», назвав ее «антицивилизационной».

Оглядываясь назад, можно сказать, что эта атака была вызвана не неординарным характером Маска, а скорее тем, что действия компании Anthropic задели его за живое, и этому была причина.
Ранее компания xAI использовала Cursor внутри компании, но в начале этого года сотрудники обнаружили, что модель Клода внезапно стала непригодна для использования в корпоративном аккаунте xAI Cursor.
Ву Юхуай, соучредитель, который в то время еще работал в xAI, написал в электронном письме всем сотрудникам: «Anthropic обновила свою политику, обязав Cursor не предоставлять своим основным конкурентам возможность вызывать модели Клода».
В то время У Юхуай написал в своем письме довольно интересное предложение:
«Это одновременно и плохая, и хорошая новость. Это повлияет на нашу производительность, но также побудит нас разрабатывать собственные программные продукты и модели».
Почему высшее руководство xAI в то время считало разработку собственных программных продуктов крайне важной?

Дальнейшие события хорошо известны. Вся команда основателей xAI скрылась, и Маск, в приступе гнева, использовал свою финансовую мощь, чтобы нанести последний удар по Cursor:
В конце прошлого месяца SpaceX и Cursor совместно объявили о беспрецедентном стратегическом партнерстве по обучению моделей искусственного интеллекта для программирования и работы, требующей специальных знаний; кроме того, SpaceX также приобрела право на приобретение Cursor за 60 миллиардов долларов или выплату последней 10 миллиардов долларов в качестве платы за сотрудничество.
Обратите внимание на ключевое слово « programming », которое будет использовано позже в разделе обратного вызова.
2.
Недавно я посмотрел видео с участием Тео Брауна, одного из первых инвесторов Cursor, ярого критика Anthropic и основателя T3.
Изначально я зашёл на сайт, чтобы посмотреть, как он критикует AstraZeneca и SpaceX за их нечестные сделки, но неожиданно обнаружил уникальный, но при этом крайне разумный анализ сотрудничества SpaceX и Cursor:
Если оставить в стороне сделку на 60 миллиардов, то, учитывая лишь плату за сотрудничество в размере 10 миллиардов , Тео заявил в видео, что, по его мнению, «даже если речь идет всего лишь об обмене пользовательскими данными Cursor, эти 10 миллиардов того стоят».

Наш диалог с ИИ — это процесс обмена сообщениями: вы задаёте вопросы/делаете запросы, а он предоставляет ответы; программист работает аналогично, за исключением того, что он возвращает код.

Высококачественный диалог, весь процесс, включая подсказки пользователя, моделирование, планирование действий агента, вывод кода и проверку — все это вместе можно назвать полным циклом работы агента — становится ценными обучающими данными. Передача этих данных модели для обучения с подкреплением может еще больше улучшить производительность модели в реальных условиях.

У Cursor есть эти данные, и это именно то, что нужно SpaceX.
Но откуда берутся эти данные?
Ответ прост: для поставщика моделей наиболее прямым источником этих высококачественных данных может быть только ваш собственный продукт — Claude Code от Anthropic, Codex от OpenAI и Kimi Code от Kimi.
Теперь вы должны понимать, почему после «бана» со стороны Anthropic У Юхуай в электронном письме всему персоналу предложил разработать собственные продукты и модели программирования для xAI. xAI это уже тогда прекрасно понимала:
Без собственных программных продуктов нам не хватает высококачественных данных для обучения с подкреплением; без высококачественных данных мы не можем обучать действительно практичные модели программирования.
Хотя это может показаться несколько радикальным, теперь перейдем к сути: для того, чтобы производители моделей могли создавать действительно конкурентоспособные модели программирования, разработка собственных продуктов в виде агентов для кодирования — единственный выход.
3.
Крупные языковые модели подобны хрустальным шарам, обученным на корпусах данных со всего интернета, и, кажется, способны ответить на все вопросы, но это не значит, что они могут дать высококачественные ответы на все вопросы.
Обучение модели программирования на основе сотен миллионов фрагментов кода с GitHub, безусловно, возможно. В этом и заключается логика «результатов обучения», и она верна. В конце концов, результаты выполнения задач по программированию поддаются проверке: работает ли код или проходит ли тесты — это и есть доказательство.
Однако процесс, ведущий к результату, представляет собой сложную цепочку, включающую многоэтапное принятие решений, исправление ошибок и согласование намерений. Каждый случай принятия пользователем, отклонения, завершения, отзыва, дополнительных вопросов или даже словесных оскорблений, когда модель несколько раз дает сбой или допускает полную ошибку, — все это сигналы процесса на этом пути.

В обучении с подкреплением существует два типа контроля. Один из них называется контролем результата, который проверяет только успешность выполнения кода в конце. Однако контроль результата может привести к феномену «вознаграждения хакеров»: чтобы заставить код работать, модель может написать избыточный, ненадежный и логически ошибочный код, но поскольку он был протестирован, модель считает, что она правильно обучалась.
Другой тип называется контролем процесса, который оценивает каждый шаг на пути вывода. Эти сигналы процесса могут генерироваться только в среде выполнения агента программирования. Репозиторий GitHub содержит только результаты; даже просмотр истории отдельных коммитов или запросов на слияние не выявит никаких действительных сигналов процесса.
В условиях отсутствия эффективных и независимо получаемых технологических сигналов некоторые производители моделей используют метод «дистилляции», который вам, вероятно, уже знаком.
Логика дистилляции проста: при одинаковых входных данных модель-учитель будет обучаться выдавать то же самое, что и модель-ученик. Однако, несмотря на то, что дистилляция может отразить мыслительный процесс, результат все же ближе к конечному, чем распределение вероятностей внутри дистиллированной модели-учителя.
Если ученик отклоняется от логики учителя, даже один неверный символ может привести к отклонению от неё.

Это связано с фундаментальным ограничением обучения с подкреплением: теорема о градиенте политики требует, чтобы выборки для оптимизации в идеале генерировались моделью, которая в данный момент оптимизируется. Этот тип данных называется данными, полученными в ходе выполнения политики. Обучение собственной модели с использованием данных, сгенерированных из продуктов других моделей (полученных путем экстраполяции данных из других моделей), относится к категории данных, полученных вне политики. Хотя модель, безусловно, может обучаться на этих данных, полученных вне политики, она не может усвоить информацию о распределении вероятностей внутри исходной модели.
Компании, подобные Cursor, которые сами являются разработчиками программных агентов, обладают наиболее достоверными, эффективными и высококачественными обучающими данными. Сам продукт Cursor — это лучшая площадка для обучения моделей программирования в реальных условиях.
В качестве доказательства этой логики можно привести "сбой" в работе Cursor в начале года.
4.

Вскоре после этого пользователи сети обнаружили идентификатор модели Kimi в общедоступных фрагментах кода, и скриншоты распространились по всему сообществу разработчиков, вынудив вице-президента Cursor Ли Робинсона уточнить: «Composer 2 действительно был создан на основе платформы с открытым исходным кодом. В конечном итоге, только около 1/4 вычислительной мощности модели была обеспечена этой платформой, а оставшиеся 3/4 были обучены нами».
Несколько часов спустя соучредитель Cursor Аман Сангер также опубликовал извинение: «Было ошибкой не упомянуть базу Кими в самом начале».

Пять дней спустя компания Cursor опубликовала полный технический отчет по Composer 2, в котором указывалось, что в качестве основы действительно использовалась Kimi K2.5, лицензиаром была компания Firworks AI, а общий процесс заключался в обучении на K2.5 с последующим переходом к крупномасштабному обучению с подкреплением (RL).
Ключевой момент заключается в том, что RL в Composer 2 работает в реальной сессии Cursor, используя те же самые инструменты и средства, что и в производственной среде.
В Cursor этот процесс называется «обучением с подкреплением в реальном времени», что означает развертывание контрольной точки модели непосредственно в производственной среде Cursor для наблюдения за реакциями пользователей, сбора данных и их агрегирования в сигналы вознаграждения — модель может обновляться каждые 5 часов, а затем развертываться в Cursor, повторяя цикл.
Наиболее яркий пример — функция Tab в Cursor для автоматического автозавершения кода, которая обрабатывает более 400 миллионов запросов каждый день. Каждый раз, когда пользователь вводит символы или перемещает курсор, модель предсказывает следующее действие. Если уверенность в предсказании высока, она отображает подсказки, и пользователь нажимает Tab, чтобы принять автозавершение.
Эта функция использует онлайн-обучение с подкреплением, что является уникальной особенностью в отрасли. Cursor может обновлять возможности модели Tab для пользователей с чрезвычайно высокой частотой (до полутора-двух часов), собирая данные о политике непосредственно в продукте для обучения.
Эта высокочастотная обратная связь, работающая практически в режиме реального времени, позволяет Tab изучать крайне тонкие намерения пользователей. Компания Cursor сообщила, что этот метод снизил процент отказов Tab на 21% и увеличил процент одобрений на 28%.
Возвращаясь к самой модели Composer, после того, как ситуация прояснилась, некоторые сотрудники Kimi удалили свои предыдущие саркастические твиты, а официальный аккаунт Kimi опубликовал поздравление.
Компания, занимающаяся разработкой прикладных уровней для программистов и оцениваемая в 60 миллиардов долларов (по данным Маска), которая не создает собственную базу моделей, все равно может использовать свой собственный механизм обработки данных для создания собственных моделей программирования, выходящих за рамки базовой модели.
Поэтому вместо того, чтобы говорить, что Cursor завис, точнее будет сказать, что это прекрасный пример важности программных средств для управления процессом программирования.

В другой статье о рендеринге с подкреплением в реальном времени Cursor написал: «(Обучение модели программирования) Самая большая проблема заключается в моделировании пользователя. В производственной среде Composer есть не только компьютер, выполняющий команды, но и люди, которые контролируют и направляют его. Имитировать компьютер легко, но имитировать людей, использующих его, сложно».
Это утверждение постепенно становится общепринятым среди ведущих поставщиков моделей в области программных моделей. Если вы посмотрите на списки бенчмарков и общие отзывы пользователей, вы обнаружите, что все ведущие поставщики вкладывают значительные средства в собственные агенты кодирования/продукты для программирования. Единственное различие заключается в том, кто ближе к пользователю.
Взяв в качестве примера относительно авторитетные рейтинговые списки, такие как SWE-bench и LLM-Stats, можно увидеть, что модели типа Claude, GPT, Gemini и Kimi в основном доминируют в первой десятке. Все они являются поставщиками моделей, разработавшими собственные продукты для работы с агентами программирования (включая CLI, IDE и настольные клиенты, интегрирующие агенты программирования).
В некоторых списках встречаются контрпримеры, такие как Meta ( Muse Spark) и DeepSeek, которые не разработали собственный агент для программирования.
Однако вы обнаружите, что эти модели-контрпримеры с трудом показывают хорошие результаты в более авторитетных тестах, которые ближе к реальным условиям и позволяют избежать искажений. Например, DeepSeek набирает 70% и занимает девятое место только в SWE-bench bash, но его результат падает примерно до 15% в SWE-bench Pro.
Реальные данные о трафике OpenRouter могут объяснить это расхождение: отчет платформы за 2025 год показывает, что более 80% потребления токенов Claude было использовано для программирования и технических задач, в то время как потребление токенов DeepSeek было в основном сосредоточено на неформальном общении и ролевых играх.
Поставщики, не имеющие собственных программных продуктов, могут занимать высокие позиции в некоторых тестах по программированию, но их некомпетентность будет выявлена в более сложных реальных инженерных тестах и в условиях реального трафика, где пользователи используют токены для голосования.
Не только Cursor, но и Anthropic в статье, опубликованной в ноябре 2025 года, прямо заявила, что делает то же самое: «Мы обучаем модель в собственной реальной производственной среде программирования Anthropic». То есть Anthropic передает данные о взаимодействии своих сотрудников с использованием Claude Code в модель Claude для обучения.

5.
В процессе эволюции ИИ определение факторов производства претерпело глубокие изменения. Хотя три традиционных ключевых элемента — вычислительная мощность, исследования и обучающие данные — продолжают расти в общем объеме, их структура стала серьезно дисбалансированной.
Сегодня крупнейшие гиганты в области искусственного интеллекта значительно увеличили свои капитальные затраты (CapEx) на вычислительные мощности, что сделало вычислительную инфраструктуру доминирующей темой в современном общественном дискурсе. Однако в реальности, особенно в области программирования, поскольку поставщики моделей используют общедоступные данные кода в интернете, такие как репозитории GitHub и Stack Overflow, по принципу «осушить пруд, чтобы поймать всю рыбу», границы возможностей моделей в генерации кода и логическом рассуждении постепенно становятся очевидными.
Именно поэтому в отрасли постепенно формируется консенсус в пользу нового стратегического превосходства:
Для любого поставщика моделей, стремящегося освоить возможности программирования высшего уровня, создание собственного продукта-агента для кодирования перестало быть просто желательным бизнес-решением и стало жизненно важным инструментом для обеспечения непрерывного развития базовой модели.
Как ранее утверждала организация APPSO, простое обучение на основе общедоступных данных подобно изучению результатов успешных людей без понимания пути к успеху. Это определенно не то, что должно представлять собой правильное понимание успеха. В реальной среде программирования знание того, какие ошибки произошли, как они произошли и как правильно понимать и эффективно реализовывать требования — понимание правильного процесса — гораздо ценнее, чем получение самого правильного результата.

Только обладая собственными программными продуктами, поставщики моделей могут получать высококачественные сигналы «контроля процесса», обеспечивая тем самым сохранение технологического преимущества на следующем этапе конкуренции в области возможностей кодирования/вывода.
В противном случае им пришлось бы поступить так же, как SpaceXAI, и потратить деньги на сотрудничество с компаниями, разрабатывающими программные агенты для программирования.
Однако не все производители моделей так богаты, как Маск, и разделение власти, альянсы и территориальная борьба между гигантами, начиная с 2026 года, станут еще более ожесточенными. Когда производитель моделей, не имеющий собственных программных продуктов, наконец осознает это, у него может не хватить партнеров на выбор, и цена сотрудничества соответственно возрастет.
Ситуация с крупными американскими производителями моделей в целом хорошо известна, поэтому мы не будем вдаваться в подробности. APPSO также отметила, что большинство основных отечественных производителей моделей и гигантов в области ИИ уже добились успехов в разработке программ для создания агентов программирования.
Крупнейшие отечественные компании в основном работают над собственными средами разработки для ИИ или плагинами для IDE: ByteDance запустила TRAE в самом начале прошлого года, у Alibaba есть Qoder, у Tencent — CodeBuddy, у Baidu — Comate и т.д.
Среди компаний, занимающихся искусственным интеллектом, компания Moon's Dark Side первой разработала независимый продукт для программирования, в основном Kimi Code с интерфейсом командной строки. Однако ранее Kimi заявляла, что CLI не станет окончательной формой продуктов для нативного программирования .

Другой подход заключается в том, чтобы поставщики моделей предоставляли собственные API-сервисы и планы кодирования. Таким образом, независимо от среды разработки ИИ, используемой пользователем, поставщик моделей может получить данные процесса, которые максимально приближены к исходному коду, посредством серверных API-записей.
Однако это лишь приблизительное, а не точное сходство. Основная проблема заключается в том, что журналы запросов и ответов серверного API по-прежнему значительно отличаются от устоявшихся моделей взаимодействия с продуктом.
Производители, предлагающие собственные встроенные продукты (такие как Cursor, Claude desktop и Codex), получают наиболее прямые и явные сигналы обратной связи, в то время как API-интерфейс предоставляет относительно расплывчатые неявные выводы. Проще говоря, API-интерфейс видит запросы и ответы пользователей, но не имеет представления о том, принял ли пользователь в конечном итоге код, успешно ли он работает или какие ошибки он вызвал. Он не может понять эту важнейшую характеристику конечного поведения пользователя, что не позволяет достичь наивысшего качества обучения с подкреплением.
С метафизической точки зрения, язык — это мир, а код — это решение. Код может описать подавляющее большинство задач в этом мире, а также выступает в роли усилителя, позволяя лучшим специалистам многократно повысить свою производительность.
Только лучшие модели программирования заслуживают лучших специалистов. Если ведущие поставщики моделей не ценят программирование, они неизбежно выпадут из числа лучших.
Конечно, в реальности каждый производитель моделей будет ценить программирование, но в рамках новой парадигмы продукты, не имеющие собственного управляемого агента нативного программирования, скорее всего, постепенно отстанут от производителей, которые такие продукты имеют.
Всего несколько дней назад MiniMax также выпустила крупное обновление для своего настольного клиентского продукта: функцию Mavis с совершенно новой архитектурой оркестрации нескольких агентов, которая также значительно улучшает поддержку задач программирования в клиенте.
Ранее MiniMax выпустила только настольную версию, но она не включала в себя функции нативного программирования и агентские возможности.


Впоследствии, 15 мая, Alibaba официально выпустила Qoder 1.0 — этот продукт был официально модернизирован из среды разработки в полноценный продукт для создания агентов (официальное название Alibaba — Intelligent Agent Self-Development Workbench).

Одновременно с этим, наконец-то состоялся официальный запуск Grok Build CLI от xAI.
Верно, это тот самый агент для программирования, который xAI разработали сами после того, как их аккаунты были заблокированы Anthropic и Cursor в начале этого года.

А теперь появилось еще несколько готовых вариантов.
Похоже, все согласны с тем, что настольные клиенты Cursor, Codex и Claude движутся в правильном направлении.
6.
То же самое относится и к случаю, когда мы переносим обсуждение с программирования на самого агента.
Хотя некоторые данные о траекториях выполнения задач программирования действительно можно найти в общедоступных корпусах (например, в записях коммитов/запросах на слияние в GitHub, хотя их качество невысоко), данные о траекториях выполнения задач агента, включая, помимо прочего, перемещение и щелчки мышью, манипулирование сенсорным экраном и заполнение полей ввода, в общедоступных корпусах найти невозможно.
Таким образом, мы видим, что даже в самом простом варианте реализации работы агента — плагине для браузера, который, казалось бы, совсем не относится к категории высококлассных — почти каждый поставщик моделей создает свой собственный.
OpenAI запустила Operator еще в январе 2025 года — вместо того, чтобы называть его «автоматизированным браузером на основе ИИ», это, по сути, устройство для сбора данных в больших масштабах. Каждый пользователь, который пробует Operator, бесплатно предоставляет OpenAI данные о политике конфиденциальности.
Впоследствии OpenAI выпустила ChatGPT Agent и новую версию настольного приложения Codex; то же самое относится и к Anthropic; недавно Кими незаметно создал проект под названием WebBridge, который по сути является плагином для браузера.

Даже Deepin, китайский модельный гигант, который в последние два года проявлял наибольшую сдержанность в своих действиях, недавно начал проявлять интерес к Agents.
В одном из предыдущих интервью генеральный директор Лян Вэньфэн упомянул, что математика и программирование являются естественной площадкой для тестирования искусственного общего интеллекта, подобно игре в Го, — замкнутой и проверяемой системе, которая потенциально может достичь высокого уровня интеллекта благодаря самообучению.
Скрытый смысл этого заявления заключается в том, что DeepSeek всегда рассматривала программирование и агентов как площадку для исследований и тестирования, а не как коммерциализацию.
Однако в марте этого года DeepSeek одновременно открыла более десятка вакансий, связанных с агентами, включая первую в истории должность менеджера по продуктам стратегии моделей (ориентированную на агентов). В то время описание вакансии включало «руководство разработкой систем оценки агентов и решений для обучающих данных» и требовало «глубокого использования таких продуктов, как Claude Code и Manus».
APPSO отметила, что DeepSeek недавно разместила вакансии на такие должности, как менеджер по продуктам для агентов и менеджер по продуктам для ремешков — очевидно, DeepSeek собирается создать независимый, нативный продукт для программирования/агентов.

В предыдущих отчетах указывалось, что DeepSeek V3.2 включал в себя почти две тысячи синтетических обучающих сред для агентов и более восьмидесяти тысяч сложных инструкций в процессе обучения. Однако, похоже, что синтетические обучающие данные позволяют DeepSeek достичь лишь этой цели; оставшаяся часть — реальные успехи и неудачи реальных пользователей в реальных условиях — может быть получена только с помощью собственных агентских продуктов.
Компания DeepSeek на протяжении трёх лет разрабатывала свои модели и продукты с предельной сдержанностью ( мультимодальные возможности были добавлены на официальный сайт лишь в прошлом месяце). Однако сегодня DeepSeek становится всё сложнее достигать передовых результатов в задачах программирования, и даже те показатели, которых она достигала ранее, быстро превосходят предыдущие.
Когда основной силе уже не хватало поддержки за счет исследований, компания DeepSeek наконец-то предприняла действия.
7.
И наконец, вернемся к истории в самом начале.
Как сообщает издание The Information со ссылкой на источники, знакомые с ситуацией, компания Cursor, приняв предложение Маска о приобретении за 60 миллиардов долларов и сотрудничестве за 10 миллиардов долларов, заявила, что не будет сотрудничать с xAI в разработке новых моделей, а вместо этого сосредоточится на оптимизации собственной модели Composer.
Это может означать, что даже если компания Cursor будет куплена или приобретена Маском, ей все равно придется сохранить ядро своей системы обработки данных.
Сам вопрос о праве собственности на данные является наиболее важным скрытым спорным моментом.
Когда все ведущие производители моделей начали выпускать собственную продукцию, а все ведущие производители товаров — обучать собственных моделей, и без того размытая грань между «компаниями-производителями моделей» и «компаниями-производителями товаров», кажется, всё больше стирается…
Игра только начинается.
#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.