Новая версия GPT-5 только что вышла. Самый популярный ИИ потратил 7 часов на кодирование, и обновление инструментария началось.

16 сентября, 2025 Дядя Влад

Как раз в то время, когда Anthropic Claude оказался в центре споров из-за снижения его IQ, OpenAI только что запустила GPT-5-Codex — специальную версию Codex, оптимизированную на основе GPT-5 и специально обученную для «автономного программирования».

Это обновление имеет определенный вес.

Ориентированный на реальные сценарии разработки программного обеспечения, GPT-5-Codex способен не только справляться с повседневными задачами программирования, но и самостоятельно выполнять сложные и трудоёмкие инженерные проекты. Как настоящий программист, он может работать непрерывно более семи часов, выполняя итерации, исправляя ошибки и проводя тестирование сложных проектов, чтобы в конечном итоге предоставить комплексное, пригодное к использованию решение.

С момента запуска CLI-версии в апреле и запуска веб-версии в мае, а также после всестороннего обновления сейчас целью Codex является полная «автоматизация» программирования.

Теперь, независимо от того, разрабатываете ли вы в терминале, IDE, на веб-странице или на мобильном телефоне, Codex может обеспечить последовательную помощь в программировании. Он интегрирован в систему учетных записей ChatGPT, позволяя легко переключаться между локальной и облачной средой.

Наиболее интересной особенностью GPT-5-Codex является его способность «динамического мышления», которая позволяет ему гибко регулировать время обработки в зависимости от сложности задачи.

Внутренние данные об использовании ресурсов сотрудниками OpenAI показывают, что для нижних 10% простых запросов, отсортированных по количеству токенов, сгенерированных моделью, GPT-5-Codex использовал на 93,7% меньше вычислительных ресурсов, чем GPT-5.

Напротив, для 10% самых сложных запросов анализ, редактирование кода, тестирование и итерации занимают примерно вдвое больше времени. Это означает, что ответы на повседневные сообщения и небольшие задачи обрабатываются быстрее, в то время как для глубокой обработки сложных и масштабных рефакторингов требуется больше времени.

Проще говоря, это означает: не тратьте время на мелкие повседневные проблемы, а уделяйте его крупным проектам.

Наконец, существует модель программирования, которая понимает, как использовать лучшие ресурсы там, где они нужнее всего.

Что касается бенчмарков, то на момент выпуска GPT-5 компания OpenAI опубликовала результаты только по 477 задачам SWE-bench Verified. После того, как компания Anthropic сообщила об этих проблемах, OpenAI сегодня объявила об их устранении, и теперь можно получать результаты по всем 500 задачам. Результаты следующие:

Оценка рефакторинга кода охватывает такие языки, как Python, Go и даже OCaml. Например, в случае запроса на включение изменений от Gitea были изменены 232 файла и 3541 строка кода, а также интегрирована переменная ctx в логику приложения.

Функция проверки кода также очень полезна. Она просматривает и анализирует кодовую базу, запускает тесты для проверки корректности и предоставляет довольно точные комментарии. В OpenAI Codex теперь проверяет большинство запросов на включение изменений, ежедневно обнаруживая сотни проблем и часто выявляя потенциальные ошибки раньше, чем при ручной проверке.

Также реализована поддержка front-end-разработки. GPT-5-Codex не только поддерживает создание десктопных приложений, но и значительно расширяет возможности мобильной разработки. Он также позволяет просматривать скриншоты и черновики дизайна, отслеживать ход разработки и визуализировать результаты работы, что очень полезно для front-end-разработки.

Обновления инструментов также весьма обширны. Недавно обновлённый Codex CLI теперь ориентирован на автономный процесс кодирования и поддерживает прямое прикрепление и обмен изображениями, включая скриншоты, каркасы и архитектурные схемы, для формирования общего понимания проектных решений.

При решении сложных задач Codex отслеживает ход выполнения с помощью списков дел и имеет встроенные инструменты, такие как веб-поиск и MCP для подключения к внешним системам.

Режимы одобрения упрощены до трех: режим только для чтения требует явного одобрения, автоматический режим имеет полный доступ к рабочему пространству, но требует одобрения за его пределами, а режим полного доступа позволяет читать файлы в любом месте и выполнять команды с сетевым доступом.

Новый плагин IDE поддерживает такие редакторы, как VS Code и Cursor, позволяя пользователям легко просматривать локальные изменения и совместно работать над кодом с Codex. Плагин также поддерживает плавное переключение между облачной и локальной средами, позволяя пользователям создавать облачные задачи, отслеживать ход выполнения и просматривать выполненные задачи непосредственно в редакторе.

Облачная инфраструктура также значительно улучшилась: благодаря кэшированию контейнеров медианное время выполнения новых и последующих задач сократилось на 90%. Codex автоматически настраивает среду выполнения, сканирует общие скрипты инициализации и выполняет их, а также запускает команды, такие как pip install, для установки зависимостей по требованию при настройке прав доступа к сети.

С точки зрения безопасности OpenAI использует изолированную операционную среду и по умолчанию отключает сетевой доступ, чтобы гарантировать, что на компьютере пользователя не будут выполняться вредоносные операции, одновременно снижая риск немедленного внедрения.

Разработчики могут настраивать параметры безопасности в зависимости от своей готовности к риску. В облаке они могут ограничить сетевой доступ только доверенными доменами. В плагинах CLI и IDE они могут одобрять команды, предоставлять полные привилегии для запуска, использовать веб-поиск и подключаться к серверу MCP.

В соответствии с руководством GPT-5, GPT-5-Codex классифицируется как модель с высокими возможностями в области биологии и химии, и в ней реализованы соответствующие меры безопасности.

Что касается цен, Codex интегрирован в различные платные планы ChatGPT, и разные планы предусматривают разные лимиты использования.

Кроме того, Edu и Business хороши для целенаправленных сеансов программирования несколько раз в неделю;
Pro может поддерживать целую неделю работы над несколькими проектами.

План «Бизнес» позволяет разработчикам приобретать дополнительные кредиты, чтобы превысить лимит, а план «Энтерпрайз» предоставляет общий кредитный пул, позволяя платить только за то, что фактически использует их команда. Для разработчиков, использующих ключ API, OpenAI планирует вскоре открыть GPT-5-Codex для API.

В настоящее время системные подсказки GPT-5-Codex попали в сеть, и заинтересованные разработчики могут с ними ознакомиться.

Адрес системного слова-подсказки: https://github.com/elder-plinius/CL4R1T4S/blob/main/OPENAI/Codex_Sep-15-2025.md

Известный блогер Дэн Шиппер дал следующую оценку после знакомства с GPT-5-Codex:

Мы тестировали его на @every в течение нескольких дней, и результаты оказались весьма впечатляющими:
– Динамично выбирает время «обдумывания» в зависимости от задачи – может долго работать над сложными проблемами, при этом давая мгновенные ответы на простые вопросы.
– В ходе тестирования нашей производственной кодовой базы она могла работать автономно до 35 минут — заметное улучшение по сравнению с GPT-5, которая, как правило, чрезмерно осторожна.
– Поддерживает плавное переключение между локальной и веб-средами разработки. Вы можете начать задачу в VS Code, а затем передать её Codex Web для завершения, когда отправитесь за покупками.
– В комплект поставки входит агент проверки кода, который фактически запускает ваш код, что позволяет ему находить больше ошибок.
Вот наши общие впечатления после всестороннего внутреннего тестирования:
– Это превосходное обновление, которое делает Codex CLI привлекательной альтернативой Claude Code.
– Однако для оптимальной работы требуется серьёзная доработка. Например, @kieranklaassen смог заставить его работать максимум 5 минут, а @DannyAziz97 разобрался.
– Иногда он может быть «ленивым» — он может недостаточно задумываться над определенными задачами или просто отказываться браться за задачи, если считает их слишком большими.
– Я провел выходные, отправляя новый PR для @CoraComputer с помощью Codex CLI, и обнаружил, что он очень прост в использовании и самонастройке – это отличная модель.

Александр Эмбирикос, руководитель разработки OpenAI Codex, отметил, что значительное повышение производительности во многом обусловлено динамической «мыслительной способностью» GPT-5-Codex. Эмбирикос пояснил, что GPT-5-Codex работает схожим образом, но вместо встроенного маршрутизатора он может регулировать время, затрачиваемое на выполнение задачи, в режиме реального времени.

Эмбирикос отмечает, что это преимущество перед механизмами маршрутизации: последние должны изначально решить, сколько вычислительной мощности и времени выделить на решение задачи, в то время как GPT-5-Codex может после пяти минут обработки задачи решить, что «нам нужен ещё час». Он говорит, что в некоторых случаях наблюдал непрерывную работу модели более семи часов.

В последние месяцы практически все крупные компании, занимающиеся разработкой ИИ, выпустили важные обновления, направленные в одном направлении: расширение возможностей программирования. Однако, если присмотреться, можно заметить, что «оптимизации» для обычных пользователей на самом деле снижаются.

На первый взгляд, это может быть связано с тем, что продукты на базе ИИ для обычных потребителей достигли своего предела. Такие функции, как чат, письмо и перевод, уже относительно развиты, что затрудняет достижение прорывов.

Но более глубокую причину невозможно обойти с помощью бизнес-логики.

Разработка продвинутых моделей ИИ требует астрономических инвестиций, и кто-то должен эти расходы взять на себя. Вместо того, чтобы полагаться на медленное восстановление большого количества низкооплачиваемых пользователей, лучше напрямую ориентироваться на ценных пользователей, которые действительно готовы платить. Программисты — одни из самых охотно платящих за инструменты ИИ, и их лояльность высока.

С этой точки зрения, отказ от идеи технологического равенства может показать, что будущее ИИ более элитарно, чем мы себе представляем. Это не обязательно плохо, но нам следует хотя бы осознавать это.

#Приглашаем вас следить за официальным публичным аккаунтом WeChat проекта iFaner: iFaner (WeChat ID: ifanr), где в ближайшее время вам будет представлен еще более интересный контент.

iFanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo