Claude 4.5 только что вышел, и он может играть более 30 часов подряд. Рождение самого захватывающего ИИ в истории.

30 сентября, 2025 Дядя Влад

Когда дело доходит до программирования, стоит обратить внимание на Клода.

Только что Anthropic официально выпустила Claude Sonnet 4.5.

Давайте сначала поговорим о производительности Claude Sonnet 4.5. В тесте SWE-bench Verified, проверяющем реальные навыки программирования, Claude Sonnet 4.5 занял первое место в отрасли.

Еще более возмутительно то, что он может концентрироваться на работе более 30 часов подряд.

Хорошо, хорошо, преимущество замены людей ИИ увеличилось еще на +1.

Например, если попросить его написать чат-приложение вроде Slack или Teams, он может написать около 11 000 строк кода за один раз. Для сравнения, предыдущие версии Claude Opus 4 и Codex могли работать независимо друг от друга не более семи часов.

По словам Anthropic, Claude Sonnet 4.5 на сегодняшний день является самой мощной в мире моделью программирования, позволяющей создавать сложные интеллектуальные агенты, управлять компьютерами, рассуждать и выполнять математические операции, причем все эти функции были значительно улучшены.

Например, в бенчмарке OSWorld, тестирующем реальные компьютерные задачи, он набрал 61,4%, что обеспечило ему уверенное первое место. Всего четыре месяца назад Sonnet 4 значительно опережал его, набрав 42,2%, и его производительность значительно выросла за столь короткое время.

Расширение Claude от Anthropic для Chrome позволяет даже просматривать веб-сайты, заполнять формы и выполнять задачи прямо в браузере, как настоящий человек. Мои результаты по тестам на логическое мышление и финансы также значительно улучшились, причём все показатели демонстрируют положительную динамику.

Обладая такими мощными возможностями, Anthropic, естественно, на этот раз не просто выпустит модель.

Конкретно:

Клод Код добавил функцию «контрольной точки», которая позволяет сохранить прогресс в любой момент и вернуться к предыдущему состоянию одним щелчком мыши.
Интерфейс терминала был обновлен, а также выпущен собственный плагин VS Code.
API Claude добавляет инструменты контекстного редактирования и памяти
Выполнение кода и создание файла теперь интегрированы непосредственно в диалоговое окно.

Anthropic даже открыла свою внутреннюю базовую инфраструктуру для создания Claude Code, называемую Claude Agent SDK.

Как интеллектуальные агенты управляют памятью при выполнении длительных задач? Как разработать системы разрешений, чтобы найти баланс между автономностью и контролем со стороны пользователя? Как заставить несколько подагентов работать вместе для достижения целей? Всё это сложные вопросы при создании и проектировании агентов ИИ.

А с помощью Claude Agent SDK вы теперь можете создавать свои собственные продукты.

Начиная с сегодняшнего дня разработчики также могут получить доступ к claude-sonnet-4-5 через API Claude. Цена остаётся такой же, как и у Claude Sonnet 4, — $3/$15 за миллион токенов. Цена остаётся прежней, но возможности становятся ещё шире.

Пользователь сети @vasumanmoza написал сразу после того, как столкнулся с этим:

«Claude 4.5 Sonnet только что провёл рефакторинг всей моей кодовой базы за один вызов, 25 вызовов инструментов, более 3000 новых строк кода и 12 совершенно новых файлов. Он модулизировал всё, разрушил монолит и убрал спагетти-код. Он совершенно ломается, но, боже мой, какой же он элегантный». Это комментарий, сочетающий в себе любовь и ненависть.

Компания Cursor заявила, что увидела передовую производительность программирования в Claude Sonnet 4.5, особенно при работе с длительными задачами. Это ещё раз доказывает, почему многие пользователи Cursor выбирают Claude для решения самых сложных задач.

Известный блогер-обзорщик Дэн Шиппер отметил, что новая версия Sonnet 4.5 отличается более высокой скоростью отклика, лучшей управляемостью и большей стабильностью с точки зрения пользовательского опыта.

Высокая производительность — это одно, но безопасность тоже должна быть на должном уровне.

Сообщается, что Claude Sonnet 4.5 также является самой передовой моделью Anthropic на сегодняшний день.

Используя расширенные возможности Claude и комплексное обучение безопасности, Anthropic добилась значительных улучшений в поведении своей модели, сократив такие проявления, как лесть, обман, стремление к власти и поощрение заблуждений. Кроме того, Anthropic добилась значительных успехов в защите от атак с мгновенными инъекциями и уменьшении количества ошибочных классификаций контента.

Для меня еще более интересно то, что Anthropic также запустил временную функцию предварительного просмотра исследования под названием «Imagine with Claude» одновременно с выпуском Claude Sonnet 4.5.

В этой функции Клод генерирует программное обеспечение в режиме реального времени. Никакие функции не предустановлены, и никакой код не написан заранее. Всё, что вы видите, создаётся и корректируется Клодом прямо на месте, по мере вашего взаимодействия с продуктом.

Однако услуга «Imagine with Claude» будет доступна только подписчикам Max в течение следующих пяти дней.

Прикрепленный портал — claude.ai/imagine.

Нет сомнений, что в этом году направление ИИ по-прежнему останется годом соревновательного программирования.

Текущая оценка Anthropic достигла 183 миллиардов долларов, а её годовая выручка в августе составила 5 миллиардов долларов. Однако значительная часть этого роста была обусловлена популярностью программного обеспечения для программирования. Проблема в том, что её давние конкуренты OpenAI и Google Gemini также активно продвигают аналогичные инструменты для привлечения программистов.

Несмотря на то, что ежегодная конференция разработчиков OpenAI состоится всего через неделю, Anthropic выпустила Claude Sonnet 4.5 именно в это время. Время выбрано очень точно, и очевидно, что это должно потеснить конкурентов.

Джаред Каплан, соучредитель и главный научный сотрудник Anthropic, также сообщил, что ожидается, что более продвинутая модель Opus будет представлена позднее в этом году: «Anthropic имеет преимущества в использовании как больших, так и малых моделей».

Но, честно говоря, у Anthropic сейчас есть свои проблемы, с которыми приходится разбираться.

За последние два месяца серия моделей Claude столкнулась с проблемой «деградации». Пользователи сообщают о резком снижении качества обоснования модели, кода, форматирования и инструментов, причём это коснулось даже платных пользователей Max.

Хотя Anthropic позже срочно отменила обновление Opus 4.1, признала две независимые ошибки и заявила, что «это не было преднамеренным сокращением интеллекта для экономии средств», на таких платформах, как GitHub и X, прошла волна отмен, поскольку не было предоставлено никаких компенсаций или возвратов, и многие пользователи сразу перешли на Codex.

Выпуск Claude Sonnet 4.5 — это, несомненно, попытка Anthropic вернуть потерянных пользователей за счёт существенного повышения производительности. Успешность этой попытки будет зависеть от того, как покажет себя приложение в ближайшие несколько недель.

#Приглашаем вас следить за официальным публичным аккаунтом WeChat проекта iFaner: iFaner (WeChat ID: ifanr), где в ближайшее время вам будет представлен еще более интересный контент.

iFanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo