Выпущена «самая ароматная» модель Клода, вдвое более быстрая и по сниженной цене, с возможностями программирования, приближающимися к GPT-5.

Только что Anthropic выпустила Claude Haiku 4.5.

Позвольте мне сначала кратко представиться. Семейство Claude включает три модели с разными значениями параметров: Claude Opus (большая чаша), Sonnet (средняя чаша) и Haiku (маленькая чаша).

Самым большим достижением этого обновления является то, что Claude Haiku 4.5 стал быстрее и дешевле, сохранив при этом высокую производительность модели .

Пять месяцев назад Claude Sonnet 4 был одной из самых продвинутых моделей. Теперь новый Haiku 4.5 почти так же хорош в кодировании, но стоит втрое дешевле и работает более чем вдвое быстрее.

▲Сравнительная диаграмма передовых моделей на проверенном SWE-bench, которая измеряет производительность при выполнении реальных задач кодирования.

В частности, на SWE-bench Verified, тестовом наборе для оценки возможностей ИИ-кодирования, Haiku 4.5 набрал 73%. Какой замечательный результат! Это ставит его на один уровень с Claude Sonnet 4 и новейшим GPT-5 от OpenAI.

В некоторых задачах, например, в управлении компьютером, Haiku 4.5 даже обгоняет своего старшего брата Sonnet 4.

Для сценариев, где ИИ требуется для задач в режиме реального времени с малой задержкой, например, для чат-ассистентов, агентов по обслуживанию клиентов или помощников по парному программированию, Haiku 4.5 сочетает высокий интеллект с превосходной скоростью, обеспечивая лучший опыт.

Разработчики, использующие Claude Code, также обнаружат, что Haiku 4.5 делает весь процесс программирования — от многоагентного взаимодействия до быстрого создания прототипов — более отзывчивым и эффективным.

Конечно, Sonnet 4.5, выпущенный две недели назад, остаётся флагманской моделью Anthropic, топовой моделью программирования во всём мире. Но Haiku 4.5 предлагает ещё один вариант: почти максимальную производительность по гораздо более доступной цене.

Более того, модель стала более гибкой. Sonnet 4.5 может разбить сложную задачу на N небольших задач, а затем управлять несколькими Haiku 4.5 для параллельной работы. Взаимодействие происходит довольно неявно.

Компания Anthropic провела детальное тестирование безопасности и выравнивания Haiku 4.5.

Результаты показывают, что модель демонстрирует меньший уровень ошибок и значительно улучшенное выравнивание по сравнению с её предшественником, Haiku 3.5. При автоматизированной оценке выравнивания Haiku 4.5 показала меньше общего количества ошибок, чем Sonnet 4.5 и Opus 4.1.

Тем не менее, на данный момент это самая безопасная модель в линейке Anthropic.

▲Сравнительная таблица передовых моделей по популярным бенчмаркам

Что касается цены… Цена Haiku 4.5 составляет 1 доллар за миллион входящих токенов и 5 долларов за миллион исходящих токенов.

Для сравнения, GPT-5 mini стоит около 0,25 доллара за миллион входных данных и 2,5 доллара за миллион выходных данных, а Gemini 2.5 Flash от Google стоит примерно столько же. Другими словами, Haiku 4.5 примерно в четыре раза дороже GPT-5 mini или Flash.

Однако по сравнению с Sonnet 4.5 он примерно в три раза дешевле и имеет практически такую ​​же производительность, что означает снижение затрат и повышение эффективности для разработчиков.

Но, честно говоря, математика — не его сильная сторона.

Известный блогер Дэн Шиппер попробовал и обнаружил, что арифметика хайку немного… запутана.

Например, в тесте на счёт Uber Haiku идеально нашёл все нужные адреса электронной почты, но совершенно ошибся при подсчёте общей суммы. Ещё более неловко, что после того, как ему указали, он признал ошибку, но затем снова её допустил.

Оценка Дэна Шиппера такова:

Если вы разработчик или предприниматель, создающий сложное приложение для интеллектуального агента с использованием Sonnet 4.5, рассмотрите возможность перехода на Haiku уже сейчас. Вы сэкономите значительные средства при незначительной потере производительности.

Если вы используете Gemini 2.5 Flash или GPT-5 mini, рекомендую попробовать Haiku. Хотя он дороже, он лучше работает в сценариях, где требуется вызывать инструменты и сохранять автономность.

▲Прикрепленный адрес блога:
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked

В настоящее время Claude Haiku 4.5 доступен на Claude Code и в различных приложениях.

Разработчики могут использовать Haiku 4.5 через Claude API, Amazon Bedrock и Vertex AI от Google Cloud, напрямую заменяя Haiku 3.5 и Sonnet 4, а цена находится в лучшем ценовом диапазоне Anthropic.

Мы последовали совету @zb1992 и запустили демо-версию часов на Claude 4.5 Haiku. В целом, мы обнаружили, что скорость генерации кода действительно выросла, а конечный продукт оказался удовлетворительным.

В следующей классической задаче на рассуждения и вычисления преимущество Claude 4.5 Haiku в скорости ответа ещё более очевидно. Конечно, это также является основным преимуществом лёгких моделей в практическом применении.

Кроме того, по данным The Information, компания Anthropic, стоимость которой оценивается в 170 миллиардов долларов, в последние недели сообщала консультантам инвестиционных банков о планах привлечения большего количества технических специалистов за счет приобретений и расширения своих возможностей за пределы помощников-программистов — в конце концов, именно программирование по-прежнему составляет основную часть ее доходов.

Источники, знакомые с ситуацией, сообщили, что, учитывая успех Anthropic в предоставлении разработчикам продуктов для программирования ИИ, компания может в дальнейшем расширить свою деятельность и на другие программные инструменты, обычно используемые разработчиками, например, инструменты для автоматического тестирования уязвимостей кода или инструменты, помогающие в проектировании программного обеспечения.

Также сообщается, что Anthropic может разрабатывать продукты для определенных отраслей путем приобретений, например, финансовых услуг, здравоохранения или кибербезопасности, но они предпочитают небольшие приобретения с суммами сделок менее 500 миллионов долларов США.

Похоже, что, расширяя возможности своих моделей, Anthropic также активно развивает свою экосистему. Индустрия ИИ спешит наперегонки со временем, но конечные выгоды получают разработчики и пользователи: мощные модели, более низкие цены и более широкий выбор.

Автор: Мо Чунгюй

#Приглашаем вас следить за официальным публичным аккаунтом WeChat проекта iFaner: iFaner (WeChat ID: ifanr), где в ближайшее время вам будет представлен еще более интересный контент.

iFanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo