Европейская версия DeepSeek выпускает новую модель, ориентированную на китайский ИИ.

После более чем полугодового давления со стороны OpenAI, Google и китайских моделей с открытым исходным кодом DeepSeek и Qwen, компания Mistral AI, известная как «европейская версия DeepSeek» , наконец не смогла усидеть на месте и официально выпустила новое поколение моделей серии Mistral 3.

Mistral AI — крупная компания по моделированию со штаб-квартирой во Франции. В сентябре этого года, как сообщается, Nvidia инвестировала в стартап в третий раз. В результате оценка Mistral достигла примерно 13,5 млрд долларов, что сделало компанию одним из самых заметных «единорогов» в европейском секторе искусственного интеллекта.

На этот раз Mistral фактически был нацелен только на китайскую модель.

На этот раз Mistral 3 представляет флагманскую модель Mistral Large 3, а также три высокопроизводительные и экономичные модели меньшего размера: Ministral (3B, 8B, 14B).

Среди них Mistral Large 3 — абсолютный фаворит, имеющий в общей сложности 675 параметров, из которых 41 активен. Это первая смешанная экспертная модель Mistral с открытыми весами после Mixtral 8x7B и 8x22B, выпущенных в конце 2023 — начале 2024 года.

Но больше всего меня «тревожит» официальная стратегия сравнения.

В официальных тестовых таблицах Mistral полностью игнорировал GPT-5.1 или Gemini 3 и вместо этого напрямую нацелился на китайские DeepSeek-V3.1 и Kimi-K2.

Логика Мистраля проста: у меня всего лишь примерно половина параметров, чем у Кими, но мои показатели на уровне твоих, или даже выше.

Официальные результаты таковы:

  • Шансы на победу: на MMMLU и AMC Mistral Large 3 набрал 85,5 и 52,0 соответственно, немного опередив DeepSeek-V3.1.
  • Поражение: В LiveCodeBench и SimpleQA, которые больше всего интересуют программистов, Mistral Large 3 все же уступил Kimi-K2.


Он глупее DeepSeek и в три раза дороже?

Хотя Mistral пытается зарекомендовать себя как «король эффективности», технические блогеры на X охладили его пыл, даже употребив резкий термин «Mistral медленно умирает».

Его оценка была краткой и резкой: он перечислил три основных недостатка новой модели Mistral:

1. Тупее: не такой умный, как DeepSeek.
2. Дороже: стоит в три раза дороже, чем DeepSeek.
3. Медленнее: скорость вывода даже ниже, чем у GPT-5.

Это определённо попало в точку. В последнем комплексном рейтинге ИИ-индекса Artificial Analysis Mistral Large 3 набрал всего 38 баллов.

Давайте посмотрим, кто на вершине: Gemini 3 Pro (73 балла), Claude Opus 4.5 (70 баллов) и GPT-5.1 (70 баллов). Отставание Mistral от топа — это не просто «догонялки», это полный разрыв.

В рейтинге LMARaena он занимает второе место среди моделей невывода с открытым исходным кодом и шестое место в общем зачёте. Результаты достойные, но его определённо нельзя назвать «сметателем лидеров».

Испытатели обнаружили, что Mistral Large 3 показал себя плохо по всем параметрам:

  • Эта модель испытывает трудности с корректным выполнением вызовов инструментов, часто выдавая неправильно отформатированные или недействительные инструкции по вызову инструментов.
  • В тестах на основе изображений он показывает лишь умеренные результаты.

Во что действительно стоит инвестировать, так это в модель малого масштаба.

Ministral 3 — самый экономичный продукт среди всех моделей с открытым исходным кодом. Он предлагает базовую, обучающую и инференсную версии для каждой шкалы параметров, все с функциями распознавания изображений и полностью открытый исходный код под лицензией Apache 2.0.

Что это значит? Вы можете использовать его бесплатно и изменять по своему усмотрению.

  • Универсальность: поддерживает распознавание изображений всех размеров, больше не «слепое».
  • Производительность: Версия вывода 14B достигла точности 85% в тесте AIME'25.

Mistral 3 действительно добился прогресса. Как отметили пользователи сети, в Европе всё ещё есть ведущий производитель моделей, который в принципе может поспеть за темпами развития моделей с открытым исходным кодом в Китае. Хотя Mistral ещё не выпустила движок для вывода, его реальные характеристики всё ещё отстают от современных.

Но поскольку DeepSeek снижает стоимость крупных моделей, простого «достойного качества» уже недостаточно. Пользователи хотят либо высочайшего интеллекта, либо максимальной доступности.

В настоящее время «Мистраль», похоже, застрял в неудобном промежуточном положении. Сможет ли он стать «маяком надежды для Европы», во многом зависит от его последующих вариантов развития.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (WeChat ID: ifanr), где вы сможете как можно скорее получить еще больше интересного контента.

ifanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo