DeepSeek получил крупное обновление, версия V4 уже не за горами с подробной информацией об удобстве использования

Только что веб-версия DeepSeek получила крупное обновление.

Не было ни пресс-конференции, ни блога, ни даже официального твита. Над полем ввода в веб-интерфейсе DeepSeek появились два новых значка — молния и ромб, соответствующие «Быстрому режиму» и «Экспертному режиму» соответственно.

Наведите курсор на экран, и появится сообщение: Быстрый режим — «Подходит для повседневных разговоров, мгновенный ответ», Экспертный режим — «Расширенный режим для сложных задач, может потребовать ожидания в часы пик».

На основе реальных испытаний и отзывов пользователей, различия между двумя режимами примерно следующие:

Быстрый режим позволяет быстро и мгновенно распознавать текст на изображениях и в документах. Компромисс заключается в том, что, вероятно, в фоновом режиме используется более облегченная версия V4 Lite, но зато он оптимизирован для высокой скорости.

Похоже, экспертный режим перешёл на более крупную и мощную модель — вероятно, вариант официальной версии DeepSeek V4. Однако в настоящее время он не поддерживает загрузку файлов и работу с несколькими устройствами одновременно. Подождите, более мощная модель с меньшим количеством функций?

Мы также провели простой тест.

Например, пусть каждый из двух режимов напишет программу на p5.js для моделирования отскока мяча внутри вращающегося шестиугольника под действием гравитации и трения. Результаты довольно наглядны — экспертный режим обеспечивает более интуитивно понятное физическое поведение, более точные точки приземления и более реалистичную траекторию отскока.

Этот разрыв весьма показателен. Моделирование физических процессов требует развитых математических навыков, а более слабые модели склонны давать результаты, которые «выглядят физически правильными, но на самом деле неверны». В этом контексте экспертный режим отражает реальную разницу в способностях.

Однако результат игры Space Invaders, созданной пользователями сети, оказался несколько неожиданным: разница между результатами в экспертном и быстром режимах была незначительной.

Один из пользователей, проводивших тестирование, дал следующую оценку: «Я предполагаю, что экспертный режим в настоящее время всё ещё работает на версии V4 Lite. Возможно, нам придётся подождать ещё некоторое время, чтобы увидеть полную версию V4, доступную в интернете». Другими словами, это предварительное внедрение «экспертного режима» может быть не окончательной версией.

В рамках творческого письма я разработал задание для обсуждения в обоих режимах: «Защитите скуку и докажите, что скука — это роскошь для современных людей». В режиме эксперта получился более длинный текст с более полной логической цепочкой, в то время как стиль письма в режиме быстрого письма был относительно естественным и простым.

Интересно, что разница в скорости между двумя режимами в этом задании оказалась незначительной; фактически, в экспертном режиме время на обдумывание было короче. Это несколько противоречит интуиции, но может быть связано с характером задачи — творческое письмо гораздо менее чувствительно к размеру модели, чем задачи на математическое мышление.

Для простых задач разница между двумя режимами невелика; однако, чем сложнее сценарий, тем очевиднее становится преимущество экспертного режима.

В математической логической задаче «Веревка обмотана вокруг Земли, затем удлинена на 1 метр и равномерно расправлена. Какова высота зазора?», хотя оба режима дают одинаковый ответ, процессы совершенно разные. Быстрый режим дает очень краткий ответ; экспертный режим разбирает задачу шаг за шагом, четко объясняя каждый вывод, что ближе к инструкции «записать ход рассуждений».

Стоит отметить, что в настоящее время в веб-версии доступны только режимы «Быстрый» и «Экспертный», но предыдущие утечки указывают на то, что в будущем появится третий режим — «Режим зрения».

KOL Teortaxes, следящий за технологической дорожной картой DeepSeek, считает, что выделение Vision в отдельный класс — необычное решение. Он упомянул, что DeepSeek ранее отказывалась развертывать серию DS-VL в интернете, поскольку она «еще не достигла зрелости». Если режим Vision все-таки будет запущен, он, вероятно, будет поддерживаться «полноценным» VLM.

В своем пространном обзоре Teortaxes выдвинул еще более смелое предположение: эта визуальная модель может быть не обычной VLM, а скорее некой «глубокой унифицированной моделью мира», следующей эволюцией серии Janus или какой-либо другой, более нетрадиционной архитектурой.

Конечно, это всего лишь его предположения, и к ним следует относиться с осторожностью. Но одно можно сказать наверняка: DeepSeek давно инвестирует в мультимодальные решения, возможно, просто не хватало подходящего момента. И, предоставляя пользователям быстрые и профессиональные точки доступа, компания на самом деле движется в более перспективном направлении:

Компания DeepSeek начала внедрение системы многоуровневого ценообразования.

С момента своего взрывного роста в начале прошлого года, DeepSeek придерживается крайне «антикоммерческой» стратегии: низкая стоимость API, полностью бесплатный веб-интерфейс и минимальные различия в функциональности. И эта стратегия действительно сработала. Взлет DeepSeek в начале этого года всколыхнул всю индустрию искусственного интеллекта.

Однако возникают проблемы: поддержание этой "полностью бесплатной, без многоуровневой системы" операционной модели в долгосрочной перспективе не является коммерчески устойчивым.

Теперь DeepSeek разделяет возможности на «более мощные модели» и «более простые модели», предлагая два отдельных варианта входа. Экспертный режим в настоящее время бесплатен, но как только эта архитектура будет создана, разработка платной системы на её основе перестанет быть технической проблемой.

В комментариях Teortaxes также упомянул одну деталь: ограничение на загрузку файлов носит временный характер; DeepSeek интегрирует эту систему, чтобы пользователи могли позже приобрести более мощный «экспертный режим». В совокупности все это образует очень полный подготовительный путь:

Сначала поэтапное внедрение многоуровневых точек входа → предоставление пользователям возможности оценить различия → интеграция многомодальных и файловых возможностей → разблокировка визуальных режимов → более эффективная система ценообразования в зависимости от режима. Конечно, это всего лишь мои личные предположения, и я буду рад ошибиться, поскольку DeepSeek никогда не играет по правилам.

Безусловно, DeepSeek оклеветали множеством ярлыков — технологический идеализм, антикоммерциализм и ИИ для масс. Но затраты на обработку данных на графических процессорах, счета за электроэнергию для серверов и так далее — это реальные и ощутимые ежемесячные расходы. Какими бы существенными ни были количественные прибыли Magic Cube, трудно восполнить недостаток бессрочно бесплатного глобального сервиса ИИ за счет продажи API.

DeepSeek потряс всё сообщество разработчиков искусственного интеллекта, но в конечном итоге реальность тоже потрясёт DeepSeek.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.