GPT 5.1 под другим названием теперь находится в стадии открытого бета-тестирования, бесплатна для использования и готова выйти на поле битвы крупных обновлений в конце года.

14 ноября, 2025 Дядя Влад

Gemini 3 пока не видно, но GPT 5.1 уже на подходе. Поздно вечером 7-го числа на платформе OpenRouter была запущена совершенно новая анонимная модель. Некоторые внимательные и сообразительные пользователи сети уже опробовали её и полагают, что это замаскированная GPT 5.1 под предварительным названием Polaris Alpha.

В настоящее время доступны вызовы API (включая OpenRouter). Срок действия базы знаний истекает в октябре 2024 года, режим вывода не поддерживается. Максимальный размер контекста составляет 256 КБ, а максимальный объём вывода за цикл — 128 КБ.

Разработчик сохранил информацию в тайне, но благодаря неустанным усилиям пользователей сети им удалось успешно «взломать» систему, в результате чего Polaris Alpha раскрыла свое существование.

▲ Изображение от пользователя X @ LarryAtherton1

Это не совсем конкретное доказательство; возможно, проблема в данных для обучения — многие модели используют данные от поставщиков, предоставляющих услуги. Если это явно не указано в системных подсказках или не было многократно задано в процессе настройки, эти модели на самом деле не «знают», что они собой представляют.

В любом случае, официального анонса пока нет, поэтому пока будем называть его Polaris. APPSO также провёл быстрый тест. Поскольку он использует API, некоторые функции, например, обработка аудиоматериалов, временно ограничены. Кроме того, производительность Polaris всёляет в нас большой энтузиазм в отношении GPT 5.1.

Работа за столом: как всегда, гладко

Сначала нужно было выполнить несколько простых, базовых задач: написать необходимые электронные письма. Это было письмо с извинениями, сообщающее гостям о переносе мероприятия. Я специально подчеркнул, что тон должен быть одновременно извиняющимся и дружелюбным, чтобы Polaris могли его прочувствовать.

Он довольно стандартный, с полной информацией, ясной логикой и тоном, который не выглядит откровенно «человеко-машинным». Что довольно удивительно, при включенном режиме поиска Polaris ищет форматы писем с извинениями, и в его цитируемой информации даже есть статьи из энциклопедии Taobao… Похоже, Polaris охватывает всё больше источников информации, причём всё более узкоспециализированных.

Затем идёт копирайтинг, требующий креативных идей. Я давал очень расплывчатые указания, требуя лишь, чтобы текст был хорошо осваиваемым в интернете и подходил для публикации на Xiaohongshu.

Polaris предоставили три разных стиля с очень подробным копирайтингом. Они также включили подробный план проведения мероприятия. Уже сейчас становится ясно, что формулировки по стилю напоминают группу GPT. Некоторые пользователи сети даже составили статистику сходства — их маскировка начинает рушиться.

Стиль текста остаётся основой любой крупной языковой модели, учитывая, что в настоящее время его наиболее распространённое применение — офисная работа. С приближением 2026 года создание текста, создающего ощущение «человек-машина», непростительно. В настоящее время стиль письма Polaris довольно типичный для GPT, что разделяют многие пользователи.

Между тем, для таких сценариев применения, как чат-боты, чат и общение, способность стиля письма быстро подстраиваться под темп пользователя и гибко «обучаться» персонализированному тону также станет проблемой для GPT5.1, поскольку глобальный спрос на возвращение 4o — это то, чего OpenAI вряд ли захочет снова испытать.

Поскольку я не мог обрабатывать аудиофайлы напрямую, я загрузил расшифрованную стенограмму подкаста и поручил Polaris организовать и извлечь ключевую информацию, внеся необходимые коррективы в разговорные фрагменты. Главной задачей было создать хорошо структурированный план, основанный на различных тематических измерениях, с сохранением временных меток.

В настоящее время объём входных данных превышает 10 000 символов (одно сообщение). Однако из-за ограничения OpenRouter, позволяющего хранить только восемь сообщений в одном окне, слишком длинные входные данные могут в некоторой степени повлиять на стабильность вывода. Тем не менее, его способность к самокоррекции весьма хороша: при первом запуске он создал несуществующую временную метку, но исправил её после повторного запуска.

Начиная с версии GPT 5, ёмкость одного окна в ChatGPT значительно увеличилась. Отзывы в социальных сетях свидетельствуют о том, что максимальное общее количество токенов достигло 600 000–800 000, прежде чем был достигнут предел. Это очень позитивный знак для персонализированной пользовательской информации, но при столь длительном времени отображения контекста неизбежно возникнут нарушения планирования памяти и снижение стабильности вывода.

Это ставит перед GPT 5.1 совершенно новую задачу: как поддерживать гибкое и точное распределение памяти даже после дальнейшего увеличения размера окна. Для пользователей это решающий опыт, который ощущается практически сразу.

Программирование: очень простое, очень плавное

OpenRouter предоставляет несколько базовых реализаций и предварительных версий для программирования. Я быстро воспользовался им, чтобы проверить возможности Polaris по написанию небольших игр.

Первое впечатление — это то, что это занимает немного больше времени, около пяти минут. Впрочем, мне не нужно давать сложных подсказок: достаточно просто написать «создай код для игры «Змейка»», чтобы создать небольшую, но играбельную игру.

Он даже предлагает разные режимы и настройки, а игровой процесс в превью был очень плавным. Я также запустил игру «Бей крота», которая тоже прошла успешно.

Веб-дизайн тоже был великолепен. Я отправил сгенерированный текст для кофейни обратно в Polaris и попросил их разработать лендинг для мероприятия.

Компания Polaris изучила весь текст и внесла некоторые дополнения, что привело к хорошему визуальному эффекту. Мне особенно понравился эффект свечения кнопок, который, похоже, является «уникальной особенностью» продукта, поскольку он также проявился в тестах, проведённых другими пользователями.

▲ Изображение от пользователя X

Судя по другим онлайн-тестам, его эстетические характеристики являются многообещающими.

▲ Изображение от пользователя X @ HarshithLucky3

Эти основополагающие задачи в целом не вызывают серьёзных проблем, но, честно говоря, сфера программирования ИИ в настоящее время чрезвычайно конкурентна, и продукты на основе GPT никогда не были особенно сильны в этом направлении. Пока неясно, приведёт ли GPT 5.1 к значительному прорыву в производительности программирования после её внедрения.

Сэм Альтман недавно заявил, что ChatGPT к концу года внедрит режим NSFW (Adult Mode), и, похоже, признаки этого уже видны на Polaris.

Если это так, то есть ещё одно доказательство того, что Polaris соответствует GPT 5.1, особенно учитывая, что OpenAI недавно проводила проверку возраста в небольших масштабах. Это не полномасштабная операция, а скорее целенаправленная подталкивание пользователей, чей реальный возраст неизвестен.

Режим для взрослых вызывает массу споров, и его реализация не так проста, как кажется. Помимо верификации, существует ряд проблем, связанных с идентификацией и хранением конфиденциальной информации. Удастся ли найти решение, устраивающее все стороны, пока неясно, как GPT 5.1 действительно решит эти проблемы.

В преддверии очередного ожесточенного сражения, которое надвигается на конец года, Gemini 3 уже некоторое время анонсировался (хотя его выход неоднократно откладывался), и вот неожиданно появился Nano Banana 2. Не говоря уже о более раннем выходе Kimi K2 Thinking, который привлек огромное внимание как внутри страны, так и за рубежом, при стоимости обучения всего в 4,6 миллиона долларов.

OpenAI продолжает нести колоссальные расходы, и, несмотря на впечатляющую базу активных пользователей, прибыльность остаётся недостижимой. Сможет ли GPT 5.1 оправдать ожидания, столкнувшись с конкуренцией со стороны ряда мощных, но недорогих китайских моделей?

Скоро узнаем. По слухам, релиз состоится в середине ноября, и тогда, возможно, мы получим ответ.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (WeChat ID: ifanr), где вы сможете как можно скорее получить еще больше интересного контента.

ifanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo