Только что новая модель GPT-5.3 зависла в Gemini. OpenClaw: Спасибо.

В загадочном мире наименования моделей искусственного интеллекта суффиксы «Instant» и «Lite» давно уже несут в себе необъяснимый оттенок дешевизны.

На это есть причина. В прошлом подобные модели, как правило, воспринимались как быстрые, но медленно мыслящие, едва подходящие для составления текстовых резюме и склонные к бессмысленным рассуждениям при решении более сложных задач.

Со временем облегченные модели практически стали синонимом принципа «просто довольствуйся тем, что есть».

Только что OpenAI и Google снова столкнулись, выпустив свои облегченные модели и попытавшись разрушить этот стереотип с помощью своих мощных инструментов. Вот упрощенная версия:

  • GPT-5.3 Instant: Более «человечный» интеллектуальный помощник, который значительно снижает вероятность возникновения иллюзий, минимизирует «искусственный тон» и улучшает возможности детального письма. Общение становится более естественным и точным, что делает его подходящим для сценариев с высокими требованиями к качеству контента (письменная речь, профессиональные вопросы и ответы, работа в условиях высокого риска).
  • Gemini 3.1 Flash-Lite: Недорогой, быстрый и эффективный, он также поддерживает настройку «уровня мышления», обеспечивая высокую пропускную способность при одновременном учете глубокого логического мышления, что делает его подходящим для крупномасштабных пакетных задач с высокой скоростью обработки в реальном времени (модерация контента, генерация пользовательского интерфейса, диалоги с NPC).

GPT-5.3 Instant: Наконец-то я научился общаться как нормальный человек.

Те, кто часто пользуется ChatGPT, вероятно, сталкивались с подобной проблемой: вы задаёте простой вопрос, а система упорно даёт вам длинное объяснение, вроде: «Как искусственный интеллект, я должен напомнить вам…»

Такой подход в стиле искусственного интеллекта, когда постоянно пытаются научить людей делать то или иное, действительно довольно раздражает. К счастью, на этот раз OpenAI действительно прислушалась к мнению пользователей.

В недавно выпущенной версии GPT-5.3 Instant приложили немало усилий для решения этой «проблемы». Она научилась давать ответ напрямую, вместо того чтобы давать пространные объяснения.

Помимо того, что она стала менее многословной, она также стала более надежной. Старая версия после поиска в интернете часто выдавала множество ссылок и нерелевантной информации.

Благодаря расширенным возможностям поиска, GPT-5.3 Instant активно объединяет контент веб-страницы со своими собственными фоновыми знаниями, сначала определяя, что именно вы хотите спросить, прежде чем предоставить целенаправленный ответ, вместо того чтобы просто перекладывать работу поисковой системы на вас.

Внутренняя оценка OpenAI показывает, что частота возникновения галлюцинаций снизилась на 26,8% при подключении к интернету и на 19,7% при использовании исключительно внутренних знаний. В официальном отчете особо отмечаются такие области высокого риска, как здравоохранение, юриспруденция и финансы, где новая модель демонстрирует значительные улучшения как в плане осторожности, так и в плане точности.

Самым удивительным, пожалуй, является изменение стиля изложения.

Компания OpenAI проиллюстрировала это сравнением, используя стихотворение: обе версии описывают последний день пенсии филадельфийского почтальона. В более старой версии, как правило, много сентиментальных фраз, таких как «несёт город в своей почтовой сумке», в то время как в новой версии описываются «облупившиеся синие перила» и «ворота, где собака всегда ждёт у двери». Эмоции не нужно напрягать; они просто возникают естественно.

Корректировка тональности также является одной из основных целей этого обновления.

Фразы вроде «Стоп. Сделайте глубокий вдох», прерывающие ход разговора, были намеренно сокращены, что привело к более прямолинейному стилю в целом и уменьшению ненужного «искусственного тона». Пользователи по-прежнему могут настраивать теплоту и энтузиазм ответов в параметрах, чтобы найти свой предпочтительный стиль взаимодействия.

GPT-5.3 Instant доступен всем пользователям ChatGPT с сегодняшнего дня под именем API "gpt-5.3-chat-latest". Платные пользователи могут продолжать использовать GPT-5.2 Instant в более старых версиях, но он будет официально выведен из эксплуатации 3 июня этого года.

▲ Бонусное время

Фонарик Gemini 3.1 Flash-Lite: недорогой, быстрый и довольно умный.

В отличие от прямолинейного подхода GPT-5.3 Instant, Gemini 3.1 Flash-Lite придерживается чисто прагматичного подхода с очень четкой целью: быть быстрым и недорогим.

Что касается ценообразования, то входная цена Gemini 3.1 Flash-Lite составляет 0,25 доллара США за миллион токенов, а выходная цена — 1,50 доллара США за миллион токенов.

Что это значит? Если вы разработчик, это значит, что вы можете поручить искусственному интеллекту прочитать эквивалент пяти полных книг о Гарри Поттере менее чем за 2 юаня.

Думаете, дешевые вещи никуда не годятся? Это свидетельствует об ограниченности мышления.

Согласно результатам бенчмарк-тестов компании Artificial Analysis, по сравнению с предыдущим поколением Gemini 2.5 Flash, модель 3.1 Flash-Lite имеет время отклика первого слова (TTFT) в 2,5 раза быстрее и общую скорость вывода на 45% выше. Для устройств, требующих отклика в реальном времени, эта разница в задержке будет заметна пользователю.

Это означает, что пока вы ещё моргаете, ответ может быть уже наполовину сгенерирован. Для приложений, требующих обратной связи в реальном времени, таких как мгновенный перевод, диалоги NPC в игре и мгновенная генерация пользовательского интерфейса, такая низкая задержка имеет решающее значение.

Кроме того, Gemini 3.1 Flash-Lite также обладает способностью «думать».

В AI Studio и Vertex AI компания Google оснастила эту облегченную модель опцией «Уровни мышления». Разработчики могут регулировать глубину «мышления» модели в зависимости от сложности задачи.

Простые задачи с высокой пропускной способностью, такие как пакетный перевод контента и модерация контента, могут быть быстро выполнены с использованием самой облегченной конфигурации; для задач, требующих строгого соблюдения инструкций, таких как генерация интерфейса или создание симуляций, модель может потратить больше времени на вывод результатов для их окончательной обработки.

Эта способность «иметь всё» принесла впечатляющие результаты. В рейтинге Arena.ai игра достигла показателя Эло 1432 и точности GPQA Diamond (Graduate Level Question Answering) в 86,9%.

Он набрал 86,9% в академическом тесте GPQA Diamond и 76,8% в тесте на понимание мультимодальных данных MMMU Pro. Эти показатели не просто "хорошие для того же ценового диапазона", а напрямую превосходят показатели более крупной модели Gemini 2.5 Flash.

Обратите внимание, что здесь проводится сравнение с Gemini 2.5 Flash, а не с Gemini 3 Flash, что ясно показывает, что Google, будучи хитрым, не питал особой уверенности и в этой модели.

В настоящее время Flash-Lite 3.1 доступен разработчикам в предварительной версии через Google AI Studio и API Gemini, а корпоративные пользователи могут получить к нему доступ через Vertex AI. Ранние партнеры, такие как Latitude, Cartwheel и Wheling, завершили тестирование в производственной среде и в целом подтверждают его стабильность и соответствие инструкциям при выполнении больших объемов запросов.

Если сравнить эти две модели, то можно заметить, что "Instant" и "Lite" в данном случае оказались наиболее подходящими вариантами.

В качестве примера можно привести недавно ставшую популярной программу OpenClaw. Ее основная задача — помогать пользователям обрабатывать электронную почту и управлять расписанием. По сути, это агент, который должен выполнять задачи автономно.

Требования к моделям в продуктах этого типа совершенно отличаются от требований к обычным чат-ботам: от модели не требуется высокий интеллект, но она должна говорить как человек, не делать ошибок и выдерживать частые звонки.

GPT-5.3 Instant значительно снижает частоту галлюцинаций, что означает, что агент совершает меньше ошибок при автономном выполнении задач; уменьшение «голоса ИИ» означает, что сгенерированные электронные письма и документы больше похожи на читательские привычки реальных людей.

Gemini 3.1 Flash-Lite лучше отвечает третьему, наиболее важному требованию. Когда агент работает в фоновом режиме, ему часто приходится обрабатывать огромное количество подзадач параллельно, что делает его чрезвычайно чувствительным к скорости ответа и стоимости API.

Чрезвычайно высокая скорость отклика и доступная стоимость Flash-Lite, в сочетании с его «уровнем мышления», позволяющим гибко распределять вычислительную мощность, делают эту высокогибкую архитектуру настоящим спасением для автоматизированных задач с высокой степенью параллелизма.

Хотя долгосрочная стабильность обеих моделей еще требует изучения, общее направление ясно: одна отвечает за то, чтобы сделать взаимодействие более похожим на человеческое, а другая ориентирована на скорость и экономичность. В будущем, когда у каждого будет свой «лобстер», облегченная модель станет более естественным и прагматичным выбором.

Адрес для справки прилагается:

https://openai.com/index/gpt-5-3-instant/

https://gemini.google.com/u/4/app/e0bea96b8f62bd1f

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете быстро найти еще больше интересного контента.

ifanr | Оригинальная ссылка · Посмотреть комментарии · Sina Weibo