Фактические результаты тестирования GPT-5.2: Незначительное увеличение способности противостоять скачкам цен, что делает его способным противостоять Gemini?

12 декабря, 2025 Дядя Влад

GPT 5.2, разработанный для превосходства над Gemini, был официально выпущен сегодня рано утром и доступен всем пользователям.

Я отменил свою подписку на ChatGPT Plus в прошлом месяце и перешёл на Gemini. Нужно ли мне теперь возвращаться к ней из-за GPT-5.2?

После прочтения реальных отзывов пользователей сети и практического тестирования APPSO вы, возможно, найдете ответ.

▲На этот раз я наконец-то правильно нарисовал таблицу.

В GPT 5.2 обновлены три модели: GPT-5.2 Instant, Thinking и Pro. Если вы привыкли к тщательному анализу каждого вопроса и ответа в Gemini 3.0 Pro, то, начав использовать GPT-5.2 Thinking/Pro, вы заметите, что скорость обработки информации в ChatGPT снизилась, а время обработки вопросов увеличилось.

Такое же мнение разделяют большинство пользователей, получивших ранний доступ, в социальных сетях. Другими словами, GPT-5.2 — это улучшение по сравнению с версией 5.1 во всех аспектах, и GPT-5.2 Pro очень хорошо подходит для профессиональных задач вывода, требующих длительного времени выполнения; однако время ожидания результатов увеличивается.

Например, один пользователь рассказал, что когда он ввел запрос "Помогите мне составить диаграмму результатов теста HLE", программе GPT-5.2 Pro потребовалось целых 24 минуты, чтобы создать диаграмму.

▲Источник изображения: https://x.com/emollick/status/1999185755617300796/photo/1

К счастью, вся информация оказалась точной, и даже лучший результат на графике по-прежнему показывал Gemini 3.0 Pro.

Это также связано с тем, что срок действия знаний по GPT-5.2 перенесен на август 2025 года , в то время как срок действия знаний по GPT-5.1 был установлен на сентябрь 2024 года, а срок действия знаний по Gemini 3.0, которая была выпущена в прошлом месяце, — на 2025 год.

Когда мы использовали GPT-5.2 Thinking для построения диаграммы истории выпусков моделей OpenAI, это заняло не слишком много времени, и информация оказалась достаточно точной. Для простых задач время, затраченное на использование модели Thinking, значительно отличается от времени, затраченного на использование модели Pro.

▲ Задание: Создайте график изменения количества выпущенных моделей OpenAI с течением времени.

Благодаря своей "сверхвысокой интенсивности" рассуждений и новейшим мировым знаниям, а также многомодальным возможностям понимания и анализа изображений, GPT 5.2 быстро занял второе место в области больших моделей. GPT-5.2-High занял второе место в проекте WebDev (веб-разработка) , а GPT-5.2 — шестое. Для сравнения, Gemini 3.0 Pro занял третье место, а Claude по-прежнему удерживает первое место.

Компания LMArena также выпустила тестовое видео, демонстрирующее использование GPT-5.2 для выполнения ряда задач 3D-моделирования с очень высокой точностью. Однако некоторые пользователи сети прокомментировали это: «Неужели это всё ещё 2003 год?»

▲Источник видео: https://x.com/arena/status/1999189215603753445

Для достижения этого 3D-эффекта с помощью three.js требуется высокая степень мультимодального понимания и способности модели к рассуждению, а также оптимизация в разработке и проектировании программ; GPT-5.2 вполне оправдывает это обновление до версии 0.1.

В настоящее время многие тесты, которыми делятся пользователи сети, в основном сосредоточены на создании полноценных 3D-движков, и GPT-5.2 демонстрирует очень хорошие результаты. Например, есть также тесты с использованием режима рассуждений высокой сложности GPT-5.2 Thinking, который в одностраничном файле создал 3D-модель снежного ледяного королевства, поддерживающую интерактивное управление и экспортируемую в разрешении 4K.

▲ https://x.com/skirano/status/1999182295685644366

Также имеются трехмерные модели бурных готических городских зданий, созданные с помощью GPT-5.2 Pro.

▲Ключевое слово: создайте визуально интересный шейдер, который может работать в twigl-dot-app, сделайте его похожим на бесконечный город неоготических башен, частично затопленный бушующим океаном с большими волнами. | Источник: https://x.com/emollick/status/1999185085719887978?s=20

Что касается возможностей понимания и анализа 3D-данных, мы также использовали подсказку, которую Иэн Гудфеллоу использовал после выхода Gemini 3.0 Pro: загрузить изображение, а затем указать модели сгенерировать красивую сцену для одностраничного приложения Three.js в формате воксельной графики на основе этого изображения.

▲ Поскольку ChatGPT не сгенерировал код для меня внутри холста, я скопировал сгенерированный им код из диалогового окна и открыл его в режиме просмотра HTML, как показано на изображении справа.

Разница довольно очевидна. Хотя ChatGPT также считывал содержимое загруженного изображения — розовую книгу, зеленое поле, серую тонущую поверхность и белую воду — созданная им 3D-анимация была несколько примитивной по сравнению с Gemini 3.0 Pro.

Могу лишь сказать, что объявление Ультраменом этой «красной тревоги» демонстрирует истинные качества Близнецов.

Проверка навыков программирования неизбежно включает в себя классические физические симуляции с использованием шестиугольных шаров. Один блогер усложнил задачу, используя полностью подсвеченные красные 3D-шары. Эффект выглядит очень круто, и многие пользователи сети спрашивают, как это было достигнуто; однако некоторые отмечают, что эти шары, похоже, не подвержены воздействию гравитации.

Затем некоторые пользователи сети ответили, что это имитация космического пространства.

▲Источник видео: https://x.com/flavioAd/status/1999183432203567339

Также есть тест на знание SVG-кода и пеликан, едущий на велосипеде.

▲ Источник изображения: https://arena.jit.dev/

Некоторые пользователи сети также поделились информацией о создании симулятора лесного пожара с использованием GPT-5.2, который позволяет регулировать скорость, размер и радиус распространения огня и т.д.

▲Источник изображения: https://x.com/1littlecoder/status/1999191170581434557?s=20

Мы создали веб-страницу для планетарных сигналов, макет которой практически идентичен этой веб-странице с визуализацией лесных пожаров. Единственное отличие заключается в том, что контент, отображаемый в левой части, был изменен с рассеянных звезд на небесные тела.

▲Ключевые слова: Создайте интерактивную HTML, CSS и JavaScript симуляцию спутниковой системы, передающей сигналы наземным приемникам. Симуляция должна показывать спутник, вращающийся вокруг Земли и периодически отправляющий сигналы, которые принимаются несколькими приемниками.

Для тестирования GPT-5.2 мы также использовали моментальную камеру, которую сами сделали с помощью Gemini 3. Мы вводили те же запросы, попросив разработать веб-приложение в стиле ретро-моментальной камеры.

▲Задание: Разработайте одностраничное приложение-камеру в ретро-стиле скевоморфного типа. Фон страницы должен быть выполнен в виде пробковой доски или темного дерева. Модель скевоморфной моментальной камеры, полностью нарисованная с помощью CSS или SVG, должна быть закреплена в левом нижнем углу, а область объектива должна отображать изображение с камеры пользователя в реальном времени. Что касается логики взаимодействия, при нажатии пользователем кнопки спуска затвора должен воспроизводиться звуковой эффект затвора, и из верхней части камеры должна медленно появляться фотобумага с белой рамкой. Используйте фильтры CSS, чтобы сделать появляющееся фото изначально сильно размытым и черно-белым, плавно переходя в четкое, полноцветное состояние в течение 5 секунд. Наконец, все созданные фотографии должны быть перетаскиваемыми, позволяя пользователям свободно размещать их в любом месте страницы с произвольными небольшими углами поворота и тенями. При нажатии на фотографию она должна размещаться сверху, создавая реалистичную стену из фотоколлажей произвольной формы.

Несколько неожиданно, но ChatGPT также может создавать мгновенные фотографии за один раз.

Когда мы тестировали Gemini 3.0 Pro ранее, его наиболее мощными возможностями были программирование и тот факт, что он не требовал от нас ввода множества команд. Мы могли просто предоставить ему скриншот или видео и попросить воспроизвести их, и Gemini это делал.

На этот раз мы также добавили видео и попросили его воспроизвести веб-страницу, которая генерирует это древнее стихотворение.

▲ https://chatgpt.com/canvas/shared/693b6d1b8fa881919c6298a4aed05581

В отличие от GPT-5.1, который совершенно не знал цветовой схемы моих загруженных видео, на этот раз, похоже, он чему-то научился. Однако, поскольку веб-страницы, сгенерированные Gemini, могут напрямую интегрировать функциональность ИИ через свой API, ChatGPT еще не интегрировал ИИ в эти сгенерированные веб-страницы. Поэтому здесь представлены лишь несколько уже написанных стихотворений.

Помимо классических тестов на навыки программирования и простого создания одностраничного HTML-файла, некоторые пользователи также используют его для написания кода на Python.

Пользователь предложил следующий вариант решения: «Напишите код на Python, который визуализирует работу светофора на улице с односторонним движением, где автомобили въезжают со случайной периодичностью».

Он протестировал как GPT 5.2 Extended Thinking, так и Claude Opus 4.5, и результаты были очевидны. Можно с уверенностью сказать, что нас часто спрашивают, какая модель программирования лучшая, и не случайно модель Клода так популярна среди разработчиков.

▲ Ниже представлена версия GPT-5.2, источник: https://x.com/diegocabezas01/status/1999228052379754508

Кроме того, самым большим недостатком предыдущей модели Claude была её высокая цена. Claude Opus 4.5 стоил 5 долларов за миллион токенов на входе и 25 долларов за миллион токенов на выходе. Теперь цена GPT-5.2 сравнялась с ней, и она примерно на 40% дороже, чем GPT-5.1. GPT-5.2 Pro стоит 21 доллар за токен на входе и 168 долларов за токен на выходе.

В своем официальном блоге, посвященном выпуску GPT-5.2, компания OpenAI упомянула, что в этой версии также улучшены возможности обработки изображений.

Модель GPT-5.2 Thinking — наша самая мощная на сегодняшний день визуальная модель, позволяющая снизить частоту ошибок примерно вдвое при построении графовых схем и понимании интерфейса программного обеспечения.

В нем также приводится пример использования ИИ для добавления размытых рамок на материнскую плату; по сравнению с GPT-5.1, GPT-5.2, хотя и допускает ошибки, отмечает больше областей.

А что насчет Nano Banana Pro? Некоторые пользователи использовали Nano Banana Pro для удаления аннотаций с изображений, а затем просили добавить новые целевые рамки. Как вы думаете, какой вариант лучше?

▲Слева направо: GPT-5.1, GPT-5.2, Nano Banana Pro | Источник изображения: https://x.com/bcaine/status/1999212747213656072

Мне кажется, что ChatGPT "унижает себя" в тех областях, где другие преуспевают. Nano Banana сейчас является бесспорным лидером в работе с изображениями, и хотя GPT-5.2 содержит больше информации для аннотирования, многие ограничивающие рамки по-прежнему определены неточно.

По сравнению с предыдущим поколением GPT-5.1, значительно улучшены возможности программирования и обработки изображений. Если вы какое-то время пользовались ChatGPT, вы сразу почувствуете разницу после обновления. Однако по сравнению с другими моделями, в плане программирования и обработки изображений, он все еще не достигает того же уровня превосходства, что и Nano Banana на момент своего первого выпуска.

Что касается эстетического веб-дизайна, некоторые пользователи сети поделились созданными ими фронтенд-страницами с использованием GPT-5.2. Посмотрим, будут ли фронтенд-программисты снова "убиты" на этот раз.

▲Источник изображения: https://x.com/secondfret/status/1999235822034547011

По сравнению с ранее повсеместно распространенным фиолетовым градиентом, уровень дизайна GPT-5.2 действительно улучшился. Однако, как отметил сам блогер, GPT-5.2, похоже, особенно любит рисовать квадраты на экране, создавая повсюду слои сетки.

Существует также специальный список, касающийся возможностей дизайна. GPT-5.2 совершила скачок вперед, поднявшись с GPT-5.1, которая ранее занимала место за пределами первой десятки, на третье место. Однако наивысший балл по-прежнему принадлежит Gemini 3.0 Pro.

▲ Источник изображения: https://www.designarena.ai/leaderboard

Мы также поставили перед GPT-5.2 задачу создать «высококачественный» веб-сайт, специально для главной страницы компании, занимающейся искусственным интеллектом. Результат? GPT-5.2 очень любит использовать блоки; и я каким-то образом снова получил градиентный фиолетовый цвет.

▲Краткое описание задачи: Вы — один из 0,1% лучших дизайнеров и разработчиков в мире, занимающихся передовыми инновациями в области фронтенд-дизайна и разработки. Вам поручено создать полноценную целевую страницу с использованием {Dither + Shaders}, {WebGL + ThreeJs} и стилизацией загруженного изображения для компании, занимающейся искусственным интеллектом. — Сосредоточьтесь в основном на дизайне, а не на разработке. Импортируйте все необходимые файлы и библиотеки: Three.js, WebGL, GSAP, любые другие библиотеки анимации, связанные с 3D-разработкой.

Наконец, что касается написания текстов, то, судя по отзывам некоторых опытных пользователей, GPT-5.2 начинает демонстрировать способность создавать довольно длинные романы.

Например, когда ChatGPT просят сгенерировать 50 сюжетных идей, он воплощает их все в жизнь, а не только часть, как другие модели. А когда его просят написать книгу объемом 200 страниц, ChatGPT не просто говорит, что не может этого сделать; вместо этого он действительно пытается, не только выстраивая всю структуру книги, но и генерируя PDF-файл.

Пользователи сети отметили, что, хотя сами страницы довольно тонкие, а книга короткая… в конце концов, в настоящее время невозможно написать роман, который можно было бы опубликовать за один раз, но тот факт, что автор, имея 50 идей, может начать это делать, и в итоге написать книгу на 200 страницах, показывает, что у него достаточно глубокая мысль.

Самое замечательное в GPT-5.2 — это его способность очень хорошо следовать инструкциям… не просто в общих чертах делать то, что я говорю, а действительно выполнить всю описанную мной задачу.

GPT-5.2 постепенно внедряется для всех пользователей. Каков ваш практический опыт?

Обновление до GPT-5.2 не заставило меня перейти с Gemini. Хотя программа и показала хорошие результаты во многих рейтингах, как в собственных, так и в публичных тестах, реальный пользовательский опыт оставлял желать лучшего. В части генерации 3D-моделей часто возникали ошибки в коде, а общий эстетический стиль не претерпел существенных улучшений, и всё это за такую цену.

▲ Резкие комментарии пользователей сети

Gemini тоже не останавливается, продолжая оказывать давление на Ultraman. Сегодня утром, хотя новая модель не была выпущена, Gemini Deep Research был переработан и теперь доступен через API. В будущем обновления также будут доступны для Gemini, Google Search и NotebookLM.

Новый агент Gemini Deep Research превзошел недавно выпущенный GPT-5.2 Thinking (45,5%) в тесте Human Last Exam (HLE) с результатом 46,4%, а также показал хорошие результаты в собственных тестах Google DeepSearchQA и BrowseComp.

Вероятно, тревога в Ультрамене продлится ещё некоторое время.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.

ifanr | Оригинальная ссылка · Посмотреть комментарии · Sina Weibo