ChatGPT Images 2.0 уже здесь, и это гораздо больше, чем просто обновление.

OpenAI возвращается с очередным обновлением возможностей ChatGPT по обработке изображений , и на этот раз это больше похоже не на рекламный трюк, а на серьезный шаг к тому, чтобы сделать визуализацию данных ИИ действительно полезной. OpenAI официально представила ChatGPT Images 2.0, новую систему генерации изображений, которая в значительной степени опирается на логический анализ и точность.

ChatGPT Images 2.0 фокусируется на понимании, а не просто на генерации.

Вместо того чтобы вслепую превращать подсказки в визуальные образы, модель теперь использует более обдуманный подход, по сути, «продумывая» то, что вы спрашиваете, прежде чем генерировать изображение.

Этот сдвиг проявляется в нескольких ключевых аспектах. Модель гораздо лучше справляется со сложными запросами, может поддерживать согласованность результатов в нескольких выходных данных и заметно надежнее при размещении текста внутри изображений, с чем, как известно, испытывали трудности более ранние инструменты ИИ.

Кроме того, система может генерировать множество вариантов на основе одного запроса, сохраняя при этом основную идею, что делает её гораздо более полезной для итеративной работы. В результате получается система, которая больше похожа на инструмент, который действительно понимает, что вы пытаетесь создать, чем на генератор арта на основе ИИ.

Именно здесь изображения, созданные с помощью ИИ, начинают приобретать практическое применение.

Что делает это обновление интересным, так это направление, в котором движется OpenAI. Речь идёт уже не о погоне за вирусными изображениями, созданными с помощью ИИ, а о том, чтобы сделать генерацию изображений применимой в реальных условиях. Благодаря улучшенному рендерингу текста, более качественной структуре и более предсказуемым результатам, ChatGPT Images 2.0 начинает приносить пользу в таких областях, как презентации, креативы для социальных сетей или быстрые макеты дизайна. Это всё ещё не полная замена профессиональным инструментам, но уже достаточно близко к этому, чтобы справляться с удивительно большим объёмом повседневной творческой работы.

Тем не менее, это не идеально. Иногда встречаются несоответствия, особенно в случае сложных макетов или текста не на английском языке. Но по сравнению с тем, что было даже год назад, прогресс трудно игнорировать. И если эта тенденция сохранится, грань между «сгенерированными ИИ» и «действительно пригодными для использования» визуальными элементами очень быстро станет тоньше. ChatGPT Images 2.0 доступен с сегодняшнего дня всем пользователям ChatGPT и Codex, а расширенные возможности вывода с использованием Thinking доступны пользователям Plus, Pro, Business и Enterprise. Базовая модель gpt-image-2 также доступна в API.