Подождите, эти изображения были сгенерированы программой GPT-Image-2?!

Раньше, когда дело доходило до сплетен, попыток добиться справедливости и предоставления конкретных доказательств в интернете, мы полагались на пять слов: «Картинка стоит тысячи слов».

Несмотря на то, что изображения, созданные искусственным интеллектом, встречаются повсюду, как только на изображении появляются сложные китайские иероглифы или реальный интерфейс определённого программного обеспечения, ИИ немедленно распознаётся и становится совершенно «неграмотным».

Источник изображения: X@ hx831126

Но теперь эта эпоха подошла к концу.

Эпоха распознавания изображений с помощью ИИ путем обнаружения опечаток и недостатков пользовательского интерфейса внезапно подошла к концу с полным внедрением модели изображений ChatGPT, GPT Image 2.

Компания APPSO незамедлительно провела стресс-тестирование, используя самые сложные сценарии и бизнес-задачи, характерные для Китая. Без необходимости жеребьевки, все карты оказались на удивление хорошими.

Чтобы использовать GPT Image 2, откройте ChatGPT, нажмите знак «+», выберите «Создать изображение» или найдите «Изображения» в правой боковой панели. В настоящее время любой тарифный план, включая бесплатные пользователи, может использовать его напрямую.

Экзаменационные работы по математике можно подделать; китайский перевод становится новым трендом.

Nano Banana изначально прославилась как «бог» в области рендеринга текста, генерируемого искусственным интеллектом, благодаря своим возможностям в этой области. Однако, несмотря на превосходную обработку текста по сравнению с другими моделями, Nano Banana все же демонстрирует некоторое смещение текста и несколько нечеткую компоновку текста при большом объеме информации.

Теперь же появление GPT Image 2 полностью изменило эту ситуацию. Он не только понимает китайские иероглифы, но и чрезвычайно сложные китайские верстки.

При использовании GPT Image 2 даже излишне сложные подсказки не требуются; наши тесты состояли всего из одного-двух предложений с простым описанием изображения.

Например, его можно использовать для создания контрольной работы по математике для начальной школы в Гуанчжоу.

▲ Задание: Сгенерируйте контрольную работу по математике для начальной школы Гуанчжоу.

Результат превзошел все ожидания. Заголовок, подчеркнутые вопросы с пропусками, геометрические фигуры и даже уникальный шрифт Song/Kai, использованный в экзаменационном бланке, были воспроизведены с абсолютной точностью. На первый взгляд, это выглядело как фотография, сделанная на мобильный телефон и перенесенная прямо на настоящий экзаменационный бланк.

Если использование стандартного шрифта само по себе недостаточно сложно, мы можем попробовать бросить ему вызов, используя традиционную китайскую каллиграфию.

▲ Задание: Создайте изображение оригинальной каллиграфической надписи «Дорога в Шу трудна».

GPT Image 2 говорит, что для меня это по-прежнему не представляет сложности. Сгенерированные изображения подлинной каллиграфии не только точно передают текст, но и отражают плавные линии и энергичные мазки, которые должны быть присущи каллиграфическому произведению. Даже состаренная текстура бумаги и некоторых печатей передана точно.

В ходе ряда тестов, связанных с графическим и текстовым оформлением, GPT Image 2 показал себя безупречно, без искажений текста и наложения шрифтов.

▲ Подсказка: Пожелтевший экземпляр сегодняшнего выпуска AI Evening News от 21 апреля 2049 года.

Когда модель искусственного интеллекта сможет реалистично генерировать экзаменационные работы с вопросами и идеально отображать китайские календари, старая поговорка «лучше один раз увидеть, чем сто раз услышать» будет окончательно и бесповоротно разрушена.

Я считаю, что если бы вы показали эту контрольную работу за четвертый класс ученику начальной школы, он бы точно не смог найти в ней никаких недостатков.

В сочетании с текстом весь цифровой мир можно воссоздать в масштабе 1:1.

Китайская графика — это лишь дополнение к основам; что еще более удивительно в GPT Image 2, так это глубина знаний о мире, которые она раскрывает.

Включая изображения, ставшие вирусными в результате недавних утечек из GPT Image 2, такие как покупка Маском острого соуса Lao Gan Ma в TikTok и конкуренция Ультрамена с платформой, все они основаны на мощных возможностях GPT Image 2 по рендерингу текста и знаниях об окружающем мире.

Концепция «знаний о мире» стала популярной после того, как Nano Banana стала вирусной. Это означает, что даже модели на основе необработанных изображений обладают знаниями об общих моделях, могут осуществлять поиск в интернете и мыслить. Она действительно знает, как выглядят экраны, на которые мы смотрим каждый день, игры, в которые мы играем, и прямые трансляции, которые мы смотрим.

Мы случайным образом оказались в ситуации, очень характерной для интернета.

▲ Задание: Красивая девушка-стример ведет прямую трансляцию на Douyin.

В результате получилось изображение, на котором не только были люди, но, что еще более тревожно, оно полностью воспроизводило пользовательский интерфейс Douyin (TikTok). Раздел комментариев в левом нижнем углу, кнопки «лайк» и «поделиться» справа, количество просмотров и бегущая строка вверху — иерархическая логика всех интерактивных элементов была корректной.

Геймеры могут ощутить это еще сильнее. Когда мы попросили его воссоздать сцену командного боя из League of Legends, он не только отрисовал ландшафт Рифта, но и идеально передал полоски здоровья над головами героев, освещение и тени от эффектов умений, а также рамку мини-карты.

▲Подсказка: игровой экран League of Legends, карта Summoner's Rift, классический изометрический вид сверху, несколько героев участвуют в ожесточенном командном бою.

Оно даже знает самые известные моменты в мире технологий как свои пять пальцев. Всего лишь одним предложением оно может точно воссоздать черты лица Сэма Альтмана, минималистичное сценическое освещение OpenAI и интерфейс прямой трансляции, замаскированный под видеоплеер.

▲Подсказка: Видеозапись прямой трансляции презентации GPT-Image-2 с участием Сэма Альтмана.

GPT Image 2 демонстрирует более глубокое понимание визуальных законов цифрового мира, чем мы предполагали.

XX мертв, вновь совершая революцию в дизайне, маркетинге и рекламе…

За стремительным развитием технологий скрывается конец ряда устаревших рабочих процессов.

Искусственный интеллект перешагнул порог текстового и пользовательского интерфейса, а создание необработанных изображений полностью вышло за рамки «художественного творчества», став ключевым инструментом повышения коммерческой производительности. В этом практическом тесте возможности коммерческого применения GPT Image 2 оказались достаточными, чтобы вызвать нетерпение у многих дизайнеров.

В области промышленного и продуктового дизайна создание сложных механических конструкций и моделирование часто занимают много времени, а теперь это занимает всего несколько секунд.

▲ Задание: Разработайте интересную схему детализации продукции для мотоциклов компании "Zhang Xue Motorcycles".

Плавающее расположение деталей, а также высокотехнологичное освещение и тени позволяют мгновенно получить высококачественные прототипные изображения, над которыми раньше 3D-моделлерам приходилось работать днями.

Источник изображения: X@ hx831126

Что касается визуального оформления для электронной коммерции и рекламы, то он с легкостью справляется как с созданием стильного и изысканного образа продукции Apple, так и с высоконасыщенными и удобными для интернета изображениями с китайским рекламным текстом, необходимыми платформам электронной коммерции.

▲ Подсказка: Рекламный ролик iPhone 16 Pro Max высокого класса

▲Ключевые слова: рекламное фото товара, плавательный круг, привлекательный, высокий коэффициент кликабельности, соотношение сторон 16:9, на китайском языке.

С точки зрения маркетинга и создания интеллектуальной собственности, GPT Image 2 также демонстрирует превосходную логику компоновки и извлечения элементов. Китайские шрифты можно использовать напрямую, логика раскадровки понятна, и даже элементы логотипов различных крупных моделей можно превратить в расширения интеллектуальной собственности с ярко выраженным интернет-стилем.

▲ Задание: Создайте горизонтальный постер к фильму «План спасения» (хотя он не знал о плане спасения Гослинга, выбранные им актеры действительно были звездами высокобюджетных фильмов).

▲Подсказка: Классические страницы комиксов, включая расположение панелей, анимацию персонажей и реплики в диалоговых облачках.

▲ Задание: Создайте серию различных больших языковых моделей на основе искусственного интеллекта (Gemini, deepseek, ChatGPT, Claude, Grok и т. д.) для разработки эмодзи.

Раньше, когда дизайнеры согласовывали требования, они искали различные примеры, создавали сложные дизайн-структуры и дорабатывали макеты и типографику. Теперь же для создания готового продукта, который можно использовать непосредственно для коммерческих предложений, рекламных кампаний в электронной коммерции или даже для массового производства, достаточно простого и ясного указания.

В ходе тестирования доступ к GPT Image 2 был обеспечен как для пользователей с платным, так и с бесплатным аккаунтом. Вы можете попробовать это в окне чата ChatGPT.

Однако предупреждение об ограничении скорости всё равно будет появляться. Если мы будем часто отправлять запрос, требующий от ChatGPT сгенерировать изображение, система сразу же ответит кодом ошибки: «Ваше изображение генерируется слишком быстро. Для обеспечения наилучшего взаимодействия со всеми пользователями установлено ограничение по скорости. Пожалуйста, сгенерируйте изображение в течение 13 минут».

Следует отметить, что всякий раз, когда нам кажется, что OpenAI зашла в тупик, компания умудряется выдать новый козырь в самый неожиданный момент.

В последние несколько месяцев компанию критиковали за поэтапный выпуск новых моделей, закрытие Sora и за то, что браузер ChatGPT Atlas не произвел впечатления, как будто некогда непобедимый гигант в области искусственного интеллекта действительно стал некомпетентным.

Появление сегодня GPT Image 2 можно рассматривать как мощный ответ этим пессимистам.

Когда модель способна генерировать экзаменационные работы по математике таким образом, что это неотличимо от реальности, и полностью воспроизводит интерфейс прямой трансляции в TikTok, с первого взгляда трудно сказать, что «это сделано искусственным интеллектом».

Эпоха, когда «одна картинка стоит тысячи слов», действительно ушла навсегда.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.