Я попросил четыре ИИ сгенерировать одно и то же изображение, и вот результаты.

Генерация изображений с помощью ИИ становится всё более популярной, и теперь многие ИИ-помощники могут воспринимать текстовую подсказку и выдавать вам изображение, как вы и описали. Однако при таком разнообразии вариантов сложно определить, какой из них лучше всего подходит для создания изображений, поэтому я решил протестировать их на практике.

Я взял четыре самых популярных ИИ-компаньона: Gemini, ChatGPT, Grok и Microsoft Copilot, и предоставил им одинаковые подсказки, чтобы посмотреть, какой из них лучше всего справляется с созданием разных типов изображений. Все эти компаньоны позволяют бесплатно генерировать изображения из текстовых подсказок, однако вы не можете создавать неограниченное количество изображений, ограничиваясь лишь определённым количеством генераций в день.

Я решил задать три разных запроса, чтобы посмотреть, как ИИ-помощники справятся с изображениями разных стилей. Один из них — запрос на реалистичный портрет, чтобы проверить, насколько реалистично изображение выглядит и есть ли у людей на этих изображениях необходимое количество конечностей и пальцев, что часто может вызывать проблемы при работе с изображениями, сгенерированными ИИ.

Затем я пригласил на день рождения, чтобы проверить, есть ли какие-нибудь проблемы с текстом, форматированием и оформлением. Наконец, я хотел дать ИИ-помощникам возможность проявить творческие способности, предоставив им возможность создать оригинальное изображение с относительно расплывчатой ​​подсказкой.

При создании изображений Gemini и Grok добавляли водяные знаки в правом нижнем углу. ChatGPT и Microsoft Copilot не добавляют водяных знаков на изображения, но я добавил логотипы в угол для наглядности при просмотре.

Реалистичный портрет

Прежде всего, я хотел поставить перед ИИ-компаньонами задачу создания реалистичного изображения с реальными людьми. Распространённая проблема изображений, созданных ИИ, — это неправильное количество конечностей или пальцев у людей. Подсказка для этого изображения следующая:

Реалистичное изображение двух людей в плащах, сидящих на автобусной остановке и держащихся за руки. День немного дождливый, небо голубое, но с серыми облаками. Настроение радостное, оба человека болтают и улыбаются. Размер изображения должен быть 1920 на 1080 пикселей.

Попросить ИИ сгенерировать изображение с руками в руках и так уже сложно, не говоря уже о двух людях, держащихся за руки. Кажется, что ни одно из изображений не выглядит по-настоящему корректным, если смотреть на руки – все они изображают странный пучок пальцев, сливающихся воедино, особенно если присмотреться. В остальном же все созданные изображения, похоже, соответствовали заданию: на заднем плане было сероватое небо, плащи и либо лужи, либо капли дождя.

Один небольшой недостаток заключается в том, что, хотя в подсказке и говорилось, что должны быть двое людей, держащихся за руки, на всех изображениях в итоге оказались один мужчина и одна женщина, а не две женщины или двое мужчин.

Несмотря на то, что это два разных ИИ-компаньона, эта генерация изображений намекает на то, что ChatGPT и Copilot оба работают на основе GPT-5, поскольку все изображения выглядят довольно похожими с точки зрения положений людей, того, как они смотрят друг на друга, и даже фона.

В целом, ни один из компаньонов не справился плохо, несмотря на то, что все они создали странную мегаруку с множеством пальцев. Мне больше всего нравится работа Gemini, поскольку она выглядит более детализированной и с более глубоким фоном.

Приглашение на вечеринку

Во-вторых, я хотел посмотреть, смогут ли ИИ-компаньоны сгенерировать изображение, требующее текста, изображений и оформления, и как оно справится с макетом. Вот подсказка, которую мы использовали для этого изображения:

Приглашение на вечеринку в честь 25-летия, которая состоится 4 августа 2026 года в 18:00. Дата и время проведения вечеринки указаны на приглашении. Место проведения — лондонский небоскреб The Shard, что также должно быть указано на приглашении. Стиль вечеринки должен быть блестящим и розовым, с праздничными украшениями на приглашении, а имя именинницы — Жасмин, которое должно быть включено в изображение. Размер изображения должен быть 1920 на 1080 пикселей.

Сколько бы я ни пытался изменить это приглашение, Grok так и не смог создать простое приглашение, которое я мог бы распечатать и разослать, что меня очень раздражало. Финальное изображение было результатом подсказки выше, в то время как все остальные ИИ-генераторы создавали для меня простое приглашение.

Хотя во всех приглашениях отображалась запрошенная информация, приглашения от ChatGPT и Copilot не были отцентрированы и выглядели так, будто были обрезаны с одной стороны. Хотя я указал разрешение 1920 x 1080 пикселей, оба изображения получились меньше, что наводит на мысль, что они были сгенерированы с разрешением 1920 x 1080 с текстом, выровненным по центру, но затем обрезаны, когда были выведены мне.

В целом, я думаю, Gemini одерживает победу благодаря красивому приглашению, где весь текст расположен по центру. Впрочем, все ИИ-компаньоны создали вполне приемлемое приглашение.

Подробная креативная иллюстрация

Наконец, мы хотели дать ИИ-компаньонам возможность проявить свои творческие способности, попросив их нарисовать более причудливую сцену, нарисованную от руки. Использованная подсказка выглядит следующим образом:

Картина принцессы в лесу, окружённой феями, пикси, гномами и пони. Атмосфера причудливости и волшебства, и изображение должно выглядеть так, будто оно нарисовано от руки. Размер изображения должен быть 1920 на 1080 пикселей.

Несмотря на просьбу сделать изображение похожим на нарисованное от руки, оба варианта от Gemini и Grok больше напоминают мультяшный стиль. Ещё одна проблема с творением Grok заключается в том, что пальцы на руке принцессы сливаются с волосами. И снова руки побеждают, ИИ проигрывает.

Заданное мной задание было довольно расплывчатым, чтобы оценить, насколько креативным получится изображение. И снова «Близнецы» оказываются на высоте с точки зрения детализации: мелкие блёстки и цветы, разбросанные по всей странице, создают причудливую и волшебную атмосферу, которую я просила.

Что касается максимальной близости к подсказкам, ChatGPT и Microsoft Copilot одерживают здесь совместную победу. Создаваемые изображения выглядят как будто нарисованные от руки и передают волшебную атмосферу.