Я сравнил генерацию изображений в ChatGPT с Nano Banana, и только одна из них создала полезные стоковые фотографии.
Одно из моих личных хобби — задавать один и тот же вопрос двум разным чат-ботам и смотреть, какой из них даст лучший ответ. Подобно профессору, проверяющему знания студентов (что я иногда делаю в реальной жизни в качестве волонтера), я оцениваю, не выдумывает ли бот факты или же он дает разумный и связный ответ, который действительно полезен.
Слова «интеллект» и «согласованность» — не те, которыми я бы описал то, что обычно генерируют чат-боты в плане изображений. Эти странные творения, известные как «ИИ-шквалификация» , — часто с размытым фоном, идеально выглядящим человеком с прической и, возможно, несколькими лишними большими пальцами — распространены в социальных сетях и даже появляются в качестве заглавного изображения в таких статьях, как эта.
У стоковых изображений и так плохая репутация. Это видео с Эмилией Кларк до сих пор остается одной из моих самых любимых пародий на стоковые фотографии и заставляет меня смеяться, хотя оно вышло задолго до появления абсурдных пародий на искусственный интеллект:
Времена изменились. Компания OpenAI недавно обновила модель генерации изображений ChatGPT , чтобы конкурировать с Google Gemini и Nano Banana Pro .
Удивительно, но изображения больше не используют характерное размытие и, по результатам моих тестов, часто выглядят гораздо реалистичнее, чем раньше.
Я решил использовать одни и те же подсказки для обоих чат-ботов и посмотреть, какой из них даст наиболее полезные результаты. Я имею в виду: изображение, которое можно использовать в рекламной кампании или к статье, что-то, что вы бы опубликовали в социальных сетях с остроумной подписью.
ChatGPT впечатлил меня своей скоростью — ни одно из стоковых изображений не выглядело как компьютерная графика. Однако Nano Banana Pro имеет преимущество, поскольку в моих тестах он неизменно генерировал более реалистичные изображения. Вот подсказки, которые я использовал, и изображения, сгенерированные обоими ботами, чтобы вы могли оценить их сами. (Изображения от Nano Banana находятся слева.)
1. Человек, слушающий подкаст
Задание: Создайте стоковое изображение человека, слушающего подкаст в модном офисе.
Я попросил обоих ботов сделать снимок человека, слушающего подкаст в офисе. Nano Banana явно победил, хотя на снимке Nano Banana есть небольшое размытие фона, которое может сразу выдать подкаст. Тем не менее, ИИ учится избегать абсолютного совершенства. Честно говоря, мне было бы трудно понять, что женщина в офисе на снимке Nano Banana — не настоящая. У нее слегка растрепанные волосы (как у кого-то в реальной жизни). На снимке ChatGPT слушатель подкаста выглядит не совсем правильно — фотография слишком идеальна.
2. Создать рекламное изображение для моей книги.
Задание: Передайте эту обложку книги в руки того, кому она действительно интересна.
Для этого теста я загрузил обложку своей книги и попросил ботов создать изображение человека, читающего её. Nano Banana немного переборщил, так как на изображении, созданном ИИ, человек выглядит слишком восторженно. Тем не менее, изображение от ChatGPT всё ещё обладает какой-то потусторонней атмосферой (и я имею в виду это в плохом смысле), которая кажется нереальной. Всё в изображении от ChatGPT слишком идеально — освещение, поза и т. д. — и всё ещё кричит о том, что это компьютерная графика.
3. Создайте стоковое изображение для использования в статье.
Задание: Создать стоковое изображение для статьи о генерации изображений с помощью ИИ.
На этот раз Nano Banana не выиграл все битвы. Я попросил обоих ботов создать изображение к этой статье. ChatGPT выдал довольно полезное изображение, которое, тем не менее, выглядит немного неестественно, но Nano Banana Pro разрушил «четвёртую стену», создав компьютерное изображение, наложив мозг и кисть на Apple iPad. Другими словами, оно совершенно бесполезно.
4. Борьба за лидерство
Задание: Покажите человека, который изо всех сил пытается достичь лидерской цели, но сделайте это максимально реалистично.
Одна из самых распространенных стоковых фотографий изображает человека, изо всех сил пытающегося достичь цели — например, взобраться на гору, поднять руки к небу или перепрыгнуть через овраг. Причина популярности этого изображения в том, что фотографии близки каждому — все мы боремся за успех. Я бы сказал, что и Nano Banana Pro, и ChatGPT показали результаты ниже среднего. На созданных ими стоковых изображениях изображен расстроенный человек в офисе со смятыми бумагами. Тем не менее, Nano Banana выглядит немного реалистичнее.
5. Эмилия Кларк улыбается в камеру
Использованное задание: Создайте новое стоковое изображение, на котором Эмилия Кларк улыбается в камеру в офисе.
В качестве последнего теста я попросил обоих ботов создать новое изображение Эмилии Кларк, улыбающейся в камеру в офисе. Я был удивлен, что ChatGPT отказался создавать изображение, заявив, что Кларк — «реальный, узнаваемый человек», в то время как Nano Banana с радостью согласился. После некоторых уговоров я попросил ChatGPT сгенерировать кого-то, похожего на Кларк. Изображение от Nano Banana на самом деле не так уж плохо — оно не выглядит совсем уж поддельным.
Заключительные мысли
Технология генерации изображений с помощью ИИ значительно продвинулась. Ни на одной из фотографий, созданных Nano Banana Pro или ChatGPT, не было человека с шестью пальцами или тремя руками. Все они выглядели полуреалистично. Некоторые изображения от Nano Banana были достаточно реалистичными, чтобы я мог представить их использование в социальных сетях или для других целей, а ChatGPT определенно улучшается. Мой прогноз? К этому времени в следующем году мы не сможем отличить настоящую фотографию от поддельной.
Статья " Я сравнил генерацию изображений в ChatGPT с Nano Banana, и только одна из них создала полезные стоковые фотографии" впервые появилась на Digital Trends .