Nano Banana 2 появился на рынке всего на один час, после чего был снят с производства, легко справившись с тестами, которые приводили к сбою всех ИИ.

Nano Banana, вызвавший настоящую сенсацию в Интернете, теперь выпускает версию 2.0.

Насколько же мощный новый Nano Banana 2? Взгляните на часы в 11:15 и на полный бокал красного вина на фотографии ниже.

▲Источник изображения: x@synthwavedd

Почему эта фотография так впечатляет? В области изображений, генерируемых искусственным интеллектом, существует чрезвычайно сложный тест, который ни один искусственный интеллект в настоящее время не может выполнить надёжно: тест с часами и полным бокалом красного вина .

Введите подсказку « 11:15 на часах и бокал вина, наполненный доверху », чтобы проверить, достаточно ли «умно» ваше изображение, сгенерированное искусственным интеллектом.

Мы пробовали несколько раз на большой модельной арене, Seedream и Nano Banana версии 1.0, но ни один ИИ не мог точно отобразить отметки часов и бокал красного вина, который был почти переполнен.

В nano banana 2 это стало возможным. По сравнению с текущей версией nano banana, возможности визуализации текста были улучшены, что позволило писать текст напрямую и работать с различными стилями и языками; также был расширен кругозор, что позволило точно генерировать различную инфографику; а также повысилась точность выполнения команд.

▲ Более реалистичные надписи на доске|Источник изображения: x@testingcatalog

В отличие от Nano Banana, которая впервые была представлена ​​на рынке крупных моделей через систему Gacha, модель Nano Banana 2 просочилась в сеть на media.io, где пользователи могут испытать nano banana 2.

▲ Media AI (medio.io) в настоящее время располагает только другими моделями изображений на базе ИИ, такими как nano banana и Seedream.

Однако эта модель, известная как nano banana 2, была быстро удалена. На Reddit некоторые пользователи отметили, что Media AI предоставлял доступ лишь на короткий период — чуть больше часа.

Однако за этот короткий промежуток времени пользователи сети обнаружили, что качество неотредактированного изображения действительно сопоставимо с NB 2.0 , и это быстро распространилось в социальных сетях. Все делились результатами работы предварительной версии Nano Banana 2, обнаружив значительную разницу по сравнению с версией Nano Banana 1.0.

Можете ли вы сказать, какое из этих двух изображений, из версий 1.0 и 2.0, принадлежит Nano Banana 2?

▲ Источник изображения: x@Azinha810

На обеих фотографиях запечатлены модели автомобилей, снимающие происходящее на прибрежном шоссе, но первое изображение явно более точное по цвету и стилю, в нем отсутствует ощущение «пластика», часто ассоциирующееся с фотографиями, созданными с помощью искусственного интеллекта.

▲ Источник изображения: x@Azinha810

Разница ещё более заметна на этих двух изображениях в научно-фантастическом стиле. Второе изображение создаёт более кинематографичный эффект, а его визуальное качество демонстрирует более точную детализацию, чем первое. Например, панель приборов на первом изображении заметно отличается от второго ; панель приборов, созданная Nano Banana, всё ещё имеет ярко выраженный стиль искусственного интеллекта.

Согласно информации, обнародованной блогером testingcatalog на X, nano banana 2 по-прежнему базируется на Gemini 2.5 Flash и еще не начал в полной мере использовать Gemini 3.0 Pro.

Это означает, что дата выпуска графической модели Nano Banana 2 может быть раньше, чем Gemini 3. Мы собрали текущие утечки о Nano Banana 2, в которых упоминаются следующие основные моменты.

1. Он может выполнять более сложные задачи , такие как точная окраска, расширенное управление точкой обзора или углом, а также исправление текстовых элементов на сгенерированных изображениях, задачи, которые не поддерживаются в текущей версии 1.0.

▲ Введите запрос, чтобы окрасить воду в розовый цвет. На изображениях представлены исходные изображения: «Нано-банан 1» и «Нано-банан 2». | Источник изображения: x@Angaisb_

2. Благодаря совершенно новому многоэтапному процессу генерации , nano banana больше не просто «генератор изображений в один клик», а скорее напоминает работу дизайнера.

  1. Планирование: Значительное количество времени тратится на планирование выходного контента.
  2. Генерировать: создать предварительное изображение.
  3. Обзор: Самоцензура с помощью встроенных функций анализа изображений.
  4. Исправление: Выявите и исправьте любые ошибки.
  5. Итерация: повторяйте процесс по мере необходимости и, наконец, дайте результат.

3. Генерация изображений с более высоким разрешением и более полным соотношением сторон , включая более широкий диапазон соотношений сторон, таких как 1:1, 2:3, 3:2, 3:4, 4:3, 9:16, 16:9 и 21:9, при этом в просочившейся информации говорится, что существуют несколько режимов разрешения, таких как 1K, 2K и 4K.

▲Интерфейс рабочего процесса ComfyUI

Среди функций, пожалуй, главным отличительным преимуществом обновления nano banana является многоэтапный рабочий процесс . Возможно, мы уже слышали о таких инструментах, как ComfyUI, которые позволяют создавать рабочие процессы для генерации RAW-изображений и видео. Но теперь это можно сделать непосредственно через nano banana, что является огромным шагом вперёд в создании высокоточных изображений.

Фактическая производительность зависит от сгенерированных изображений. Давайте рассмотрим тестовые примеры, полученные с помощью nano banana 2.

Улучшенная визуализация текста

Во-первых, вот реальный скриншот компьютера. Nano Banana 2 может напрямую создавать скриншоты компьютера под управлением Windows, показывая, как браузер открывает сайт YouTube, и указывая, что миниатюра видео — «Мистер Зверь».

▲ Загрузите скриншот вашего компьютера с Windows напрямую. Подсказка: создайте скриншот рабочего стола Windows 11 с открытым Google Chrome, на котором отображается миниатюра видео «Мистер Зверь» на YouTube на сайте http://YouTube.com. | Источник изображения: x@synthwavedd

Для более сложных настроек Nano Banana 2 может даже создать скриншот веб-страницы Google DeepMind. Плотный текст не содержит искажений, что действительно впечатляет.

▲Источник изображения: x@synthwavedd

Однако некоторые внимательные пользователи сети заметили, что производительность Nano Banana 2 не идеальна: на изображении были опечатки, например «Gemini 31» и «Google DeepMind – Nevdscl».

Без тщательного изучения обнаружить ошибки, просто глядя на основные заголовки и подзаголовки, крайне сложно. Однако при обработке небольших объёмов текста вероятность ошибок в nano banana 2 значительно ниже.

На этом снимке из прямой трансляции новостей по телевидению видно, что текст на экране точен и отформатирован одинаково; текст даже отраженный на полу отображается правильно.

▲Источник изображения: x@synthwavedd

Аналогично, вот скриншот прямой телетрансляции: ведущий находится на правой стороне экрана, классическая бегущая строка внизу новостной программы, а весь текст отображается точно.

▲ Ключевые слова: 50-миллиметровая высокобюджетная прямая трансляция, фотография крупным планом в разрешении 8K, привлекательная итальянка 30 лет с ироничным взглядом. Она за стойкой новостей, а на экране за её спиной — биоинженерный банан с надписью «Нано-банан 2 в прямом эфире на Media .IO?». Прямая трансляция. В нижней части изображения — красно-синий хирон с надписью «Срочные новости: Нано-банан 2 в прямом эфире на Media .IO?». Источник изображения: x@BrentLynch

У нас также был текущий процесс nano banana с той же подсказкой.

Эта фотография не производит впечатления сильной работы искусственного интеллекта, но размытый фон экрана делает ее менее похожей на сцену из новостной программы, а отражения текста также кажутся немного искусственными, подчеркивая образ ведущего.

Обладая знаниями о мире, они смогут лучше понять наши инструкции.

Как и в случае с 11:15 и полным бокалом красного вина на начальном изображении, в разделе комментариев пользователи сети выкладывали собственные неотредактированные изображения, используя другие модели, такие как Grok и ChatGPT, но ни одно из них не было таким точным, как nano banana 2.

Некоторые пользователи сети также поделились своим опытом использования Nano Banana 2 для остекления гамбургера, и это был единственный способ превратить весь гамбургер в стекло; в то время как Seedream и Riverflow от ByteDance превратили в стекло только булочку.

▲ Подсказка: сделайте гамбургер из стекла. Изображение 1 — это картинка, созданная nano banana 2 | Источник изображения: x@Angaisb_

Достижения в области глобальных знаний позволяют Nano Banana 2 лучше понимать подсказки, обеспечивая строгое соблюдение инструкций и одновременно упрощая подсказки.

Например, когда пользователь пытался создать трейлер GTA 6, nano banana 2 сразу же предоставил ему полную страницу YouTube и даже знал настоящий логотип GTA 6.

▲ Источник изображения: x@jewgibor

Он также протестировал набор подсказок: «One Piece Live Action Netflix». В результате оказалось, что nano banana не только знал логотип Netflix, но и знал актёров в экранизации.

Объединяя знания о мире с отображением текста, Nano Banana 2 может даже решать для нас задачи на доске, что гораздо удобнее, чем читать длинные математические рассуждения в чате.

▲Источник изображения: x@MagusWazir

Сравнение Nano Banana версии 1.0 и Nano Banana 2 выглядит следующим образом.

▲ Источник изображения: https://www.reddit.com/r/singularity/comments/1osolhn/nano_banana_2_vs_nano_banana_comparison_output/

Существует множество подобных случаев, когда Nano Banana 2 используется для решения математических задач, а затем ответы записываются на доске.

▲ Источник изображения: x@Liam06972452

На этот раз были улучшены не только возможности редактирования, но и возможность создания неотредактированных фотографий.

Предварительная версия теста была кратко продемонстрирована на платформе Media AI.

▲Подсказки: Кен Канеки несёт друга на руках по снегу, «Токийский гуль» | Источник изображения: x@legit_api

Сцена Канеки Кена, обнимающего друга в снегу из «Токийского гуля», была воссоздана невероятно естественно. Помимо неизменно качественной аниме- и киберпанковой стилистики, неотредактированные изображения Nano Banana 2 также выглядят невероятно качественно.

▲ Подсказка: Робот-хакер в стиле киберпанк, работающий перед множеством мониторов | Источник изображения: x@testingcatalog

Существуют также всевозможные «пародийные» портретные изображения.

▲ Источник изображения: x@MicahBerkley

И эти групповые фотографии в ярко выраженном кинематографическом стиле.

▲ Источник изображения: x@rpnickson

Однако кто-то прокомментировал: «Это вообще не Nano Banana; Media AI — китайская компания. Как и в случае с DeepSeek, мы тоже думали, что это от OpenAI; это их обычная тактика».

Когда Nano Banana 1 впервые появился на арене больших моделей, никто не был уверен, действительно ли эта модель принадлежит Google, но в конце концов, если исходные изображения были достаточно потрясающими, мы бы ее купили.

Судя по текущему качеству нередактированного изображения, название Nano Banana 2 вполне приемлемо.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (WeChat ID: ifanr), где вы сможете как можно скорее ознакомиться с еще более интересным контентом.

ifanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo