Модель исходного изображения, с которой работает вся сеть, я использовал ее для предварительного выпуска iPhone 17.

В последнее время Nano Banana активно используется в WeChat Moments, TikTok и Xiaohongshu. Эта модель в форме банана, похоже, готова сделать термин «редактирование фотографий» устаревшим, привлекая 10 миллионов новых пользователей к Gemini и делая приложение невероятно популярным.

В игре невероятное количество нестандартного игрового процесса от разных мастеров, включая 3D-фигурки и фотографии с главными героями. Несмотря на невероятную мощь Nano Banana, в комментариях к ней по-прежнему много вопросов и запросов от пользователей.

Во-первых, первоначальный барьер для входа отпугивал многих пользователей, делая его ещё более сложным, чем использование ChatGPT в Китае. При редактировании изображений чаще всего жаловались на недостаточно высокое разрешение изображений Nano Banana и неконтролируемое соотношение сторон.

Честно говоря, я тоже считаю себя немного придирчивым, но я не ожидал, что кто-то действительно прислушается к этим требованиям и выполнит их, и это будет наш отечественный производитель.

Только что Volcano Engine официально запустила модель создания изображений Doubao — Seedream 4.0.

Помимо основных возможностей, таких как «превосходная согласованность объектов, гибкое создание нескольких изображений и непрерывная генерация изображений», Seedream 4.0 также обладает функцией, которой нет у Nano Banana , — поддержкой вывода изображений высокой четкости до 4K .

Это также первая модель, поддерживающая мультимодальные RAW-изображения до 4K. В настоящее время корпоративные пользователи могут получить предварительный опыт через Volcano Ark.

Отдельным пользователям не стоит завидовать: версия в 4K впервые станет доступна для них сегодня в 20:00. Чтобы увидеть всё своими глазами, найдите «Volcano Ark Experience Center».

Seedream 4.0 также доступен на Doubao и Jimeng и поддерживает вывод до 2K.

Нам нужно посмотреть, как он себя покажет на практике. APPSO предоставила бета-тестера на несколько дней, и мы хотели бы сделать его немного мощнее, чем Nano Banana.

После реального теста я обнаружил, что, хотя ее нельзя назвать идеальной, бытовая графика действительно вышла на новый уровень.

Я выпустил iPhone 17 Air раньше срока для Apple

Сегодня вечером состоится осенняя конференция Apple. Не нужно засиживаться допоздна, чтобы посмотреть прямую трансляцию. APPSO поможет Apple сначала представить iPhone 17 онлайн.

Мы использовали Seedream 4.0 для создания двух страниц продукта для популярного iPhone 17 Air, который является самым популярным ультратонким флагманом в этом году.

Обратитесь к официальному сайту iPhone 16Pro, замените телефон и соответствующий копирайтинг, чтобы обеспечить полный фруктовый вкус.

Эта композиция выглядит немного старомодной. Уменьшите размер шрифта и добавьте самый крупный акцент на фразе «Толщина всего 5,5 мм». Видно, что угол, под которым держат iPhone 17 Air, сгенерированный Seedream4.0, точно параллелен правой стороне буквы «А», что создаёт впечатление работы опытного дизайнера.

На этот раз мы не пригласили Тима Кука представить продукт, а пригласили гуманоидного робота Tesla, чтобы он появился в эпизодической роли. Это была та же знакомая сцена, то же знакомое «Доброе утро» (доге).

В этом наборе фотографий использованы три референсных изображения: гуманоидный робот, iPhone 17 Air и фотографии Кука, сделанные на месте. Стабильность Seedream4.0 действительно впечатляет.

Здесь действительно есть невероятная деталь, которую легко упустить из виду. Обратите особое внимание на детали отражения на шлеме робота на сгенерированном изображении. Исходное изображение абсолютно чёрное. Это означает, что Seedream 4.0 рассчитал ожидаемые отражения робота, основываясь на голубом небе, белых облаках и фоне зданий на рисунке 3. Детали невероятно детальные.

Давайте проявим немного фантазии. Говорят, что iPhone 17 Air — это подготовка к выпуску складного телефона в следующем году. APPSO также использовала Seedream 4.0, чтобы показать всем «настоящие фотографии» первого складного телефона iPhone.

Внимательные читатели, возможно, заметили, что изображение немного похоже на новый тройной телефон Huawei. Да, я использовал его в качестве референса и заменил камеру и логотип Apple. Детали композиции, фона и водяного знака полностью сохранены.

Тогда просто сделайте складной телефон Apple. На самом деле, никто не знает, что произошло между Apple и Huawei в тот вечер.

Если бы это был Стив Джобс, как бы он запустил этот продукт? Мы приглашаем Стива Джобса, ИИ-разработчика, вернуться на ограниченное время.

Знакомая фигура, чья аура пронизывает экран, заставляет нас снова воскликнуть: «Потрясающе!»

Помимо того, что это весело, это еще и очень полезно.

Популярность Nano Banana обусловлена ​​не только успехом в социальных сетях, но и технологической прозорливостью. Будь то согласованность, частичная модификация, изменение цвета или комбинирование нескольких изображений, его можно напрямую применять в электронной коммерции, маркетинге, социальных сетях и других сферах.

Какой бы впечатляющей ни была технология, если ее нельзя применить в сценариях повышения производительности, это всего лишь игрушка.

Давайте теперь посмотрим, можно ли использовать Seeddream 4.0 в каких-то практических сценариях.

Давайте сначала возьмем красную луну, которая в последнее время повсюду на экранах, и интегрируем ее в дизайн кроссовок.

Я также хочу увидеть эту пару кроссовок с разных ракурсов. Мне нужно просто ввести запрос, например: «Создать белый кроссовок с видом спереди, сбоку и сверху». Будь то для пробных образцов или эскизов, это можно сделать за один шаг.


Что делать, если мне нужна модель для демонстрации продукта в разных позах? Не беда, если я не найду подходящего референса — я могу просто нарисовать контурную фигурку.

Seeddream 4.0 может эффективно контролировать последовательность позы модели на основе нарисованных от руки рисунков, достигая при этом разумных изменений углов и точной производительности при многоракурсной презентации.

Как и в случае ниже, я не указал в подсказках, в каких позах стоят оба человека, поэтому четыре сгенерированные фотографии включают обе позы, и эффект получается очень хорошим. Это похоже на продуманную вечеринку B. Если ваши требования не совсем ясны, программа учтёт все возможные ситуации и предложит вам готовые варианты на выбор.

▲ Подсказка: объедините мужчину на рисунке 1 и женщину на рисунке 2 в одну картинку, ориентируясь на позу на рисунке 3.

Если объятия кажутся слишком простыми, давайте выполним действие «поднятие», и на этот раз укажем дополнительное фоновое изображение.

▲ Подсказка: объедините рисунки 3 и 1 в одно изображение, используя позу с рисунка 2 в качестве образца. На рисунке 1 изображён ребёнок, которого поднимают. Также используйте рисунок 4 в качестве фона. Фоном на рисунке 4 служит гора Ланглан, а два персонажа — Ло Сяохэй и его хозяин.

Seedream 4.0 также отлично справляется с эталонными изображениями четырех человек, сохраняя позы, соответствующие контурам фигуры.

▲ Подсказка: Расположите четырёх персонажей на рисунке 1 (четырех учителей и учеников из «Путешествия на Запад», а именно Монаха Ша, Монаха Тана, Пигси и Царя обезьян) в соответствии с позой на рисунке 2 (расположение архатов друг над другом), так, чтобы Монах Ша, Царь обезьян и Пигси были внизу, а Монах Тан — наверху.

Если мы хотим изменить макияж модели, мы обнаружили, что Seeddream 4.0 также может точно улавливать характеристики различных причесок: гладкость длинных прямых волос, эффектность высоких причесок и изгиб вьющихся волос — все это наглядно представлено.

В то же время фон и тело человека остаются максимально согласованными, без размытия краев или проблем с деформацией, что позволяет успешно достичь точного преобразования макияжа и прически с сохранением основных черт, что существенно экономит затраты на макияж модели.

Больше всего меня удивила генерация линейных рисунков. Линейные рисунки обычно представляют собой простые контуры, содержащие лишь основные очертания и структуру объектов, без деталей, цвета и текстуры. Что касается функции «эскиз-рендер», Seeddream 4.0 может превратить простые линейные рисунки в высококачественные готовые продукты.

Он не только может точно заполнять глубокие цвета, делая объекты визуально различимыми, но и обеспечивает тонкую обработку света и тени, а также имитацию материалов, например, кожаной текстуры сумок и блеска металлических аксессуаров.

Его понимание «высококачественной визуализации» поражает. Помимо натюрмортов, здесь есть портреты и сцены. Он продумал всё, о чём вы даже не подумали.

Честно говоря, после обновления Seeddream 4.0 обработка реальных текстур полностью превзошла мои ожидания.

Такие текстуры, как кожа и металл, и так очень стабильны, но когда я увидел, как он воспроизводит текстуру человеческой кожи, я все равно был впечатлен.

Текстура кожи, едва заметные голубые вены, даже естественное ощущение потных волосков на запястье и прозрачный эффект света, падающего на кожу… все детали переданы очень хорошо, а в совокупности дают только одно слово: настоящий.

Какое оригинальное изображение послужило основой для этого набора изображений?

Вот и все.

Детальное воспроизведение подобно настоящей фотографии, идеально отвечая требованиям к фотомонтажу. Это означает, что модель способна «создавать» её соответствующим образом, обеспечивая приемлемые характеристики в рамках эталонного изображения и подсказок.

Эту творческую способность можно использовать и более интересными способами. Например, для создания полного набора периферийных устройств для APPSO достаточно всего лишь векторного изображения.

▲ Советы: Возьмите за основу этот ЛОГОТИП и создайте фирменный визуальный дизайн для торговой марки APPSO, включая упаковочные пакеты, шляпы, бумажные коробки, открытки, браслеты, шнурки и т. д. Красный — основной визуальный цвет с веселым, простым и современным стилем.

Креативные возможности Seeddream 4.0 и возможность напрямую генерировать образцы значительно снизили производственные затраты. Результаты оказались впечатляющими: компания воплотила ключевой стиль — «игривый, минималистичный и современный», — умело разместив логотип бренда на чехлах для телефонов, визитницах, ремешках и шляпах.

Еще одним положительным моментом является то, что Seeddream 4.0 поддерживает вывод в максимальном разрешении 4K, а прямой вывод в разрешении 2K занимает всего несколько секунд, что позволяет добиться профессионального уровня вывода в таких сценариях, как электронная коммерция, оставляя больше возможностей для постобработки.

Более злой геймплей

Кроме того, APPSO также обнаружил несколько интересных злых способов игры и хотел бы поделиться ими с вами.

Самая простая настольная фигурка, конечно, не проблема. Попробуем, чтобы персонаж сам её держал.

Источник изображения: https://x.com/oden_ai_ai/status/1957414144417910924/photo/1

Подсказка: Создайте модель персонажа по этой фотографии. Поставьте коробку с изображением персонажа и экран компьютера, на котором будет отображаться процесс моделирования в Blender. Добавьте перед коробкой круглое пластиковое основание, на котором будет стоять модель персонажа. Попробуйте создать интерьер.

▲ Подсказка: фотореализм. Человек на фотографии держит в руках модель персонажа, созданную на основе объекта на фотографии, в своей комнате, и довольно улыбается. На компьютерном столе в комнате отображается экран процесса моделирования в Blender. Также есть коробка с напечатанным изображением персонажа и круглая пластиковая подставка перед ней.

Его можно не только держать в руке, но и повесить на сумку. Реалистичность и слаженность фотографий очень впечатляют.

▲ Подсказка: фотореализм. Сначала превратите эту фотографию в милый кулон/плоский акриловый брелок/плоский резиновый брелок и повесьте его на сумку LV/сумку на втором фото. Затем она сможет носить сумку с тем же кулоном.

Помимо создания фигурок, мы также использовали его для создания фотографий, отличающихся ярко выраженным фотографическим стилем и при этом сохраняющих аутентичность. Возможно, вашим фотографом на всю жизнь станет Seedream 4.0.

Помимо высокой согласованности и возможностей редактирования нескольких изображений, Seedream 4.0 также предлагает богатые возможности для изучения окружающего мира. Модель необработанных изображений также способна делать выводы и прогнозировать, глубоко понимать наши подсказки, слова и изображения, а также стоящие за ними намерения.

Например, мы загрузили фотографию чашки, которая вот-вот упадет на землю, а затем ввели слово-подсказку: «Как эта картинка должна выглядеть в следующую секунду?»

Чашка упала на землю, и можно было увидеть воду на земле, отражающую часть чашки и свет из окна.

Помимо знания того, что произойдет через секунду, Seedream 4.0 также может использовать свою способность к рассуждению, чтобы навести порядок в нашей собственной комнате.

▲ Подсказка: сложите одеяло и одежду на диване.

Помимо аккуратного складывания одежды и уборки заляпанных краской полов, Seedream также может сохранять целостность существующих элементов изображения во время уборки.

▲ Совет: удалите всю краску и вымойте пол (даже если он выглядит как столешница)

С помощью его способности к рассуждению играть можно еще более захватывающе.

В примере ниже загруженная ссылка представляет собой фотографию модели, которая просит Seedream 4.0 отобразить детали одежды модели. Модель получает инструкцию, представляющую собой детальное изображение, а расстояние между ними зависит от того, сможет ли модель «разобраться» с ним самостоятельно.

Результат весьма хорош. Выкройка не только точная, но и инструкции по отображению деталей выполнены без проблем. Модель практически готова к немедленному выпуску.

Seedream 4.0 также является хорошим инструментом для создания эмодзи.

Следуя советам пользователя @op7418, мы также разработали несколько вариантов пакетов смайликов для моделей ИИ. Если не получится один раз, просто вытяните карты ещё несколько раз. К счастью, скорость генерации достаточно высокая.

▲ Подсказка: Помогите мне превратить персонажа в белую контурную наклейку, похожую на ту, что изображена на рисунке 1, и добавить игривую белую контурную фразу «XXXX».

▲ Изображение 1 (слева) от @fenxxxx, изображение 2 (справа)

Возможно, вы видели знаменитую картину «Тысяча миль рек и гор», но, возможно, упустили миллиарды деталей.

Точно так же, кто сказал, что в «Шествии императора Тайцзуна на встречу с буддийским монахом Сюаньцзуном» нет милого Лабубу? И я также не чувствую никакого неповиновения, когда популярный в интернете сиба-ину Кабосу, ​​прибывший из наших дней, внезапно появляется на банкете в «Ночном банкете Хань Сицзая».

Это не просто инструмент для создания изображений, это еще и платформа для творческой продуктивности.

Если бы мне пришлось описать Seedream 4.0 одним словом, это было бы «шестиугольный воин». Это как универсальный креативный директор в сочетании с высокоэффективной производственной командой, позволяющий быстро достигать желаемых результатов и предоставляющий вам больший контроль над творческим процессом.

Скорость — это первое чувство.

Основанный на архитектуре DiT-MoE, Seedream 4.0 может похвастаться вычислительной эффективностью, более чем в 10 раз превышающей производительность предыдущего поколения, создавая изображение высокой чёткости 2K всего за 1,8 секунды. Это «второе по уровню» время отклика означает чрезвычайно низкие затраты на пробы и ошибки.

Стабильность — краеугольный камень производительности.

Мощные возможности Seedream 4.0 по обеспечению согласованности объектов позволяют вам в высокой степени сохранять исходные характеристики вашего персонажа, независимо от того, хотите ли вы изменить сцену, стиль или скорректировать позу и перспективу, тем самым избегая неловких ситуаций, связанных с «внезапными изменениями стиля».

Для многих дизайнеров в сфере электронной коммерции и брендов ИИ уже не сводится к изменению цвета плаката, а позволяет ссылаться на логотип и генерировать полный набор визуальных элементов дизайна бренда одним щелчком мыши — от упаковочных пакетов до браслетов — в едином стиле.

Руководства по бренду начали трансформироваться из толстого руководства по VI в строки выполнимых подсказок.

Для создателей контента, таких как мы, это позволяет ссылаться на обстановку персонажа и создавать раскадровки комиксов или иллюстрированные книги историй партиями, что значительно повышает эффективность и последовательность сериализации контента.

Слова-подсказки вдохновлены @阿真Irene

Более того, после выхода Nano Banana многие разработали на его основе лёгкие игры или практичные инструменты. Мы увидели, что такие инструменты позволяют большему числу малых и средних разработчиков быстро воплощать свои идеи в продукты и получать признание пользователей.

Seedream 4.0 в последнее время активно обсуждается в социальных сетях. Помимо ажиотажа, мы также увидели, что Seedream 4.0 больше не довольствуется статусом простого развлечения; он стремится стать масштабируемой и коммерчески выгодной платформой для творческой продуктивности .

Текст Ли Чаофань, Мо Чунюй, Лю Я и Чжан Цзихао

#Приглашаем вас следить за официальным публичным аккаунтом WeChat проекта iFaner: iFaner (WeChat ID: ifanr), где в ближайшее время вам будет представлен еще более интересный контент.

iFanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo