Эта новая функция создания видеороликов с использованием искусственного интеллекта превращает Илона Маска в уличного бандита, а Линь Дайюй — в модные бренды, и настолько увлекательна, что шаг за шагом учит вас, как стать модницей за считанные секунды.

У вас есть 30 секунд, чтобы представить свой сегодняшний образ.

Генеральный директор Apple Тим Кук, обычно сдержанный и носящий простую одежду, надел объемную пуховую куртку и подтяжки, украшенные бриллиантами, для своего «личного видео-презентации» и принял самую крутую гангстерскую позу перед камерой.

Самым гениальным было то, что он вытащил калькулятор Texas Instruments, словно доставая пистолет.

▲Источник видео: https://x.com/ReflctWillie/status/1997819640874205685

Многих зрителей захватил этот видеоролик, им невероятно понравилось его снятое одним кадром, и они не могли оторваться от просмотра. Создатель видео применил голливудский уровень операторской работы к абсурдному контенту. Изысканный стиль и юмористический контент не позволили этому видео, созданному с помощью ИИ, продемонстрировать дешевизну, часто ассоциирующуюся с подобным контентом, и быстро сделали его хитом в социальных сетях.

Сразу же появилась версия Маска.

▲ Источник видео: https://x.com/VibeMarketer_/status/1999227084250448083

Автор скрупулезно описал весь процесс создания, используя подсказки на контактных листах для получения набора из 6 изображений с одинаковым фоном, выражением лица и одеждой, но разными позами.

▲ Пробный отпечаток на пленке 3×2

Термин «print» первоначально относился к странице с миниатюрами фотографий, использовавшейся в фотографии в эпоху пленочной фотографии. Применение этой концепции к Nano Banana Pro означает полное использование ее возможностей по обеспечению согласованности для одновременного создания серии скриншотов видео с различными стилями и ракурсами, а затем использование первого и последнего кадров для создания видео.

Nano Banana Pro может создавать полные макеты с девятью и более ключевыми кадрами за один запуск, при этом каждый кадр сохраняет превосходную согласованность в характере, деталях и повествовании. Даже при создании отдельных макетов Nano Banana Pro может автоматически заполнять контент на основе загруженных эталонных изображений, обеспечивая согласованность повествования.

▲ Создание видео первого и последнего кадра, задание: Однокадровая съемка, камера движется плавно и медленно, фокусируясь на очках человека, при этом объект постоянно находится в кадре. Движения объекта минимальны и осторожны.

Получив изображения, мы можем объединить их в видео, преобразовав первый и последний кадры. Модели и инструменты для генерации видео, такие как Keling, Veo 3.1, Hailuo и CapCut, легко справляются с этой задачей.

Стоит отметить, что Sora 2 в настоящее время не поддерживает загрузку изображений с реальными лицами, а Grok Imagine от Маска поддерживает только преобразование первого кадра в видео. В целом, мы по-прежнему рекомендуем использовать Google Veo 3.1, функцию "Jimeng" в CapCut или Kuaishou Keling для выполнения этой задачи.

▲Конвертер изображений в видео Grok, содержимое по умолчанию, причина неясна.

В руководстве, предоставленном этим видеоблогером, он использовал Nano Banana Pro и Coring для достижения этой цели, и разработал целый набор инструментов, позволяющих свободно заменять различные символы.

▲ Источник видео: https://x.com/ReflctWillie/status/1998720751806066916

Согласно его общему рабочему процессу, поскольку это видео в основном похоже на видео Кука, требуется лишь модифицировать три исходных изображения и внести некоторые незначительные корректировки. Например, то, что он достает из кармана, — это игровая приставка Game Boy, и есть другие элементы, которые лучше подходят персонажу: у Кука золотой зуб с выгравированным на нем биржевым кодом Apple AAPL, а председатель Федеральной резервной системы Пауэлл носит золотое кольцо с логотипом ФРС.

▲Адрес проекта: https://github.com/shrimply/node-banana

В настоящее время он разместил этот проект на известной платформе с открытым исходным кодом GitHub. Если вы хотите поэкспериментировать самостоятельно, вы можете загрузить проект на свой локальный компьютер, ввести собственный API Gemini и напрямую применить этот процесс.

Мы также протестировали этот автоматизированный проект и сгенерировали несколько изображений. По сравнению с генерацией изображений на веб-сайте или в приложении Gemini, это определенно намного удобнее. Нам не нужно повторно загружать изображения; вместо этого мы можем напрямую выбрать нужные изображения и изменить подсказки, что значительно упрощает весь процесс.

Однако, если у вас нет API, это не проблема. Следуйте нашим подробным инструкциям ниже, и вы сможете сделать то же самое, используя веб-версию Gemini.

Найдите свою фотографию, любимую модную одежду и стильные очки. Возьмем в качестве примера Линь Дайюй, женщину исключительного таланта, сдержанного характера и меланхоличного темперамента, и посмотрим, как бы выглядела ее фотосессия в стиле «образ дня» (OOTD).

Здесь мы напрямую сгенерировали фотографию Линь Дайю с помощью программы Nano Banana Pro.

▲Ключевое слово: Тема: Гиперреалистичный портрет Линь Дайюй из «Сна в красном тереме», выполненный в стиле высокой моды. У нее хрупкая, меланхоличная красота, бледная кожа и ее фирменные «нахмуренные брови» (слегка нахмуренные). Она выглядит явно печальной и интеллектуальной. Одежда: Изысканный, высококлассный традиционный наряд эпохи Цин (стиль ханьфу). Ткань представляет собой многослойный полупрозрачный шелк и органзу бледно-бамбуково-зеленого и лунно-белого цвета. Замысловатая вышивка в виде падающих лепестков. На голове нефритовая заколка. Место действия: Современная минималистичная профессиональная фотостудия. Фон из плотного темно-серого или фактурного холста. Освещение и камера: Кинематографическое студийное освещение, освещение в стиле Рембрандта для подчеркивания скул и настроения. Софтбокс, резкая фокусировка, съемка на Hasselblad X2D, объектив 85 мм. Большая глубина резкости. Стиль: редакционная статья Vogue China, неземной, элегантный, печальный, восточная эстетика, авангардная фэшн-фотография, ультрадетализированная текстура. 16:9, 4K.

После получения фотографии персонажа, изображения очков и куртки являются необязательными. Если они не загружены, Nano Banana Pro автоматически сгенерирует соответствующую модную куртку и очки.

Мы нашли для неё в интернете модную куртку, а затем добавили к стандартным подсказкам причёску, макияж и презрительное выражение лица, свысока смотрящее на эти обыденные вещи.

Ключевое слово по умолчанию: Покажите мне фотографию с модной фотосессии, на которой модель одета в объемную куртку и очки. На фотографии должен быть изображен силуэт модели в полный рост. Модель смотрит в сторону камеры, выражение ее лица слегка скучающее, брови приподняты. Одна рука поднята, два пальца постукивают по краю очков.
Изображение сделано с низкого ракурса, с видом снизу вверх на объект.
Снимок сделан на пленку Fuji Velvia с помощью объектива 55 мм с жесткой вспышкой; свет сконцентрирован на объекте и слегка размывается к краям кадра. Изображение переэкспонировано, на нем видна значительная зернистость пленки и перенасыщенность цветов. Кожа выглядит блестящей (почти жирной), а на оправе очков видны резкие белые блики.

Следующий шаг — создание так называемого контактного листа. Введя полученную ранее фотографию куртки и очков, а затем введя следующие подсказки, мы можем получить многоракурсную раскадровку с последовательными кадрами персонажей.

Ключевые слова:
Проанализируйте входное изображение и незаметно составьте список всех важных для моды деталей: объект(ы), конкретные предметы гардероба, материалы, цвета, текстуры, аксессуары, прическа, макияж, пропорции тела, окружение, геометрия декораций, направление света и качество теней.
Вся одежда, стиль, прическа, макияж, освещение, обстановка и цветокоррекция должны оставаться на 100% неизменными во всех кадрах.
Ничего не добавляйте и не удаляйте.
Не следует переосмысливать материалы или цвета.
Не следует выводить никаких обоснований.

Результатом вашей работы должно быть следующее:

Одно изображение на контактном листе размером 2×3 (6 кадров).

Затем следует разбивка по ключевым кадрам для каждого кадра.

Каждый кадр должен представлять собой точку покоя после резкого движения камеры — описывайте только конечное положение камеры и действия объекта, но никогда не само движение.

Шесть кадров должны быть пространственно динамичными, нелинейными и визуально различимыми.

Необходимый список из 6 кадров
1. Высококлассный портрет в стиле высокой моды (крупный план, редакционная съемка, интимная съемка)

Камера расположена очень близко к лицу объекта съемки, чуть выше или чуть ниже уровня глаз, с использованием элегантного смещенного ракурса, который подчеркивает структуру костей и выделяет ключевые элементы одежды в области декольте. Небольшая глубина резкости, безупречная передача текстур и скульптурная, модная композиция.

2. Кадр с высоким углом обзора (три четверти кадра)

Камера расположена сверху, но смещена от центра, и снимает объект под углом, направленным вниз по диагонали.
Эта рама должна создавать четкую абстракцию форм и раскрывать детали гардероба сверху.

3. Кадрирование всего тела под низким углом (косой ракурс).

Камера расположена низко над землей и направлена ​​под углом к ​​объекту съемки.
Это визуально удлиняет силуэт, подчеркивает обувь и создает эффектную перспективу, отличающуюся от кадров 1 и 2.

4. Боковая компрессионная рамка (для длиннофокусных объективов)

Камера расположена далеко сбоку от объекта, а для сжатия пространства используется более узкое фокусное расстояние.
На снимке изображен человек в профиль или почти в профиль, структура одежды представлена ​​в упрощенном, редакционном стиле.

5. Интимный портрет крупным планом с неожиданной высоты.

Камера расположена очень близко к лицу (или верхней части туловища) объекта съемки, но немного выше или ниже уровня глаз.
Ракурс должен напоминать модную фотосессию, а не быть традиционным — он должен быть смещенным, элегантным и выразительным.

6. Сверхдетализация кадра с непривычного ракурса.

Камера расположена очень близко к детали одежды, аксессуару или текстуре, но с необычного пространственного ракурса (например, снизу, сзади, сбоку от выреза горловины).
Это должен быть эффектный, абстрактный, детальный кадр для редакционного материала.

Требования к непрерывности и техническим характеристикам

Поддерживайте безупречный стиль в каждом кадре: точный тип одежды, силуэт, материал, цвет, текстура, швы, аксессуары, застежки, украшения, обувь, прическа и макияж.

Окружение, текстуры и освещение должны оставаться неизменными.

Глубина резкости естественным образом изменяется в зависимости от фокусного расстояния (большая для дальних планов, малая для крупных планов/детальных снимков).

Требуются фотореалистичные текстуры и физически правдоподобное поведение света.

Кадры должны восприниматься как разные положения камеры в одной и той же сцене, а не как разные сцены.

Все ключевые кадры должны иметь одинаковое соотношение сторон, и должно быть получено ровно 6 ключевых кадров. Сохраняйте точный визуальный стиль во всех ключевых кадрах: изображение снято на пленку Fuji Velvia с использованием жесткой вспышки, свет сконцентрирован на объекте и слегка разбавлен к краям кадра. Изображение переэкспонировано, демонстрируя значительную зернистость пленки и перенасыщенность. Кожа выглядит блестящей (почти жирной), а на оправе очков присутствуют резкие белые блики.

Формат вывода
A) Изображение на контактном листе 2×3 (обязательно)

После получения сетки из шести квадратов изображений нам необходимо использовать следующие подсказки для последовательного извлечения этих шести изображений.

Задание: Просмотрите сетку из шести изображений. Выделите и увеличьте изображение в первом/втором/третьем столбце первого/второго ряда изображений. Не меняйте позу или какие-либо детали модели. Выведите только одно изображение из сетки из шести изображений.

Nano Banana Pro способен напрямую генерировать изображения с девятью ячейками сетки, но для поддержания фиксированного соотношения сторон 3:2 лучше использовать шестиячейковую компоновку. Здесь мы используем размер 16:9 и качество 4K для всех изображений.

С помощью этих 6 изображений мы можем дать волю своему творчеству и создать еще больше ключевых кадров, например, показать Куку его золотые зубы или достать из кармана старое устройство, как в оригинальном видео.

Например, мы нашли в интернете фотографию браслета и попросили Линь Дайюй продемонстрировать свой нефритовый браслет вместо больших золотых часов.

▲Рисунок 7 | Ввод: Рисунок 3 + Рисунок 5 + Фотография нефритового браслета и подсказка: Покажите мне крупный план модели с широким углом обзора. Модель держит одно запястье вертикально перед собой, а другой рукой осторожно опускает объемный рукав своего платья, демонстрируя полупрозрачный нефритовый браслет. На руке, опускающей рукав, на последних двух пальцах руки вставлено серебряное модное кольцо в форме опавшего лепестка цветка.

Если вы хотите сохранить этот стиль уличного гангстера, вы можете напрямую использовать стандартную подсказку, чтобы найти изображение больших золотых часов, а затем ввести следующий текст.

Ключевое слово по умолчанию: Покажите мне крупный план модели крупным планом. Модель держит одну руку вертикально перед собой, а другой рукой оттягивает рукав толстовки, чтобы показать часы. На руке, оттягивающей рукав, на последних двух пальцах кольца с буквами «LOVE», выгравированными на лицевой стороне.

Кроме того, обувь была заменена на модные высокие кеды с вышивкой, украшенные атласной и цветочной вышивкой, напоминающей старинную вышитую обувь, с толстой, рифленой черной резиновой подошвой.

▲Рисунок 8 | Добавьте к изображению 7 + изображение 3 + фотографии обуви, подсказка: Покажите мне широкоугольный снимок модели, стоящей с высоты птичьего полета. Ее правая нога вытянута вперед, показывая, что на ней обувь с эталонного изображения. Сохраните идеальную композицию, включите кольцо на пальце модели и слегка поверните ее ногу в сторону, чтобы подчеркнуть детали обуви.

Наконец, она вытащила из кармана коробочку с питательными таблетками женьшеня. Это была девушка в стиле киберпанк, которая полагалась на лекарства, чтобы поддерживать свою жизнь.

▲Рисунок 9 | Добавьте Рисунок 7 + Рисунок 8 + фотографию коробки с лекарствами. Задание: Крупный план модели, тянущейся к боковой части кармана-кенгуру толстовки, частично показывающий коробку с таблетками.

Здесь вам нужно лишь изменить строку "показать коробку с таблетками", заменив содержимое после "показать" на предметы, которые вы хотите достать из кармана.

Получив все ключевые кадры, следующим шагом будет их объединение для создания эффектного видеоролика, снятого одним кадром. Преобразование изображений в видео не полностью исключает необходимость в подсказках. Для достижения того же ритма и контроля, что и в оригинальном видео, крайне важно использовать плавные движения и минимизировать перемещения модели, чтобы уменьшить количество подсказок.

Блогер упомянул, что можно вводить подсказки, например: «Камера медленно и плавно вращается вокруг очков, увеличивая изображение. Объект практически неподвижен, а движение чрезвычайно спокойное и целенаправленное».

Например, при переходе между рисунком 8 и рисунком 9 мы добавили к подсказкам текст «Ноги медленно опускаются, а камера поднимается вертикально».

▲Сгенерировано Google Veo 3.1 | Подсказка: Движение камеры (вертикальное сканирование):
Непрерывный, бесшовный вертикальный кадр, снятый с помощью крана вверх. Камера начинает движение низко, фокусируясь крупным планом на вышитых высоких кроссовках, затем плавно поднимается вверх и скользит вдоль текстуры серых брюк-карго. Поднимаясь до уровня пояса, камера приближается (приводит камеру к зеленому атласному жакету).
Действие субъекта (поток):
Начало: Нога модели (с видимой обувью) медленно опускается в положение стоя по мере того, как камера поднимается вверх.
Переход: Человек уверенно стоит. Рука с кольцом в виде бабочки естественно опускается в карман.
В конце: рука вытаскивает желто-белую аптечку («Жэньшэнь Янжун Вань»). Фокус резко переключается на текст на аптечке.
Атмосфера и стабильность:
Эстетика высокой моды в стиле стритвеар. Жесткое освещение со вспышкой на синем студийном фоне. Строгое соблюдение единообразия вышивки на зеленой куртке сукаджан и нефритового браслета. Переход плавный, как единое, спланированное движение камеры.

Возможно, вы задаетесь вопросом, почему в подсказках было указано двигаться медленно, но финальное видео действительно выглядит четким и качественным. На самом деле, это потому, что этот видеоблогер использовал другой инструмент. Нельзя не восхититься креативностью и возможностями современных видеоблогеров, использующих искусственный интеллект; у них не только отличные идеи, но и полезные инструменты.

▲Адрес: https://easypeasyease.vercel.app/, этот инструмент позволяет объединять несколько видео, применять кривые сглаживания и добавлять звук; в настоящее время он бесплатен.

С помощью инструмента EasyPeaseEase наши видео можно сжать до длительности от 0,5 до 6 секунд. Замедленное движение, ранее полученное с помощью моделей генерации видео, сглаживается кривой сглаживания, что делает процесс ускорения или замедления видео от начала до конца более плавным и естественным, а также лучше имитирует физические эффекты реального мира. В результате ускоренное видео выглядит более ярким и насыщенным, а не представляет собой жесткое, равномерное движение.

В итоге, объединив все эти видеоролики, мы получаем видеопрезентацию образа дня от Линь Дайюй на сегодня.

Предложение преобразовать первый и последний кадры в видео очень полезно. Если вас беспокоит необходимость часто тянуть карты, то простой способ — загрузить изображения первого и последнего кадра и обратиться к Близнецам.

Функция «Контактный лист» — это действительно очень интересная особенность Nano Banana Pro. Во-первых, она использует мощные возможности Nano Banana Pro по генерации изображений и пониманию окружающего мира для создания сетки из девяти квадратов ключевых кадров видео, а затем извлекает соответствующие ключевые кадры построчно и столбцово.

▲Источник видео: https://x.com/techhalla/status/1996650389228355819

В заключение, давайте подведем итоги официальных способов использования Nano Banana Pro.

  • ai.studio: Официальная студия искусственного интеллекта от Google. Для использования требуется привязка способа оплаты, а также возможность выбора различных разрешений и размеров изображений через выпадающее меню. За использование не взимается плата и не требуется никаких запросов.
  • gemini.google.com: Веб-версия и мобильное приложение Gemini, бесплатное для генерации изображений, с ограничением по количеству использований. После достижения лимита автоматически будет использоваться модель Nano Banana. Главная особенность заключается в том, что вы больше не можете контролировать соотношение сторон генерируемых изображений.
  • flow.google: платформа Google для создания видео, позволяющая генерировать изображения без использования кредитов; она бесплатна.

Видео, упомянутое в статье, можно посмотреть, перейдя по этой ссылке: https://mp.weixin.qq.com/s/s_EIYB0qqcWv29zMM1g-7Q

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете быстро найти еще больше интересного контента.

ifanr | Оригинальная ссылка · Посмотреть комментарии · Sina Weibo