Аватар Близнецы позволяет появляться в контенте, созданном с помощью ИИ, без необходимости снимать себя на видео.
Функции аватара в Gemini вскоре позволят вам вставлять цифровую версию себя в изображения и видео, сгенерированные ИИ, без необходимости брать в руки камеру. В недавней сборке приложения Google показаны инструменты, которые сканируют ваше лицо и превращают его в многоразовую 3D-модель внутри Gemini, как показано в обзоре APK-файла от Android Authority.
Эта концепция основана на более ранней системе Likeness из Android XR , которая создавала реалистичный заменитель для видеозвонков. Теперь она выходит за рамки гарнитур. Аналогичный подход используется в Gemini, и есть признаки того, что он может работать на телефонах и настольных браузерах.
Вместо того чтобы каждый раз делать новое селфи, вы можете создать одну постоянную версию своего изображения и использовать её в разных проектах. Такой подход ускоряет процесс, а также помогает поддерживать единообразие внешнего вида, если вы часто создаёте контент.
Apple уже предлагает Memoji — стилизованную версию вас для сообщений и FaceTime. Версия Google выглядит более реалистичной и предназначена для работы непосредственно в инструментах генерации контента, а не только в качестве функции общения.
Как работает аватар Близнецов
Система, по всей видимости, основана на простом процессе захвата изображения. Вы записываете короткое видео своего лица, и приложение преобразует его в 3D-модель. Она работает по тому же принципу, что и Likeness, только без необходимости использования гарнитуры.
Подсказки на экране помогут вам правильно выбрать ракурс лица и запечатлеть достаточно деталей. После завершения модель сохраняется в вашей учетной записи и привязывается к вашей личности во всех функциях Gemini.
Одна из важных деталей — это способ настройки. Процесс создания выглядит как веб-ориентированный, что говорит о том, что вы, возможно, не ограничены только телефоном. Вариант для настольных компьютеров упростил бы процесс и подтвердил бы, что он предназначен для работы на разных устройствах.
Больше, чем просто Memoji от Apple.
Memoji фокусируются на выразительности и простоте, используя мультяшный стиль, подходящий для обмена сообщениями и видеозвонков. Подход Google направлен на более реалистичный результат, который органично вписывается в сгенерированные визуальные образы.
Вместо того чтобы отправлять анимированное лицо, вы можете поместить реалистичную версию себя в сцены, сгенерированные ИИ. В этой версии есть намеки на подсказки, позволяющие вставлять себя непосредственно в контент, что указывает на более глубокую интеграцию с творческими инструментами Gemini.
Это меняет подход к творчеству. Вместо того чтобы каждый раз делать новые снимки, вы работаете с многоразовым ресурсом, который можно использовать в различных сценариях.
Здесь есть компромисс. Более реалистичное сканирование вызывает вопросы о точности и конфиденциальности, и Google не предоставил подробностей о том, как будут решаться эти проблемы.
Что ожидать дальше
Эта функция всё ещё находится в разработке и ещё не выпущена в рабочем виде. Она появилась в результате анализа приложения, поэтому финальная версия может измениться или вообще не выйти.
Тем не менее, направление становится все яснее. Переход от прежних названий, таких как Character, к Avatar указывает на более широкую систему идентичности, связанную с Gemini. В сочетании с поддержкой разных устройств это выглядит не просто как эксперимент в области XR.
Если он будет запущен, скорее всего, сначала появится в инструментах для творчества Gemini, где быстрое встраивание себя в визуальные образы будет наиболее ценным. Сроки и подтвержденная доступность пока неизвестны, поэтому это лишь предварительный обзор того, в каком направлении будут развиваться инструменты искусственного интеллекта Google.