В Google Gemini добавлена ​​Lyria 3, модель искусственного интеллекта, способная создавать музыку из слов и фотографий.

Google в очередной раз расширяет мультимодальные возможности Gemini. После успеха вирусного генератора изображений Nano Banana компания выпускает Lyria 3, модель искусственного интеллекта, способную генерировать музыку. Google утверждает, что вы можете начать с описания того, какую музыку хотите сгенерировать, и модель выполнит вашу задачу.

В качестве альтернативы вы можете загрузить изображение или даже видео, и Lyria 3 сгенерирует «высококачественный трек» с пользовательскими текстами. «От забавных джинглов до лоу-фай битов — вы можете создавать собственные 30-секундные саундтреки для любого момента», — заявляет компания. Lyria 3 уже внедряется в настольную версию Gemini, доступную через веб-браузер. В ближайшие дни она также будет доступна в мобильном приложении Gemini для пользователей по всему миру.

Что означает число 3 в Лирии в Близнецах?

Приложение Lyria разработано подразделением DeepMind компании Google, которое находится на переднем крае развития искусственного интеллекта для передовых инноваций и исследований, таких как использование Gemini 3 Deep Think для преобразования эскизов и идей в файлы для 3D-печати. ​​DeepMind также стоит за технологией SynthID, которая наносит невидимый водяной знак на медиафайлы, созданные инструментами ИИ.

С помощью Lyria 3 Google погружается в забавную и противоречивую сторону использования ИИ. Идея довольно проста. Вы можете выбрать любую тему, идею, жанр или настроение, и Gemini создаст для вас 30-секундный фрагмент. Все, что вам нужно сделать, это щелкнуть по значку выбора инструмента в окне чата Gemini и выбрать опцию создания новой музыки.

Как это работает?

Подобно созданию изображений или видеороликов с помощью движка Google Veo , Lyria 3 возьмет ваши слова, изображения или видео и создаст подходящую мелодию. Если у вас заканчиваются креативные идеи, есть множество шаблонов, где вы можете выбрать существующий трек и изменить его, используя подсказки. Это чем-то похоже на доработку Gemini Gems или ремикширование мини-приложений, созданных в экосистеме Nothing Playground.

Если вам интересно, использование Lyria 3 в Gemini бесплатно. Я могу представить, как многие люди будут делиться своими фотографиями и видео, чтобы создать подходящую фоновую музыку для публикации в социальных сетях. Google не будет первой компанией, предложившей такое удобство. Suno — крупнейший игрок в сегменте генерации музыки с помощью ИИ, и он неоднократно оказывался в центре скандалов из-за предполагаемого нарушения авторских прав.

Статья "Google Gemini добавляет Lyria 3, модель искусственного интеллекта, способную создавать музыку из слов и фотографий" впервые появилась на сайте Digital Trends .