Искусственный интеллект Gemini от Google теперь может обрабатывать и озвучивать аудиофайлы
Искусственный интеллект Gemini от Google является многомодальным, то есть он может обрабатывать и генерировать файлы в различных форматах, от текста и изображений до видео . Хотя он умеет генерировать аудио, до сих пор ему не хватало возможностей обрабатывать аудиофайлы, загружаемые пользователями. Наконец, ситуация изменилась: теперь Gemini позволяет передавать аудиофайлы и обсуждать их.
В чем главное изменение?
Возможность загрузки аудиофайлов теперь доступна как в мобильном приложении Gemini, так и в веб-версии. В чате Gemini нажмите на значок «+» и загрузите аудиоклип, выбрав значок загрузки файла в виде клипа. Кстати, эта функция бесплатна для всех пользователей Gemini.
Согласно странице поддержки Google, можно загружать аудиоклипы длительностью до десяти минут. Однако, если вы оплатите пакеты Gemini AI Pro или Ultra, вы сможете загружать аудиофайлы длительностью до 3 часов.
Если вам интересно, какие еще форматы файлов можно передавать в Gemini, вот краткий список:
- До 10 файлов за один раз, включая ZIP-файлы.
- Размер видео — до 2 ГБ. Продолжительность — 5 минут для бесплатных пользователей и 1 час для платных клиентов.
- Одна папка с кодом или один репозиторий GitHub (до 5000 файлов / размером 100 МБ)
Находка для библиофилов
Не всем нравится копаться в аудиокнигах, подкастах или записях лекций. Иногда настоящая магия творится именно в стенах текста, или именно там находится зона когнитивного комфорта. Если вы относите себя к тем, кто ищет освобождения от звуков, это обновление функций Gemini — настоящая находка. И да, поддержка аудио выходит за рамки английского языка, как вы можете видеть в посте ниже.
Теперь, будь то краткое изложение длинной лекции или необходимость выделить несколько конкретных тезисов из подкаста, Gemini обработает аудио и предоставит вам именно то, что нужно. Вы можете поручить ему подготовить длинные отчёты, краткие обзоры или даже преобразовать его в слайды с информацией, которые можно экспортировать в виде изображений.
С другой стороны, у нас есть замечательный инструмент NotebookLM . Он может превратить ваши длинные текстовые файлы в увлекательный аудиоподкаст для двух человек. Если вы предпочитаете видеообзоры, он также может это сделать. А заодно воспользуйтесь бесплатным предложением Gemini AI Pro от Google для студентов во многих странах, включая США.