Запуск моего первого подкаста, созданного с помощью искусственного интеллекта NotebookLM, научил меня одной вещи, которой следует избегать.

Всё началось с шутки. «А что, если я создам подкаст, где буду разговаривать с ботами с искусственным интеллектом и притворяться, что мне интересно то, что они говорят?» — спросил я своего друга.

Это было несколько месяцев назад, до того, как я узнал, что у Google есть инструмент на основе искусственного интеллекта под названием NotebookLM , который (по большей части) позволяет общаться с двумя ведущими, говорящими с человеческим голосом, в режиме реального времени. В интерактивном режиме вы можете присоединиться к подкасту и задать вопрос в любое время . Боты поставят подкаст на паузу, распознают вас как «слушателя» и затем прокомментируют ваш ответ.

Я решил протестировать NotebookLM, чтобы создать настоящий подкаст, запустив его через Spotify для создателей контента, а затем продвигая в своих социальных сетях. В процессе я многому научился, но конечный результат показал многое о том, что нужно для создания подкаста. Чего следует избегать? Создания слишком роботизированного, бездушного подкаста. Вот как мне удалось всё это реализовать.

Запись в интерактивном режиме

Сначала я этого не понял, но NotebookLM на самом деле не записывает ваши взаимодействия с роботами-ведущими. Поскольку приложение (доступно для мобильных устройств, но может работать и в браузере) находится в бета-версии, хорошей документации или даже инструкций по его использованию не так много. Вместо того чтобы полагаться на NotebookLM для записи интерактивных разговоров, я использовал приложение «Голосовые заметки» на iPhone. Хотя настоящий подкастер посмеялся бы над низким качеством, это было быстро и легко.

Для начала нужно выбрать источник для обсуждения. Я решил создать подкаст «Происхождение с Джоном Брэндоном» — немного ироничный подкаст о том, как появились обычные вещи. Первый эпизод должен был быть посвящен появлению пузырчатой ​​пленки, поэтому я сначала нашел несколько статей на эту тему и загрузил их в NotebookLM. Это обучающие данные, которые используют «ведущие», поскольку обычно они общаются только друг с другом, но я не хотел, чтобы они просто начали импровизировать на эту тему. Вместо этого я сразу же вмешался и представился как настоящий ведущий.

Как вы можете себе представить, Google не совсем так это задумывал. Боты отреагировали удивленно и даже отметили, что я не являюсь ведущим (упомянув меня по имени), и настаивали, что это настоящие люди-ведущие. Я задал несколько вопросов о пузырчатой ​​пленке, но в итоге разговор перерос в дискуссию о сознании и осознанности ИИ. Мне показалось, что это гораздо более интересная тема, поэтому мой подкаст приобрел более сатирический оттенок, похожий на The Onion. Другими словами, хотя он должен был быть о пузырчатой ​​пленке, он стал больше о ИИ.

Я остался доволен результатами, даже несмотря на то, что качество записи не было выдающимся. Я представлял, как было бы лучше, если бы я записывал обсуждение в прямом эфире отдельным цифровым диктофоном, но я не стремился к каким-либо наградам в сфере подкастинга. Я хотел опубликовать свой первый эпизод, и NoteBookLM меня впечатлил, по крайней мере, в плане создания связного обсуждения. Было также здорово, как боты реагировали на мои комментарии в режиме реального времени.

Создание активов

Конечно, подкаст — это больше, чем просто аудиофайл, который вы публикуете. Он также включает в себя оформление подкаста, заставку, озвучку и другие элементы.

Получив запись первого эпизода, я обратился к Google Gemini, чтобы создать квадратную картинку, которую можно было бы использовать для подкаста. У каждого подкаста есть картинка, которая помогает пользователям идентифицировать подкаст в таких приложениях, как Apple Podcasts. Моя задача была проста: создать квадратное изображение для подкаста под названием «Origins with John Brandon» . Я также предоставил изображение себя, созданное с помощью ИИ. С первой попытки Gemini создал исключительно хорошую картинку, похожую на работу профессионала. Однако мне не понравилось, что мое изображение связано с ней, поэтому я попросил бота попробовать еще раз. Результат выглядел немного банально, но вполне приемлемо.

Я приступил к работе. Затем я использовал Suno для создания заставки для своего нового подкаста. Этот инструмент генерации звука на основе ИИ обычно использует подсказки типа: «Создайте новую песню, которая звучит как смесь Coldplay и Nirvana» . Вместо этого моя подсказка больше походила на создание заставки для подкаста с синтезаторами и ударными, чтобы добавить энергии и азарта перед началом разговора.

Как и в моей первой попытке с Gemini, Suno сразу же выдала отличную музыкальную заставку. Мне не пришлось пробовать больше подсказок, но я хотел доработать вступление с помощью озвучки. Я обратился к Speechify, которая может взять любой предоставленный вами текст и создать озвучку. Затем я использовал ChatGPT, чтобы объединить музыку из заставки с озвучкой в ​​качестве наложения. Честно говоря, я не знал, что ChatGPT позволяет создавать аудиофайлы.

Через несколько минут у меня уже была вступительная музыка в виде заставки с голосовым сопровождением. Я даже подкорректировал плавный переход между вступлением и началом голосового сопровождения, а затем настроил его на затухание. Я попросил ChatGPT добавить аудио для моего первого эпизода подкаста, и он сгенерировал один итоговый аудиофайл, который я загрузил на Spotify.

Чего следует избегать?

Я был впечатлен результатами и тем, как все получилось , но, пожалуй, я слишком полагался на ИИ в своем новом подкасте. Заставка выглядела немного неестественно и бездушно, особенно учитывая, что изображение заставки было сгенерировано ИИ. В самом аудио NotebookLM есть немного больше человечности и души, в основном потому, что я разговариваю с ботами, но в итоге эпизод звучал как разговор человека с чат-ботами, а это верный путь к катастрофе. Люди слушают подкасты, чтобы узнать что-то новое, а также потому, что говорящие люди близки, интересны и реальны. По крайней мере, это мотивировало меня создать настоящий подкаст без участия ботов на ту же тему.

Мой главный урок был связан с NotebookLM. Это хороший экспериментальный инструмент, который помог мне понять, как создавать и запускать подкасты. Однако это всего лишь лабораторный эксперимент. «Ведущие» повторяют одну и ту же аудиоерунду снова и снова, особенно когда я присоединяюсь к их разговору. После того, как вы несколько раз услышите, как они говорят: «О, у нас есть слушатель, который хочет оставить комментарий», вы начинаете подозревать, что это всё компьютерная афера. Они используют одни и те же голосовые тики и странные звуковые особенности снова и снова, до такой степени, что это становится почти невыносимо и раздражающе.

Короче говоря, это скучно. Я бы не хотел оставлять этот подкаст в сети, и он в основном показывает, что общение ботов таким образом не удержит ничьего внимания. Это почти как смотреть, как два компьютера играют в видеоигру. Единственное, чего следует избегать в любом подкасте, — это чрезмерной зависимости от ИИ, которая исключает из уравнения всякое человеческое участие.

В процессе развития ИИ нам, возможно, придётся решить, является ли такой исход нежелательным.

Статья " Запуск моего первого подкаста, созданного с помощью ИИ на NotebookLM, научил меня одной вещи, которой следует избегать" впервые появилась на сайте Digital Trends .