Только что появилась резервная копия Spotify объемом 300 ТБ, которую вы можете получить уже сегодня.
Популярный архивный сервис сообщает о публикации резервной копии Spotify в виде торрент-файлов общим объемом 300 ТБ, или примерно 86 миллионов музыкальных файлов, сгруппированных по популярности. Если вы ожидаете получить чистую, полную копию каталога Spotify, которую можно скачать одним разом, то сегодня это не то, что доступно.
В режиме реального времени доступны данные каталога: базы данных SQLite, которые, по словам группы, содержат крупнейшую общедоступную базу данных метаданных музыки, охватывающую 256 миллионов треков и 186 миллионов уникальных ISRC-кодов.
В Anna's Archive заявляют, что обычно фокусируются на текстовом контенте, поскольку он довольно объёмный, но их миссия — сохранение знаний и культуры в различных медиаформатах. Они также утверждают, что нашли способ масштабно собирать данные со Spotify и рассматривают это как начало создания музыкального архива, ориентированного на сохранение контента. Если этот архив слишком сложен, возможно, вам подойдёт собственная функция офлайн-доступа Spotify.
Что включает в себя релиз базы данных
В своей статье группа утверждает, что музыка уже достаточно хорошо сохранилась, но указывает на три пробела: длинный «хвост» (недостаток записей), который сохраняется только тогда, когда кому-то это действительно важно (а торренты могут быть плохо раздаваемы), склонность аудиофилов к огромным файлам без потерь качества , из-за которой сложно сохранить «всё», и отсутствие авторитетного списка торрентов, предназначенного для представления всей записанной музыки.
Представленный ими дамп метаданных Spotify позиционируется как решение проблемы. Утверждается, что метаданные охватывают около 99,9% исполнителей, альбомов и треков, при этом основной набор данных об исполнителях, альбомах и треках в сжатом виде занимает менее 200 ГБ, а отдельный набор данных для анализа аудио, по заявлению производителя, составляет 4 ТБ в сжатом виде.
Аудиофайлы поступают партиями.
Аудиоконтент — это то, что больше всего интересует многих читателей, и именно его внедрение еще продолжается. Anna's Archive утверждает, что в архиве хранится около 86 миллионов музыкальных файлов, что составляет примерно 99,6% всех прослушиваний, но эти файлы планируется выпускать в порядке популярности, а не по одному.
В сообщении также указываются решения, касающиеся качества. При популярности больше 0 говорится, что воспроизведение осуществлялось в формате OGG Vorbis со скоростью 160 кбит/с без перекодирования. При популярности, равной 0, говорится, что воспроизведение было перекодировано в OGG Opus со скоростью 75 кбит/с, и отмечается ошибка в тегах ReplayGain, затрагивающая многие файлы.
Что посмотреть дальше
Группа указывает крайний срок — июль 2025 года, то есть релизы, вышедшие после июля 2025 года, могут отсутствовать. Также изложены следующие шаги: сначала музыкальные файлы, затем дополнительные метаданные (пути и контрольные суммы), затем обложки альбомов и файлы патчей, предназначенные для восстановления оригиналов. Практический вывод таков: на данный момент это резервная копия только с метаданными, аудиофайлы будут добавлены позже.
Статья " Появилась резервная копия Spotify объемом 300 ТБ: что вы можете получить уже сегодня" впервые появилась на сайте Digital Trends .