Spotify отреагировал на «гнусное» хищение 300 ТБ данных интернет-активистами.

Популярный архивный сервис утверждает, что опубликовал резервную копию Spotify в виде торрентов общим объемом 300 ТБ, или примерно 86 миллионов музыкальных файлов, — и Spotify подтвердил факт утечки.

Группа, называющая себя «Архив Анны», утверждает, что располагает базами данных SQLite, содержащими крупнейшую общедоступную базу данных музыкальных метаданных, охватывающую 256 миллионов треков и 186 миллионов уникальных ISRC-кодов.

В Anna's Archive заявляют, что обычно фокусируются на текстовом контенте, поскольку он довольно объёмный, но их миссия — сохранение знаний и культуры в различных медиаформатах. Они также утверждают, что нашли способ масштабно собирать данные со Spotify и рассматривают это как начало создания музыкального архива, ориентированного на сохранение контента.

Spotify отреагировал, направив Billboard следующее заявление: «Spotify выявил и заблокировал злонамеренные учетные записи пользователей, занимавшихся незаконным сбором данных. Мы внедрили новые меры защиты от подобных атак на авторские права и активно отслеживаем подозрительное поведение».

«С самого первого дня мы поддерживаем сообщество художников в борьбе с пиратством и активно сотрудничаем с нашими партнерами по индустрии для защиты создателей и отстаивания их прав».

Что включает в себя релиз базы данных

В своей статье группа утверждает, что музыка уже достаточно хорошо сохранилась, но указывает на три пробела: длинный «хвост» (недостаток записей), который сохраняется только тогда, когда кому-то это действительно важно (а торренты могут быть плохо раздаваемы), склонность аудиофилов к огромным файлам без потерь качества , из-за которой сложно сохранить «всё», и отсутствие авторитетного списка торрентов, предназначенного для представления всей записанной музыки.

Представленный ими дамп метаданных Spotify позиционируется как решение проблемы. Утверждается, что метаданные охватывают около 99,9% исполнителей, альбомов и треков, при этом основной набор данных об исполнителях, альбомах и треках в сжатом виде занимает менее 200 ГБ, а отдельный набор данных для анализа аудио, по заявлению производителя, составляет 4 ТБ в сжатом виде.

Согласно информации в блоге, Anna's Archive утверждает, что в архиве хранится около 86 миллионов музыкальных файлов, что составляет примерно 99,6% всех прослушиваний, но компания планирует выпускать эти файлы в порядке популярности, а не по одному файлу за раз.

Практический вывод таков: на данный момент это резервная копия только метаданных, аудиофайлы появятся позже. Но, учитывая довольно подробные обещания группы о дальнейших шагах, еще предстоит увидеть, как и сможет ли Spotify остановить эти усилия.

Статья "Spotify отвечает на 'гнусное' хищение 300 ТБ данных интернет-активистами" впервые появилась на сайте Digital Trends .