Spotify saccheggiato da attivisti pirata, su torrent finisce il 99% del catalogo

Anna’s Archive pubblica milioni di file audio e metadati della piattaforma di streaming Spotify per la conservazione digitale di tutti i brani

Foto di Giorgia Bonamoneta

Giorgia Bonamoneta

Giornalista

Nata ad Anzio, dopo la laurea in Editoria e Scrittura e un periodo in Belgio, ha iniziato a scrivere di attualità, geopolitica, lavoro e giovani.

Pubblicato:

Sono stati liberati circa 300 TB di dati musicali da Spotify. A farlo è stato il progetto Anna’s Archive, già impegnato nella salvaguardia di libri e documenti digitali per costruire un archivio aperto a tutti. Ora il progetto si allarga alla musica e arriva a creare un archivio di file audio, metà dati strutturati a livello di artisti, album e tracce, ora disponibile tramite torrent.

Spotify indaga sul data breach, accusando l’archivio di aver utilizzato tattiche illecite, da pirati informatici, per accedere ai file audio della piattaforma. Da parte di Anna’s Archive si tratta invece di un’azione di contestazione. La maggior parte dei collezionisti e dei progetti di digitalizzazione partono già dalle tracce più popolari, lasciando indietro i brani poco ascoltati o di nicchia. Il materiale è comunque tantissimo e sarà pubblicato in più momenti attraverso una pagina dedicata ai torrent.

Data breach dei dati e del catalogo di Spotify

Lunedì è avvenuta una violazione da parte di alcuni utenti, poi ricondotti al motore di ricerca open source Anna’s Archive, del catalogo di Spotify. La piattaforma di streaming musicale ha confermato lo scraping della sua libreria.

A confermare l’entità dei dati “raschiati”, per utilizzare il termine inglese, è proprio Anna’s Archive, che parla di metadati pari a 256 milioni di brani e di 86 milioni di file audio, pari a circa il 99,6% degli ascolti della piattaforma.

Il file comprende la musica caricata sulla piattaforma tra il 2007 e il 2025. Spotify, invece, non ha specificato la quantità dei dati, ma gli hacker parlano di poco meno di 300 TB in totale.

Questi saranno distribuiti tramite reti peer-to-peer di condivisione file in torrent di grandi dimensioni.

Cos’è Anna’s Archive e cosa ha dichiarato

Anna’s Archive è un archivio online che raccoglie e distribuisce grandi contenuti digitali. Nasce prima di tutto per libri, articoli scientifici e altri documenti resi disponibili tramite copie non autorizzate.

Ora arriva anche il comparto musicale, con l’obiettivo di preservare la conoscenza e la cultura digitale, ma attraverso modalità che si pongono al di fuori dei canali e delle licenze previste dai titolari dei diritti.

Il team ha spiegato:

Questo scraping di Spotify è il nostro umile tentativo di avviare un simile “archivio di conservazione” per la musica. Certo, Spotify non ha tutta la musica del mondo, ma è un ottimo inizio.

Ricreare il proprio Spotify

Diverse fonti parlano della possibilità di ricreare una propria copia di Spotify attraverso tutti i dati messi a disposizione tramite torrent. Bastano competenze tecniche e spazio su disco per poter utilizzare l’archivio come l’applicazione di Spotify.

Anna’s Archive spiega come sia possibile creare una vera riproduzione casuale sull’intero catalogo, usando i metadati estratti, oppure playlist generate filtrando per diverse soglie di popolarità.

Ma le conseguenze non mancherebbero ad arrivare. È giusto far sapere a chi vuole tentare l’impresa che, oltre a competenze tecniche e spazio su disco, servirebbero anche coperture legali. Infatti il rischio è quello di ritrovarsi di fronte a pesanti azioni legali da parte delle etichette discografiche e degli altri titolari dei diritti.

La risposta di Spotify sul rischio privacy

Oltre allo scraping dei dati, per il quale Spotify ha dichiarato di aver identificato e disattivato gli account malevoli, la piattaforma ha tranquillizzato sulla possibile fuga di dati personali.

L’obiettivo degli hacker non era infatti quello di diffondere i dati degli utenti e lo stesso portavoce di Spotify ci tiene a precisare che non ci sono indicazioni di una compromissione di informazioni non pubbliche degli utenti e che gli unici dati legati agli utenti coinvolti riguardano le playlist pubbliche create dagli stessi.