Anonimizzazione dei dati: cos'è e come funziona

L’anonimizzazione dei dati è un procedimento che permette di trasformare dati personali in dati anonimi, garantendo così la privacy individuale e permettendo alle imprese di fruire di quelle informazioni senza rischi, dal momento che non è possibile risalire alla singola persona.

L’argomento è diventato particolarmente di attualità con l’introduzione del GDPR (Regolamento Generale sulla Protezione dei Dati) e delle varie normative nazionali e comunitarie in tema di trattamento dei dati e non va confuso con la pseudonimizzazione: ma di cosa si tratta più nello specifico? E quali sono le principali tecniche di anonimizzazione dei dati?

Indice

A cosa serve l’anonimizzazione dei dati

L’anonimizzazione dei dati personali è un’operazione di particolare rilevanza per garantire la privacy dei consumatori: anonimizzare un set di personal data significa infatti slegare le informazioni dal singolo individuo e dunque far sì che quegli stessi dati non possano essere più qualificati come personali. Grazie all’anonimizzazione, venendo meno questo requisito, i dati in possesso dell’azienda non sono più soggetti alle restrizioni sul trattamento dei dati personali e di conseguenza le informazioni possono essere utilizzate senza identificare la persona.

Il tema dell’anonimizzazione viene affrontato con particolare attenzione dall’introduzione del GDPR, tuttavia a causa della poca chiarezza all’interno del testo del regolamento, molti confondono questa operazione con la pseudonimizzazione.

Anonimizzazione dei dati e GDPR

L’obiettivo di rendere i dati personali anonimi nasce dalla necessità di poter disporre di quelle stesse informazioni senza correre rischi dal punto di vista della violazione della privacy.

Il considerando 26 del Regolamento afferma infatti che “i principi di protezione dei dati non dovrebbero pertanto applicarsi a informazioni anonime, vale a dire informazioni che non si riferiscono a una persona fisica identificata o identificabile o a dati personali resi sufficientemente anonimi da impedire o da non consentire più l’identificazione dell’interessato. Il presente regolamento non si applica pertanto al trattamento di tali informazioni anonime, anche per finalità statistiche o di ricerca“: ciò significa che nel momento in cui un set di dati viene anonimizzato, essi non ricadono più nell’ambito di applicazione del GDPR e non sono più soggetti alle stesse restrizioni.

Il significato di “anonimizzazione” è dunque quello di non rendere più identificabili le persone, prestando tuttavia attenzione alla possibilità che l’uso di altre informazioni in possesso non ne consenta il collegamento all’individuo.

Anonimizzazione e pseudonimizzazione: quali differenze ci sono

Si è detto che l’anonimizzazione non va confusa con la pseudonimizzazione: questa seconda operazione infatti non elimina il rischio che il dato possa essere ricostruito e riassociato all’utente. La differenza è apparentemente molto sottile, ma in realtà mentre l’anonimizzazione rende impossibile l’identificazione della persona, la pseudonimizzazione mira per lo più a renderla difficile ma non impossibile.

È lo stesso GDPR, al quinto comma dell’articolo 4, a definire la pseudonimizzazione come “il trattamento dei dati personali in modo tale che i dati personali non possano più essere attribuiti a un interessato specifico senza l’utilizzo di informazioni aggiuntive, a condizione che tali informazioni aggiuntive siano conservate separatamente e soggette a misure tecniche e organizzative intese a garantire che tali dati personali non siano attribuiti a una persona fisica identificata o identificabile“.

Al contrario, all’interno del Regolamento non viene data una definizione esplicita di “anonimizzazione” ma la stessa può essere rilevata dal sopra citato Considerando 26.

Quali sono le principali tecniche di anonimizzazione dei dati

Il GDPR, pur essendo abbastanza netto sul tema della protezione degli utenti, non descrive quali siano le tecniche considerate valide per l’anonimizzazione dei dati, lasciando ai singoli responsabili l’onere della scelta del procedimento da applicare. Questo, in realtà, apre a non poche difficoltà per gli operatori, che proprio in virtù della sottile differenza tra anonimizzazione e pseudonimizzazione, rischiano di incorrere in procedure imparziali o scorrette che possano consentire la re-identificazione degli individui.

In linea di massima, le tecniche utilizzate per l’anonimizzazione dei dati sono quattro: mascheramento, randomizzazione, generalizzazione e anonimizzazione stratificata.

Il mascheramento si basa sulla rimozione di tutti quei dati che possono identificare in maniera diretta l’utente (per esempio nome e indirizzo), agendo dunque sul livello di dettaglio senza però alterare i dati originali.

La randomizzazione, invece, modifica i dati di partenza slegando l’utente dagli stessi e rendendoli meno accurati: non essendo più esatti, i dati così alterati rendono impossibile riferirli a un individuo specifico.

Altro sistema è la generalizzazione dei dati, che modificando la scala o l’ordine di grandezza rende più difficile l’identificazione dei soggetti (per esempio allargando il focus da una città a una provincia), mentre l’anonimizzazione stratificata, detta anche ri-anonimizzazione, punta sull’anonimizzazione di dati già resi anonimi in una precedente fase.

La scelta del metodo da utilizzare dipende ovviamente dalle esigenze dell’organizzazione, pertanto va effettuata avendo cura di valutare con attenzione il database e gli obiettivi da raggiungere.