Anonimizzazione di documenti.

Molti documenti , detti sensibili, contengono riferimenti a persone, luoghi date ecc. Al fine di poter far circolare tali documenti (ad esempio per un trattamento in outsourcing o per fini di recerca) tali documenti devono essere anonimizzati, ovvero tutte le menzioni suscettibili di causare l’identificazione di una data persona/azienda devono essere eliminate.

L’anonimizzatore di Ho2S, Privacy Guardian  è stato realizzato secondo gli standard più stretti dei vari enti di controllo nazionali (ad esempio la francese CNIL, Commission nationale de l’informatique et des libertés) e garantisce dunque prestazioni assolutamente sicure. E’ disponibile in modalità server (libreria Java) o in modalità interattiva, che consente all’utilizzatore di verificare ed eventualmente modificare i dati di anonimizzazione.

Tra le varie caratteristiche innovanti di Privacy Guardian val la pena menzionare il fatto che è l’unico prodotto in commercio che implementa la persistenza semantica delle entità nominate. In altre parole le varie menzioni sono sostituite non da etichette convenzionali ma da oggetti che pur garantendo la non riconoscibilità della menzione di origine, ne preservano alcune caratteristiche salienti. Ad esempio, nel caso delle date, esse sono trasformate rispetto ad un tempo 0 fittizio, in maniera tale che l’ordine cronologico non vada mai perso.

Privacy Guardian consente inoltre la de-anonimizzazione del documento una volta trattato. Tale caratteristica (presente solo in modalità server) consente un trattamento dei testi assolutamente privo di perdita di informazione.

Privacy Guardian è disponibile per l’italiano, il francese e l’inglese. Attualmente è configurato per fornire prestazioni ottimali nel dominio medico (cartella clinica), finanziario e legale, ma  ulteriori parametrizzazioni sono disponibili su richiesta.

Case History

Alcuni esempi di applicazioni.

Un Ospedale aveva necessità di rendere pubbliche ad uso Ricerca le Cartelle Cliniche dei propri pazienti. Per assicurare il rispetto della Privacy tali documenti sono stati resi anonimi:
- sono stati eliminati i Nomi di Persona pur lasciando indicato il loro ruolo (paziente, dottore, infermiere, etc...)
- sono stati eliminati altir dati sensibili
- è stata ricreata una scala del tempo cui riferire i vari documenti / fatti occultando le date reali .