Data retention: un tema sottostimato

Condividi

La storia del mitico eroe Gilgamesh ci è stata tramandata grazie a una tavoletta di argilla scritta in lingua sumera nel 3500 prima di Cristo. Certamente se i Sumeri avessero avuto a disposizione un computer, un sistema storage e oltre 50 secoli di evoluzione tecnologica avrebbero potuto fornirci molte più informazioni su questo personaggio, inserendo disegni, mappe geografiche, animazioni tridimensionali e persino video. Ma niente di tutto ciò ci sarebbe giunto.

Il segreto della longevità della tavoletta sumera è che il sistema di elaborazione utilizzato per redigerla e per interpretarla 5500 anni dopo, ovvero il cervello, pur evolvendosi ha mantenuto un elevato grado di compatibilità all’indietro; e che il client per l’accesso all’informazione, l’occhio umano, è rimasto anch’esso in buona parte invariato.

Nell’era della digitalizzazione le cose assumono una sfumatura drasticamente diversa.

Oggi il ciclo di vita medio di un dispositivo hardware per la lettura delle informazioni è stimato in circa 3-4 anni, mentre quello dell’ambiente operativo e delle applicazioni con cui scrivere e leggere le informazioni non supera i 5-6 anni.

Per diverso tempo il tema della data retention all’interno delle aziende è stato soprattutto quello di governare l’evoluzione tecnologica per garantire l’accessibilità ai dati. Con la memorizzazione in cloud le aziende hanno potuto almeno parzialmente alleggerirsi di questo fardello spostando l’onere dell’aggiornamento tecnologico e della migrazione sui service provider.

Questo in realtà vale soprattutto per i dati “live” e per certe tipologie di aziende mentre, per alcune esigenze di backup e per alcune realtà (per esempio finanziarie o sanitarie) la conservazione on premises è ancora irrinunciabile. Tecnologie di cui ormai non si parla più come il Tape, considerate obsolete, sono in realtà ancora l’asse portante per una quantità immensa di dati storici archiviati; che, peraltro, in questi ultimi anni ha letteralmente salvato alcune aziende colpite da ransomware che ha bloccato tutti i sistemi online (inclusi quelli di backup).

Archiviazione a lungo termine

Affrontando la questione della gestione e dell’accesso dei dati memorizzati su una scala temporale a breve medio termine, ciò che viene perseguito è di bilanciare il valore dell’informazione con il costo necessario per gestirla.

Il tema della conservazione dei dati aziendali a lungo termine, invece, non dispone attualmente di soluzioni altrettanto semplici e chiare. Se la maggior parte dei dati aziendali richiede, infatti, di un orizzonte temporale di conservazione di 10-11 anni esistono molti dati (anche di realtà private) la cui conservazione non prevede un termine di scadenza. Si pensi, per esempio, a tutti i dati scientifici legati all’evoluzione geologica, climatica, naturale, economica; a quelli correlati a eventi come i disastri ambientali (tipo Chernobyl) o all’attività solare, che saranno oggetto di studio e confronto statistico per centinaia di anni.

Il problema della data retention a lungo termine è spesso sottostimato ma è molto serio e va affrontato su molteplici piani, distinguendo il ciclo di vita dell’informazione da quello della tecnologia.

La preservazione dell’informazione è riconducibile alla capacità di tradurre i simboli in conoscenza. Nel caso della tavoletta di Gilgamesh ciò corrisponde a preservare la comprensione della lingua sumera; nel caso delle tecnologie attuali significa conservare non solo le informazioni ma, per esempio, anche i metadati che sono in grado di fornirne la corretta chiave interpretativa. Un secondo aspetto è quello della conservazione dei dati che, tecnologicamente, significa preservare i supporti su cui l’informazione è collocata, ma anche l’intera catena di decodifica, fatta del software applicativo con cui è stata scritta, l’ambiente operativo di riferimento, i dispositivi di elaborazione su cui farlo girare.

Contro la data retention

Sul versante opposto, esiste anche il problema di impedire la data retention. Per esempio, lo scorso 5 aprile 2022 la Corte di Giustizia dell’Unione europea ha ribadito che la conservazione generalizzata e indiscriminata dei dati sul traffico telefonico e telematico è incompatibile con il rispetto dei diritti umani tutelati dalla Carta dei Diritti Fondamentali dell’Unione Europea e con la disciplina europea in materia di privacy nelle comunicazioni elettroniche.

La Corte ha stabilito che, persino per le finalità di lotta ai reati gravi, non appare giustificabile una misura di conservazione generalizzata e indifferenziata dei dati relativi al traffico e dei dati relativi all’ubicazione. A tale riguardo, si sta affermano a livello europeo la cosiddetta procedura di blocco rapido che prevede che i fornitori di servizi Internet siano tenuti a conservare i dati sulle persone solo per un certo periodo di tempo in caso di sospetto iniziale.

La legislazione italiana nella Legge 20 novembre 2017, n. 167, nell’art. 132 adotta criteri opposti e impone agli operatori la conservazione dei dati di traffico telefonico e telematico in maniera generalizzata fino a 72 mesi.

Il tema della data retention ha determinato la definizione anche di un modello ISO denominato Open Archivial Information System, che affronta in dettaglio tutti gli aspetti coinvolti: dalle policy di preservazione, alla gestione dei metadati, al formato di codifica, alla conservazione fisica. Il modello è strutturato in modo tale che, se la razza umana dovesse estinguersi e una astronave di alieni atterrasse sul nostro pianeta, potrebbe disporre degli strumenti necessari per ottenere le informazioni sulla nostra civiltà.

Ripensandoci, forse non è una grande idea.

LASCIA UN COMMENTO

Per favore inserisci il tuo commento!
Per favore inserisci il tuo nome qui

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

Riccardo Florio
Riccardo Floriohttp://www.riccardoflorio.it
Laureato in Fisica, ricercatore, tecnologo, giornalista iscritto all'Ordine, utilizza i computer dal 1980 e da oltre vent'anni opera nel settore dell'editoria IT. E' cofondatore e attuale general manager della media company Reportec ed è direttore responsabile delle riviste Direction e Partners. È coautore di innumerevoli libri, rapporti, studi e Survey nel settore dell’ICT.

Altri Editoriali

Cina 2031: AI Supercloud nel Paese del Dragone

Nell’anno del Drago ho avuto la fortuna di incontrare...

La seduzione delle scorciatoie

Siamo reduci da un certo numero di elezioni consecutive...

Autofagocitosi delle informazioni: l’AI che si nutre di sé stessa

L’autofagocitosi delle informazioni è un fenomeno emergente nel contesto...

Attenzione al pericolo dell’oracolo digitale

La diffusione delle tecnologie di intelligenza artificiale è come...

L’impatto dell’AI generativa nell’arte

L'uso dell'intelligenza artificiale nell'arte e nella creazione di immagini...

Italia leader per chip e cloud automotive: sogno o realtà?

Stufo di leggere le fantastiche corbellerie che si raccontano...