Dati oscuri e il loro inaspettato valore

Condividi

In un mondo in cui l’informazione è la valuta del futuro, la gestione dei dati è diventata una questione cruciale per le imprese e gli individui. Ma non tutti i dati sono visibili e facilmente accessibili. In questo contesto, i “dati oscuri” rappresentano una categoria che spesso sfugge all’attenzione, nonostante rappresenti una quota significativa dello spazio di archiviazione e delle risorse computazionali. 

Il termine dato oscuro o “dark data” si riferisce a dati che sono stati continuamente raccolti e archiviati dall’azienda, ma che non sono stati organizzati tramite categorizzazione, etichette o qualsiasi altro strumento di organizzazione efficace. Questi dati provengono da varie fonti e possono includere e-mail archiviate, backup duplicati, registri di sistema, statistiche sui processi, dati grezzi dei sondaggi e così via.

I dati oscuri spesso attendono indefinitamente di essere valutati e analizzati tramite data analytics.

Nel paniere dei dark data finiscono, soprattutto, i dati non strutturati che nel 90% dei casi non vengono mai analizzati. Questo rappresenta un ulteriore campanello d’allarme se consideriamo che IDC prevede che l’80% dei 175 Zettabyte di dati che saranno prodotti a livello globale entro il 2025 (un tasso di crescita annuale del 61% rispetto ai 33 Zettabyte del 2018) sarà non strutturato.

Ma cosa rappresentano questi dati oscuri? E quali implicazioni hanno per le aziende dal punto di vista economico e di sicurezza?

Innanzitutto, va osservato che essi occupano una parte considerevole dello spazio di archiviazione e richiedono una gestione che spesso è trascurata. Secondo una ricerca di IDC la percentuali di dati aziendali oscuri arriva a costituire il 68% di tutti quelli memorizzati.

Finché restano inutilizzati, la gestione di questi dati rappresenta un costo economico non indifferente. Secondo un rapporto di Gartner, il costo medio annuo per archiviare un gigabyte di dati è di circa 5 centesimi di dollaro all’anno, senza contare altri costi come la manutenzione, la sicurezza e l’analisi. Se si considera che un’azienda di medie dimensioni può facilmente accumulare petabyte di dati, i costi diventano rapidamente esorbitanti. 

Il problema non è solo la quantità, bensì anche la qualità: molti di questi dati sono inutili, duplicati o ridondanti , comportando sprechi non solo in termini di spazio ma anche di risorse per la loro gestione.

Peraltro, la semplice eliminazione di dati oscuri non è sempre una soluzione praticabile, poiché questi dati potrebbero avere un valore latente o essere richiesti per ragioni legali.

Questa grande quantità di dati presente all’interno dei confini dell’azienda potrebbe anche contenere preziose opportunità di business. Decifrare e utilizzare efficacemente i dati oscuri potrebbe potenzialmente fornire nuovi modi per generare valore, sia dal punto di vista operativo sia strategico. 

Consideriamo, per esempio, la registrazione delle chiamate dei clienti. Potenzialmente contenenti informazioni preziose sui pensieri e sulla geolocalizzazione di un cliente, questi tipi di record vengono regolarmente registrati e archiviati, ma raramente organizzati o analizzati. Un altro esempio di dati oscuri è il file di log di un sito Web. Questi log, potenzialmente contenenti informazioni preziose sul comportamento e sul traffico dei visitatori, vengono raccolti regolarmente, ma raramente analizzati in modo organizzato o significativo.

La presenza di dati oscuri introduce inoltre vari rischi per la sicurezza. Molte organizzazioni non hanno politiche robuste per la classificazione e la gestione dei dati, rendendo difficile identificare quali dati siano sensibili o soggetti a normative di conformità. Senza un’adeguata politica di gestione e classificazione dei dati, le aziende rischiano di esporre informazioni sensibili. 

Una ricerca di Varonis del 2021 ha rilevato che il 53% del campione di aziende analizzate conservava in media oltre 1000 file sensibili in posizioni accessibili a tutti i dipendenti e anche al pubblico. La mancanza di visibilità e controllo su questi dati li rende bersagli ideali per cyber-attacchi, con potenziali danni reputazionali e finanziari per le organizzazioni e un incremento di probabilità di falle di sicurezza.

Data la complessità della questione, la strategie per la gestione dei dati oscuri richiede una combinazione di tecnologie, politiche aziendali, competenze specialistiche e, in generale, una cultura aziendale che privilegi la gestione e l’analisi dei dati come elementi chiave del successo.

Le soluzioni tecnologiche utilizzabili per affrontare questi problemi comprendono strumenti di Data Loss Prevention, di archiviazione gerarchica e piattaforme di analytics. Queste tecnologie possono identificare dati ridondanti, classificare informazioni sensibili e fornire una gestione più efficace dell’archiviazione. Tuttavia, come detto, la tecnologia da sola non basta me è essenziale anche una solida strategia di governance dei dati, completa di regolamenti interni e formazione per i dipendenti.

Le soluzioni basate su intelligenza artificiale stanno emergendo come un potente strumento per gestire e analizzare grandi volumi di dati oscuri. Gli algoritmi di machine learning possono, infatti, scansionare, identificare e classificare in modo efficace dati non strutturati, trasformando quello che una volta era un “peso morto” in una risorsa utilizzabile: una transizione da dato “oscuro” a dato “illuminato” capace di apportare un inaspettato valore.

LASCIA UN COMMENTO

Per favore inserisci il tuo commento!
Per favore inserisci il tuo nome qui

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

Riccardo Florio
Riccardo Floriohttp://www.riccardoflorio.it
Laureato in Fisica, ricercatore, tecnologo, giornalista iscritto all'Ordine, utilizza i computer dal 1980 e da oltre vent'anni opera nel settore dell'editoria IT. E' cofondatore e attuale general manager della media company Reportec ed è direttore responsabile delle riviste Direction e Partners. È coautore di innumerevoli libri, rapporti, studi e Survey nel settore dell’ICT.

Altri Editoriali

Italia leader per chip e cloud automotive: sogno o realtà?

Stufo di leggere le fantastiche corbellerie che si raccontano...

Aiuto arriva un messaggio Whatsapp

L’attenzione di tutti noi è una risorsa scarsa, spesso...

Vuoi vendere? Vienimi più vicino (CLOSER)

Ho avuto recentemente modo di approfondire il sales framework...

Gen AI al lavoro su allucinazioni e nuovi chip

Recentemente mi sono trovato a un incontro di grande...

Professioni digitali per donne e uomini nuovi

Sempre più interessanti si prospettano gli scenari futuri legati...

Il lavoro è ancora una priorità?

Siamo fuori ormai da un po’ dal lockdown e...