La crescente diffusione di immagini generate dall’intelligenza artificiale ha aperto nuove prospettive nel settore creativo e industriale, ma ha anche portato a nuove sfide legate alla sicurezza e all’affidabilità delle informazioni visive. Le immagini deepfake, capaci di replicare con precisione volti umani e scene realistiche, stanno sollevando preoccupazioni tra aziende e organizzazioni, rendendo urgente lo sviluppo di strumenti efficaci per rilevarle.
La tecnologia ha risposto a questa esigenza con soluzioni avanzate che combinano machine learning, analisi forense digitale e modelli di intelligenza artificiale per distinguere le immagini autentiche da quelle create artificialmente.
Le immagini generate dall’intelligenza artificiale vengono create utilizzando piattaforme come Midjourney, Dall-E e Firefly. Alcuni studi hanno previsto che nel giro di pochi anni l’uso di deepfake per furti di identità e frodi potrebbe causare enormi perdite finanziarie. Gartner ha stimato che circa il 20% degli attacchi informatici nel 2023 ha probabilmente incluso contenuti deepfake nell’ambito di campagne di disinformazione e manipolazione. Il rapporto evidenzia il crescente uso dei deepfake nelle frodi finanziarie e negli attacchi di phishing.
Il rilevamento delle immagini false
Thales ha risposto a questo fenomeno sviluppando un metamodello per il rilevamento di immagini false generate dall’intelligenza artificiale.
“Il metamodello di rilevamento dei deepfake di Thales affronta il problema delle frodi di identità e delle tecniche di morphing – ha affermato Christophe Meyer, Senior Expert in AI e CTO di cortAIx, l’acceleratore AI di Thales -. L’aggregazione di più metodi che utilizza reti neurali, rilevamento del rumore e analisi della frequenza spaziale ci aiuta a proteggere meglio il crescente numero di soluzioni che richiedono controlli biometrici dell’identità. Si tratta di un notevole progresso tecnologico e di una testimonianza dell’esperienza dei ricercatori di intelligenza artificiale di Thales.”
Il metamodello di Thales utilizza tecniche di apprendimento automatico, alberi decisionali e valutazioni dei punti di forza e di debolezza di ciascun modello per analizzare l’autenticità di un’immagine. Combina vari modelli, tra cui:
- Il metodo CLIP (Contrastive Language-Image Pre-training) prevede il collegamento di immagine e testo attraverso l’apprendimento di rappresentazioni comuni. Per rilevare i deepfake, il metodo CLIP analizza le immagini e le confronta con le loro descrizioni testuali per identificare incongruenze e artefatti visivi.
- Il metodo DNF (Diffusion Noise Feature) utilizza le attuali architetture di generazione di immagini (chiamate modelli di diffusione) per rilevare i deepfake. I modelli di diffusione si basano su una stima della quantità di rumore da aggiungere a un’immagine per causare una “allucinazione”, che crea contenuti dal nulla, e questa stima può essere utilizzata a sua volta per rilevare se un’immagine è stata generata dall’intelligenza artificiale.
- Il metodo DCT (Discrete Cosine Transform) per il rilevamento dei deepfake analizza le frequenze spaziali di un’immagine per individuare artefatti nascosti. Trasformando un’immagine dal dominio spaziale (pixel) al dominio della frequenza, la DCT è in grado di rilevare sottili anomalie nella struttura dell’immagine, che si verificano quando vengono generati deepfake e sono spesso invisibili a occhio nudo.