L’interesse per le tecniche di riconoscimento di gesti ed espressioni del volto che tradiscono comportamenti criminali continua a suscitare interesse. Affidate inizialmente a poliziotti addestrati, sono state poi deputate ad una macchina, un computer che attraverso degli algoritmi mette in relazione i dati raccolti con immagini da interpretare.
Le conoscenze e i principi di base si rifanno alle teorie di Paul Ekman, professore emerito all’Università della California, secondo cui il viso è la parte del nostro corpo che maggiormente mente ma anche quella che più facilmente si tradisce.
Ci sono altri mezzi a disposizione (la “macchina della verità”, la risonanza magnetica del cervello, l’analisi della voce) ma l’analisi delle espressioni facciali è più rapida e meno invasiva. Ekman ha elaborato un sistema che codifica le espressioni del volto, denominato FACS, in grado di distinguere tutti i movimenti senza associare ad essi alcuna interpretazione soggettiva e basato sull’anatomia. Ha così classificato 28 gruppi di azioni del volto, poi confluite in un database per l’elaborazione di algoritmi per il riconoscimento facciale.
In genere, i software per il riconoscimento facciale cercano gruppi di pixel organizzati secondo modelli precisi – parti più scure per gli occhi, naso più chiaro, ecc. – per poi passare ad estrarre i tratti distinguendo le caratteristiche geometriche come la forma degli occhi o la linea della bocca e calcolandone le distanze. Si tratta di algoritmi usati principalmente per l’identificazione, ma possono essere adattati anche al rilevamento delle espressioni.
È quello che fa il software FACS, che riesce a distinguere l’80% delle espressioni del volto di origine emotiva. Nel mondo reale, però, è tutta un’altra storia. Uno studio che ha utilizzato FACS per identificare noia, confusione e contentezza negli studenti durante le lezioni, è stato un completo fallimento. Il problema era il movimento: è difficile far stare fermi dei ragazzini e il sistema era stato programmato a leggere le espressioni su volti immobili.
Si sono poi aggiunte numerose app, al servizio dello spettacolo o della pubblicità. Persino Facebook e Apple stanno investendo in questo settore. Ma app e software riconoscono solo le espressioni collegate alle emozioni di base, come rabbia, disgusto, paura, felicità, tristezza, sorpresa. E per l’inganno non esiste un’espressione specifica.
Perciò Ekman è andato oltre: ha studiato e trovato il modo di cogliere le cosiddette micro-espressioni. Tutto è iniziato con una paziente particolarmente difficile, normale in apparenza, allegra persino. Ma la sua storia di suicidi tradiva ben altro. Dopo ore ed ore a guardare le sedute di analisi fotogramma per fotogramma, finalmente Ekman ha visto, tra un sorriso e l’altro, un lampo di angoscia – due fotogrammi appena.
La conclusione di Ekman è stata dunque che le micro-espressioni sono espressioni involontarie dello stato interiore della persona e durano frazioni di secondo prima di essere soppresse. È nato così il Micro Expression Training Tool, un programma per addestrare le forze dell’ordine a riconoscere le micro-espressioni durante gli interrogatori, con risultati positivi nel 70-80% dei casi.
Dopo Ekman, altri studiosi si sono avventurati in questo campo, nella convinzione che un algoritmo sia lo strumento migliore per rilevare e interpretare le emozioni che esprimiamo con il nostro volto. I tentativi di costruire strumenti per il riconoscimento delle micro-espressioni (da Shreve, Polikovsky, ecc.) hanno presentato però tutti lo stesso problema: i dati alla base del riconoscimento erano sempre una serie di foto di espressioni “messe in scena”, non naturali, che lo strumento non riusciva a rilevare in filmati di durata maggiore.
Ekman, dal canto suo, aveva rilevato che le micro-espressioni di chi mente si evidenziano in momenti di forte pressione: l’unico modo di ottenere un set di dati affidabile era dunque ricreare questa situazione in laboratorio. Il Micro-expressions Spotting and Recognition (MESR) si avvicina molto a queste condizioni. Si tratta di un sistema che individua e riconosce le micro-espressioni in maniera del tutto automatica e basato su video di lunga durata di situazioni spontanee.
Il sistema individua 3 punti sul viso (gli angoli interni degli occhi e la punta del naso) e vi posiziona una griglia 6×6. L’algoritmo prende il primo e l’ultimo fotogramma, derivando da entrambi i vettori dei tratti, e fa una media per creare un punto di riferimento. Quando la differenza supera una certa soglia per un tempo di 1/25 e 1/5 di secondo, il MESR segnala la micro-espressione.
Il modulo interpretativo opera sulle immagini segnalate, tramite una tecnica detta “ingrandimento del moto euleriano”, che registra anche le minime tracce di movimento. I risultati ottenuti finora sono promettenti. L’accuratezza del sistema è di quasi il 93%.
Nonostante i risultati incoraggianti, le critiche non mancano. Secondo molti identificare i bugiardi non sarà mai possibile. Alcuni scienziati puntano il dito contro i presupposti alla base delle ricerche, ovvero che la tecnologia possa essere applicata alla comprensione delle nostre emozioni e che Paul Ekman abbia ragione.
Intanto serie televisive e pubblicazioni continuano ad alimentare il mito: è possibile scovare un sentimento che si cerca disperatamente di nascondere? Una macchina può davvero riuscire a cogliere la sorpresa, il disgusto, la paura o la rabbia che possono tradire un possibile terrorista per una frazione di secondo? Dobbiamo e vogliamo disperatamente crederci, perché la scienza risponde ai bisogni dei tempi e ora, più che mai, c’è bisogno di sapere di chi fidarsi e di chi no.