Visualizzazione astratta di una rete neurale profonda (DNN) con nodi luminosi interconnessi, sovrapposta a un tracciato EEG sfocato sullo sfondo, simboleggiando l'analisi del sonno tramite IA. Illuminazione high-tech blu e viola.

IA e Sonno: Apriamo la Scatola Nera dello Sleep Scoring Automatico

Ciao a tutti! Oggi voglio parlarvi di un argomento che mi affascina tantissimo e che sta iniziando a farsi strada nel mio campo, la sonnologia: l’uso delle reti neurali profonde (DNN) per l’analisi del sonno, in particolare per lo “sleep scoring”, cioè la classificazione delle varie fasi del sonno.

Negli ultimi dieci anni, queste tecnologie, che sono un sottogruppo del più ampio campo del machine learning (ML), sono diventate onnipresenti nella nostra vita quotidiana. E, come spesso accade, hanno iniziato a bussare anche alle porte della medicina. Nel nostro caso, quello della medicina del sonno, promettono di aiutarci in compiti complessi come, appunto, lo scoring delle polisonnografie (PSG).

Tuttavia, c’è un “ma”. Nonostante queste reti neurali siano spesso incredibilmente accurate, a volte persino paragonabili agli esperti umani, non sono ancora entrate nella pratica clinica quotidiana. Perché? Uno dei motivi principali è che molte di esse funzionano come delle “scatole nere”: prendono i dati in input (i segnali della PSG), elaborano chissà cosa al loro interno e sputano fuori un risultato (la fase del sonno), senza però spiegarci *come* ci sono arrivate. Questa mancanza di trasparenza, capite bene, mina la fiducia di noi medici e tecnici.

Ecco perché ho pensato che fosse utile scrivere questa sorta di guida. L’obiettivo è introdurre anche chi non è un esperto di informatica ai fondamenti delle DNN applicate allo scoring del sonno e, soprattutto, far luce su come possiamo renderle più interpretabili. Vogliamo capire cosa succede dentro quella scatola nera!

Le Reti Neurali Profonde (DNN) e lo Scoring del Sonno: Come Funzionano?

Immaginate una rete neurale come un sistema complesso, ispirato al cervello umano, con milioni di “parametri” interni. Per addestrarla a riconoscere le fasi del sonno, le diamo in pasto un’enorme quantità di dati PSG già etichettati da esperti umani (il cosiddetto “ground truth”). La rete fa le sue previsioni e, se sbaglia rispetto all’etichetta dell’esperto, aggiusta i suoi parametri interni. Questo processo viene ripetuto migliaia, milioni di volte, finché l’errore non diventa minimo.

È un processo che richiede una potenza di calcolo enorme, ma una volta che la rete è “addestrata”, può analizzare nuove PSG in modo molto rapido ed efficiente. Il problema, come dicevo, è che con milioni di parametri diventa impossibile per un essere umano capire il significato di ogni singolo aggiustamento. Da qui l’etichetta di “black box”.

Pensate che modelli relativamente semplici, che analizzano solo ECG e segnali respiratori, possono avere quasi 2 milioni di parametri, mentre quelli più complessi superano i 24 milioni! Come fidarsi ciecamente di una decisione presa da un sistema così intricato senza poter verificare il suo ragionamento?

Illustrazione schematica di una rete neurale profonda (DNN) che riceve in input 9 canali di una polisonnografia (EEG, EOG, EMG, SpO2, etc.) e restituisce in output le fasi del sonno predette. Stile diagramma tecnico pulito, high detail.

Entra in Scena l’IA Spiegabile (XAI)

Per affrontare questa sfida, sta emergendo un campo affascinante chiamato Explainable Artificial Intelligence (XAI), o Intelligenza Artificiale Spiegabile. L’obiettivo dell’XAI è sviluppare metodi per rendere i modelli di machine learning, come le nostre DNN, più trasparenti e interpretabili.

Esistono diversi approcci XAI. Noi ci siamo concentrati sui metodi post hoc, che vengono applicati *dopo* che la rete neurale è stata addestrata. In particolare, abbiamo usato un metodo chiamato Integrated Gradients (IG). Senza entrare troppo nei dettagli tecnici, l’IG calcola quanto ogni singolo punto dei dati di input (ogni campione del segnale EEG, EOG, EMG, ecc.) ha contribuito alla decisione finale della rete (ad esempio, classificare una finestra di 30 secondi come sonno N2).

In pratica, l’IG ci assegna un “punteggio di rilevanza” per ogni campione del segnale PSG. Visualizzando questi punteggi, possiamo vedere quali parti del tracciato la rete ha considerato più importanti per la sua classificazione. È come se accendessimo una torcia all’interno della scatola nera!

Cosa Abbiamo Visto Accendendo la Torcia? Un Esempio Pratico

Per mettere alla prova questo approccio, abbiamo preso i dati pubblici del famoso Sleep Heart Health Study (SHHS), un enorme database di polisonnografie. Abbiamo addestrato una nostra DNN (con circa 1,5 milioni di parametri, mica pochi!) usando 9 canali standard della PSG (EEG, EOG, EMG, segnali respiratori, SaO2, flusso aereo).

La nostra rete ha raggiunto un’accuratezza molto buona, con un indice Kappa di Cohen (una misura statistica dell’accordo) di 0.79, perfettamente in linea con l’accordo che si trova tipicamente tra esperti umani (che varia da 0.71 a 0.81).

Poi è arrivato il bello: abbiamo applicato l’Integrated Gradients per vedere *perché* la rete prendeva certe decisioni. Abbiamo visualizzato i risultati colorando le parti del tracciato PSG con punteggi di rilevanza alti con un rosso più intenso.

Ecco cosa abbiamo osservato, confrontando le “attenzioni” della rete con le regole classiche dell’American Academy of Sleep Medicine (AASM) che usiamo noi umani:

  • Veglia (Wake): La rete dava molta importanza (rosso intenso) alle zone con artefatti da movimento nei canali EEG, EOG ed EMG. Coerente, no? I movimenti sono tipici della veglia.
  • Sonno REM: Qui la rete evidenziava correttamente i movimenti oculari rapidi (le “rapid eye movements” che danno il nome alla fase), ma stranamente non sembrava dare molto peso alle onde a dente di sega, un altro segno caratteristico del REM secondo l’AASM.
  • Sonno N1: L’attenzione si concentrava sui movimenti oculari lenti, un altro segno tipico di questa fase di transizione.
  • Sonno N2: Interessante! La rete evidenziava alcuni complessi K (un’onda caratteristica dell’N2), ma non tutti quelli presenti, e dava poca rilevanza ai fusi del sonno (sleep spindles), altro elemento chiave per noi umani.
  • Sonno N3 (Sonno Profondo): Qui la rete faceva centro, dando molta importanza alle onde lente a bassa frequenza (le onde delta) nei canali EEG ed EOG, che sono proprio il segno distintivo dell’N3.

Un’altra osservazione importante: i canali respiratori, la saturazione di ossigeno e il flusso aereo avevano quasi sempre punteggi di rilevanza bassi. Questo ha senso, perché le regole AASM per lo scoring delle fasi si basano principalmente sui segnali neurofisiologici (EEG, EOG, EMG). Inoltre, sembrava che la rete si concentrasse su parti specifiche della finestra di 30 secondi, non sull’intero segmento.

Close-up macro shot, 100mm lens, di un tracciato polisonnografico (PSG) visualizzato su schermo, con onde EEG, EOG e EMG. Alcune sezioni delle onde EEG sono evidenziate in rosso intenso (simulando i risultati IG), indicando alta rilevanza per la classificazione del sonno N3 (onde delta). High detail, precise focusing, controlled lighting.

Limiti e Sfide dell’Interpretabilità

Bello, vero? Ma dobbiamo essere onesti, non è ancora una scienza perfetta. L’analisi con IG che abbiamo fatto è principalmente qualitativa. È difficile quantificare in modo rigoroso questi punteggi di rilevanza, che sono sparsi e non seguono regole fisse.

Inoltre, i valori di rilevanza sono relativi: un “rosso intenso” in un punto va interpretato rispetto ai valori circostanti, non ha un significato assoluto. Anche il modo in cui visualizziamo questi dati (ad esempio, la scala di colori) può influenzare l’interpretazione.

Infine, l’IG lavora nel dominio del tempo. Per l’EEG, dove l’informazione sulla frequenza è cruciale (pensate alle onde alfa, theta, delta), sarebbe forse più utile un approccio XAI che analizzi direttamente le frequenze. Questo è sicuramente un filone di ricerca per il futuro.

Conclusioni (Provvisorie) e Prossimi Passi

Allora, cosa portiamo a casa da tutto questo? Le DNN sono strumenti potentissimi per l’analisi del sonno, ma la loro natura di “scatola nera” è un ostacolo reale alla loro adozione clinica. Metodi di IA Spiegabile come l’Integrated Gradients rappresentano un passo avanti fondamentale per aprire queste scatole e capire come ragionano.

Abbiamo visto che, nel nostro caso, la rete neurale ha imparato a riconoscere alcuni pattern chiave del sonno, in modo parzialmente allineato con le regole AASM, ma non perfettamente. Questo ci dice che c’è ancora lavoro da fare per capire appieno il processo decisionale di queste macchine.

Anche se non abbiamo ancora una “catena di ragionamento” completamente trasparente, queste tecniche sono preziose. Ci permettono di iniziare a costruire quella fiducia necessaria per integrare l’IA nella pratica clinica quotidiana. Il futuro, secondo me, va verso analisi XAI più quantitative e magari specifiche per il dominio delle frequenze, per capire ancora più a fondo i segreti nascosti nei nostri tracciati del sonno. È un viaggio appena iniziato, ma estremamente promettente!

Fonte: Springer

Articoli correlati

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *