Malattie Croniche: L’IA che Impara a Prevederle Tutte Insieme!
Ciao a tutti! Oggi voglio parlarvi di qualcosa che mi appassiona tantissimo e che, secondo me, potrebbe davvero cambiare le carte in tavola nella gestione della nostra salute, specialmente con l’avanzare dell’età: la predizione delle malattie croniche.
Sappiamo tutti che condizioni come il diabete, le malattie cardiache, l’ictus o l’ipertensione sono un bel problema, sia per chi ne soffre sia per i sistemi sanitari. Diventano più comuni con l’età e possono portare a complicazioni serie, per non parlare dei costi associati. Poterle prevedere in anticipo sarebbe fantastico, vero? Ci permetterebbe di intervenire prima, magari prevenendole del tutto o almeno limitandone l’impatto.
Il Vecchio Metodo: Un Modello per Ogni Malattia
Finora, l’approccio classico è stato quello di sviluppare modelli specifici per ogni singola malattia. Immaginate di dover creare un “indovino” diverso per il diabete, uno per le malattie cardiache, uno per l’ictus e così via. Funziona, certo, molti studi hanno ottenuto buoni risultati usando tecniche di machine learning (ML) e deep learning (DL). Ma c’è un “ma”. Anzi, più di uno:
- Richiede un sacco di tempo e risorse computazionali (immaginate allenare tanti modelli separati!).
- Soprattutto, ignora una cosa fondamentale: queste malattie sono spesso collegate tra loro! Chi ha il diabete ha un rischio maggiore di problemi cardiaci o ictus, l’ipertensione è legata all’ictus… insomma, non sono mondi separati.
Pensate che studi hanno mostrato come quasi un quarto delle persone sopra i 14 anni a Madrid soffra di più malattie croniche contemporaneamente (multimorbilità), e in Spagna la prevalenza arriva fino al 30%! Ignorare queste connessioni significa perdere un pezzo importante del puzzle.
La Svolta: Il Multitask Learning Multimodale
Ed è qui che entra in gioco l’idea che abbiamo esplorato nel nostro lavoro: e se potessimo insegnare a un unico modello a prevedere diverse malattie croniche contemporaneamente? È il concetto di Multitask Learning (MTL). L’idea è semplice ma potente: allenare un modello a fare più cose insieme, sfruttando le informazioni condivise tra i vari “compiti” (in questo caso, la predizione di diabete, malattie cardiache, ictus e ipertensione).
Abbiamo preso spunto da un modello che avevamo già sviluppato per predire la demenza (chiamato MAND) e lo abbiamo adattato ed esteso. Il nostro nuovo modello “multitask” utilizza come input i dati delle cartelle cliniche dei pazienti (diagnosi passate, rappresentate dai codici ICD) e le loro informazioni personali (età, sesso, residenza…).
Come Funziona Questa “Magia”?
Senza entrare troppo nei tecnicismi, ecco l’idea di base:
- Capire i Codici Medici: I codici ICD (la classificazione internazionale delle malattie) sono tanti e un po’ ostici per una macchina. Li abbiamo trasformati in qualcosa di più “comprensibile” e ricco di significato usando una tecnica chiamata Word2Vec (simile a come si analizza il linguaggio naturale). Questo ci permette di raggruppare malattie simili e capire meglio le relazioni tra loro. Abbiamo visto che questa rappresentazione funziona molto meglio delle codifiche tradizionali!
- Guardare al Passato (e alle Connessioni): Il modello analizza la storia medica del paziente negli ultimi 10 anni, cercando pattern temporali e interazioni tra le diverse malattie diagnosticate. Usiamo meccanismi sofisticati come l’attenzione multi-testa (MHSA), che permette al modello di “pesare” le informazioni più rilevanti, un po’ come facciamo noi quando leggiamo un testo e ci concentriamo sui punti chiave.
- Imparare Insieme è Meglio: Grazie all’approccio MTL, il modello impara rappresentazioni “latenti” (cioè caratteristiche nascoste nei dati) che sono utili per tutte le malattie che sta cercando di prevedere. Questo non solo è più efficiente (meno parametri da allenare rispetto a 4 modelli separati!), ma cattura anche le famose correlazioni tra le diverse patologie.
- Ispirazione Inaspettata: Abbiamo anche preso spunto dai modelli usati nei sistemi di raccomandazione online (quelli che prevedono su quale annuncio cliccherai, i modelli CTR). L’idea di fondo è simile: imparare dalle interazioni passate (acquisti/click vs. diagnosi passate) per prevedere il futuro (click futuri vs. rischio di future malattie).

Cosa Abbiamo Scoperto Usando Dati Reali?
Abbiamo testato il nostro approccio su un enorme dataset nazionale di Taiwan, con dati anonimizzati di oltre mezzo milione di persone. I risultati sono stati davvero incoraggianti!
- Performance Solida: I nostri modelli MTL hanno ottenuto risultati paragonabili, e in alcuni casi persino leggermente migliori, rispetto ai modelli tradizionali che predicono una sola malattia (STL). Questo suggerisce che sfruttare le informazioni condivise e le comorbidità è davvero utile.
- Efficienza: Come accennato, il modello MTL richiede molti meno parametri rispetto ad allenare modelli separati per ogni malattia. Pensateci: per predire 4 malattie, un approccio STL richiederebbe circa 4 volte le risorse di un singolo modello, mentre l’MTL ne richiede solo poco più di uno! Questo è fondamentale per applicazioni reali, magari su dispositivi con risorse limitate.
- Robustezza: Il modello si è dimostrato capace di mantenere buone performance anche quando una parte significativa delle informazioni mediche passate era mancante (fino al 60%!). Questo indica che riesce a catturare le informazioni chiave in modo efficace.
- Identificazione dei Fattori di Rischio: Analizzando come il modello “presta attenzione” ai diversi dati, abbiamo confermato l’importanza di fattori di rischio noti. L’età è emersa come il fattore più influente, in linea con tonnellate di letteratura medica. Anche genere e area di residenza sembrano avere un ruolo.
- Scoperta delle Comorbidità: L’analisi delle “attenzioni” sui codici ICD ci ha permesso di vedere quali malattie passate il modello considera più importanti per prevedere quelle future. Sono emersi fattori di rischio modificabili ben noti (come l’ipercolesterolemia), ma anche altre condizioni croniche spesso presenti negli anziani (gotta, cataratta senile, epatite cronica, insufficienza renale cronica, artrosi…). Questo conferma che il modello sta imparando le complesse interconnessioni tra le malattie, proprio come osservato negli studi sulla multimorbilità. Sono emersi anche fattori “emergenti” come ansia e depressione, che ricerche recenti iniziano a collegare a un aumentato rischio di malattie croniche.

Non è Solo una Scatola Nera: Verso un Supporto Clinico
Un aspetto fondamentale è che questo modello non è una “scatola nera” incomprensibile. Grazie all’analisi delle attenzioni, possiamo capire perché fa certe previsioni, identificando i fattori di rischio e le comorbidità che considera più rilevanti. Questo allineamento con le conoscenze mediche aumenta la fiducia nel modello e ne dimostra il potenziale per applicazioni reali, come strumento di supporto alle decisioni cliniche.
Certo, un modello con un’accuratezza bilanciata tra il 60% e l’80% (come nel nostro caso, a seconda della malattia) non può sostituire il medico per una diagnosi. Ma non è questo l’obiettivo! L’idea è fornire ai medici uno strumento in più, un “assistente” intelligente che possa evidenziare rischi potenziali, suggerire fattori su cui indagare e, in definitiva, aiutarli a prendere decisioni più informate, specialmente data la complessità delle malattie croniche e dei tanti fattori nascosti.
Sfide e Prossimi Passi
Ovviamente, ci sono ancora sfide e limiti. Lavorare con dati medici sensibili richiede grande attenzione alla privacy. Il nostro studio si è concentrato su una popolazione con dati fino a 10 anni passati per predire i 5 futuri, e prevalentemente su persone più anziane; sarebbe interessante capire i rischi nei giovani e usare periodi di osservazione diversi. Un altro punto è lo squilibrio dei dati: alcune malattie sono meno frequenti di altre, e questo può portare il modello a “mancare” più facilmente i casi positivi (alto tasso di falsi negativi, FNR), specialmente per l’ictus nel nostro caso.
Per il futuro, abbiamo tante idee:
- Semplificare il modello (magari usando tecniche come la “distillazione della conoscenza”) per renderlo più leggero e pratico.
- Analizzare i fattori di rischio specifici per diverse fasce d’età.
- Provare a predire il rischio a più lungo termine (es. 10 anni).
- Trovare modi migliori per gestire lo squilibrio dei dati senza perdere le preziose informazioni sulle comorbidità.
- Magari predire l’incidenza anno per anno, per capire cosa accelera l’insorgenza della malattia.

In conclusione, credo fermamente che l’approccio multitask learning applicato ai dati multimodali sia una strada estremamente promettente per affrontare la sfida delle malattie croniche. Ci permette di avere una visione più olistica, efficiente e interpretabile del rischio, aprendo le porte a una prevenzione e gestione più efficaci. È un campo in rapida evoluzione, e non vedo l’ora di vedere dove ci porteranno i prossimi passi!
Fonte: Springer
