Demenza: L’Intelligenza Artificiale Svela la Rete Nascosta delle Cause!
Amici, parliamoci chiaro: la demenza è una di quelle sfide globali che ci fa tremare i polsi. Pensate che oggi colpisce oltre 55 milioni di persone nel mondo, e le stime dicono che questo numero potrebbe triplicare entro il 2050! Una vera e propria emergenza sanitaria che ci spinge, come ricercatori e appassionati di scienza, a cercare con tutte le nostre forze dei modi per prevenirla. E la chiave, credetemi, sta nell’identificare quei fattori di rischio modificabili su cui possiamo intervenire.
Certo, tutti sappiamo che l’età è il fattore di rischio più potente, ma su quella, ahimè, non possiamo fare molto. Però, avete mai sentito parlare di “età biologica”? È un concetto affascinante! Si tratta di un biomarcatore che cerca di catturare l’invecchiamento a livello biologico in modo più preciso dell’età anagrafica. Immaginatela come un indicatore della salute reale del nostro corpo, che può predire meglio il rischio di malattie, inclusa la demenza. E la cosa bella è che, a differenza dell’età scritta sulla carta d’identità, quella biologica potrebbe essere influenzabile!
La Caccia ai Fattori di Rischio: Un Puzzle Complesso
La Lancet Commission ha già messo sul tavolo 14 fattori di rischio modificabili, e altre ricerche ne hanno identificati fino a 39, spaziando dallo stile di vita (attività fisica, dieta) a condizioni mediche come ictus o malattie renali. Ma il vero nodo da sciogliere è: come esattamente questi fattori contribuiscono alla demenza? Quali sono i meccanismi causali che li legano a questa malattia? Capirlo è fondamentale per sviluppare strategie di intervento davvero efficaci.
Qui entriamo nel campo minato dell’inferenza causale. Non basta osservare una correlazione; dobbiamo scoprire se A causa B, o se B causa A, o se c’è un terzo incomodo (un fattore confondente) che influenza entrambi. E quando hai a che fare con una mole enorme di dati, come quelli della UK Biobank (un database gigantesco con informazioni su mezzo milione di persone!), la sfida diventa titanica.
Il Nostro Approccio: Quando l’IA Incontra la Medicina
Ed è qui che, nel nostro studio, abbiamo deciso di giocare d’astuzia, mettendo in campo l’artiglieria pesante: l’intelligenza artificiale e il natural language processing (NLP). Vi spiego come abbiamo fatto, perché è un po’ come fare i detective con strumenti super tecnologici.
Per prima cosa, avevamo davanti a noi ben 5505 variabili della UK Biobank. Selezionare a mano quelle potenzialmente legate alla demenza sarebbe stato un lavoro da certosini, e con il rischio di perderci pezzi importanti o di farci influenzare dai nostri preconcetti. Allora, abbiamo “sguinzagliato” dei modelli di NLP, addestrati su testi come Google News e Wikipedia. Questi modelli sono capaci di capire la “similarità” semantica tra parole e frasi. Abbiamo dato loro in pasto una lista di termini noti legati alla demenza, e loro ci hanno aiutato a pescare, da quel mare di variabili, quelle più “attinenti”. Un po’ come un motore di ricerca super intelligente specializzato in concetti medici!
Una volta ottenuta una lista più maneggevole di candidati (circa 120 variabili dopo ulteriori scremature), è entrata in gioco la “scoperta causale”. Abbiamo usato un approccio di machine learning chiamato Fast Causal Inference (FCI). Questo metodo è fantastico perché non si limita a dire “A è associato a B”, ma cerca di capire la direzione della causalità (A causa B?) e, soprattutto, tiene conto dei possibili fattori confondenti non misurati – quei fantasmi statistici che possono ingannarci facendoci vedere cause dove non ci sono.

Il risultato? Una sorta di mappa, una rete causale che ci mostra le connessioni plausibili tra i vari fattori e il loro legame con l’insorgenza della demenza in età avanzata.
Cosa Abbiamo Scoperto? I Nodi Cruciali della Rete
Dalla nostra analisi sono emersi otto fattori di rischio che sembrano avere un ruolo, diretto o indiretto, nell’influenzare la demenza. Uno dei protagonisti indiscussi sono i disturbi mentali dovuti a disfunzioni cerebrali (classificati come ICD-10 F06). Questi non solo sembrano essere cause dirette, ma agiscono anche da mediatori, come dei ponti, nel percorso che da altri disturbi neurologici porta alla demenza.
E l’età? Beh, l’età anagrafica ha mostrato un legame diretto con la demenza, come ci aspettavamo, anche se questo legame potrebbe essere influenzato da fattori latenti. Ma la cosa più intrigante è emersa quando abbiamo sostituito l’età anagrafica con l’età fenotipica (la nostra età biologica, calcolata da 10 biomarcatori). Qui, il legame diretto con la demenza, seppur meno marcato, non sembrava confuso da fattori nascosti. Questo è importantissimo! Perché, a differenza dell’età anagrafica, l’età biologica è potenzialmente modificabile attraverso cambiamenti nello stile di vita, come una maggiore attività fisica. Questo apre spiragli incredibili per la prevenzione e la gestione della demenza.
Abbiamo anche visto che altri disturbi cerebrali, disturbi del nervo facciale e disturbi della personalità dovuti a danni cerebrali potrebbero influenzare indirettamente la demenza, passando proprio attraverso quei disturbi mentali F06. Anche l’uso di oppioidi è emerso come un potenziale, seppur più debole, contributore al rischio di demenza, anche se qui la possibilità di confondimento non è esclusa.
È interessante notare come molti di questi fattori siano legati a danni nervosi o cerebrali, suggerendo che i disturbi neurologici potrebbero avere un ruolo più immediato nell’insorgenza della demenza rispetto ad altri fattori di rischio. Questo potrebbe aiutarci a definire meglio le priorità per gli interventi mirati.
Il Bello (e i Limiti) dell’Usare l’IA per la Selezione
Devo dire che i nostri “segugi digitali” (i modelli NLP) hanno fatto un gran lavoro. Sono riusciti a identificare correttamente variabili collegate a 24 su 30 fattori di rischio per la demenza che avevamo identificato manualmente, partendo da un pool iniziale di oltre 5000 variabili! Un’accuratezza dell’80% non è niente male. Questo approccio basato sui dati, che non dipende direttamente dal dataset originale per la selezione, ci aiuta a evitare problemi come l’overfitting o i bias soggettivi, e ci permette di esplorare anche variabili meno note.
Certo, non sono infallibili. A volte, la diversa formattazione delle frasi o le abbreviazioni possono creare ambiguità. Per esempio, i modelli che abbiamo usato tendono a lavorare in minuscolo, e questo può far perdere significato (pensate a “US” come Stati Uniti e “us” come noi). Inoltre, essendo addestrati su database generici come Google News e Wikipedia, potrebbero non cogliere tutte le sfumature del linguaggio medico specialistico. Infatti, circa il 16.8% delle variabili selezionate non erano classificabili come fattori di rischio noti, il che potrebbe indicare imprecisioni del modello, ma – e qui sta il bello – potrebbe anche suggerire che la nostra comprensione dei fattori di rischio è incompleta e che queste variabili “irrilevanti” potrebbero in realtà essere collegate alla demenza tramite fattori latenti e sconosciuti!

In futuro, l’uso di modelli addestrati specificamente su cartelle cliniche elettroniche potrebbe migliorare enormemente l’accuratezza e la rilevanza per la ricerca medica.
Non Solo Legami Diretti: Le Vie Indirette della Demenza
Un aspetto affascinante è che alcuni fattori di rischio ben noti per la demenza, come il colesterolo HDL, la perdita dell’udito, l’attività fisica e il diabete, sono comparsi nella nostra rete causale, ma erano collegati alla demenza solo indirettamente, attraverso molteplici altre variabili come l’età, il tasso metabolico e il sesso, e potenziali fattori latenti. Questo potrebbe significare che, a differenza dei “colpevoli diretti” come i danni cerebrali, questi fattori influenzano la demenza attraverso percorsi più complessi. Di conseguenza, gli effetti degli interventi su questi fattori potrebbero essere meno diretti e immediati di quanto si pensi.
È importante anche sottolineare che il nostro algoritmo FCI è progettato per esplorare le relazioni causali direzionali, ma non per stimare la “forza” di questi effetti. La sua grande capacità è quella di individuare il confondimento non misurato. Per quantificare gli effetti, una volta costruiti i grafici causali, si possono usare altre tecniche, e questo sarà sicuramente un passo per le ricerche future.
Guardando al Futuro: Cosa Ci Aspetta?
Non ci fermiamo qui, ovviamente! Questo studio è un passo avanti importante, ma la strada è ancora lunga. Per esempio, abbiamo considerato la “demenza” come un termine ombrello. In futuro, con più dati disponibili, sarà cruciale analizzare separatamente i diversi sottotipi di demenza (Alzheimer, vascolare, corpi di Lewy), perché potrebbero avere percorsi causali distinti.
Inoltre, dovremo affinare le strategie per “mettere insieme” i risultati ottenuti dai diversi set di dati imputati (usati per gestire i dati mancanti) e integrare metodi per stimare l’entità degli effetti causali.
Quindi, cosa ci portiamo a casa da questa avventura scientifica? Prima di tutto, abbiamo una mappa più chiara di alcuni dei percorsi che possono portare alla demenza, con un focus particolare sui disturbi neurologici e sul potenziale enorme dell’età biologica come bersaglio per interventi. E poi, abbiamo dimostrato che l’uso di NLP e machine learning per la scoperta causale in malattie complesse, partendo da dati enormi, non è fantascienza, ma una realtà promettente. È un po’ come avere a disposizione un nuovo tipo di microscopio super potente, capace di farci vedere connessioni che prima potevamo solo immaginare.
La lotta contro la demenza è complessa, ma con strumenti innovativi e un approccio multidisciplinare, sono convinto che possiamo fare la differenza. E chissà quali altre scoperte ci riserverà il futuro grazie a questi affascinanti “investigatori digitali”!

Fonte: Springer Nature
