COVID, Infarto e Ictus: Ho Trovato un Legame Nascosto nel Nostro Sangue Grazie all’Intelligenza Artificiale!
Un Trio Inaspettato: Quando il COVID Incontra Cuore e Cervello
Ciao a tutti! Oggi voglio parlarvi di un’avventura scientifica che mi ha tenuto con il fiato sospeso e che, spero, aprirà nuove strade per capire meglio alcune malattie che ci toccano da vicino. Avete presente il COVID-19? Certo che sì, quella pandemia che ha stravolto le nostre vite. Bene, oltre ai noti problemi respiratori, ci siamo accorti che i pazienti COVID avevano un rischio più alto di trombosi, sia venose che arteriose. E questo, purtroppo, si traduce in una maggiore probabilità di complicazioni acute come l’infarto miocardico acuto (IMA) e l’ictus ischemico acuto (IIA).
La domanda che mi (e molti altri ricercatori) ha iniziato a frullare in testa è stata: c’è un legame molecolare profondo tra queste tre condizioni? Qualcosa che le accomuna a livello genetico o immunitario? Capirlo potrebbe rivoluzionare il modo in cui diagnostichiamo e trattiamo queste patologie, magari trovando bersagli terapeutici comuni. E così, armato di bioinformatica e machine learning, mi sono tuffato nell’analisi dei dati.
La Caccia ai Geni Condivisi: Bioinformatica al Lavoro
Per prima cosa, avevamo bisogno di dati. Mi sono procurato tre grossi set di dati di espressione genica dal database Gene Expression Omnibus (GEO). Uno per il COVID-19 (GSE171110), uno per l’infarto miocardico acuto (GSE66360) e uno per l’ictus ischemico acuto (GSE58294). Pensatela come avere tre enormi biblioteche piene di libri che descrivono quali geni sono “accesi” o “spenti” in pazienti con queste malattie rispetto a persone sane.
Il primo passo è stato identificare i cosiddetti geni differenzialmente espressi (DEG) in ciascuna malattia. In pratica, quali geni si comportano in modo anomalo in ogni condizione. Poi, la parte eccitante: trovare i geni che erano “sballati” in tutte e tre le malattie. Li abbiamo chiamati co-DEG. Ebbene, ne abbiamo trovati ben 88! Non male come inizio, vero? Questo già suggeriva che un meccanismo comune ci dovesse essere.
Ma cosa fanno questi 88 geni? Per capirlo, abbiamo fatto un’analisi di arricchimento funzionale (GO e KEGG). È come chiedere a un esperto: “Ok, ho questa lista di geni, in quali processi biologici sono coinvolti principalmente?”. I risultati sono stati illuminanti: questi geni erano significativamente arricchiti in risposte immuno-infiammatorie, soprattutto quelle legate ai leucociti e ai neutrofili. Bingo! L’infiammazione e la risposta immunitaria sembravano essere il filo conduttore.

Questo ci ha portato dritti a un’altra domanda: come cambia il panorama delle cellule immunitarie in queste malattie? Abbiamo usato un metodo chiamato CIBERSORT per analizzare l’infiltrazione immunitaria, cioè la presenza e l’abbondanza di diversi tipi di cellule immunitarie nei campioni. E sì, c’erano differenze significative tra i gruppi malati e i controlli sani. Ad esempio, nel COVID-19, cellule come i neutrofili e i macrofagi M0 mostravano proporzioni diverse. Simili alterazioni, seppur con specificità, le abbiamo viste anche nell’IMA e nell’IIA.
Machine Learning e Reti Proteiche: Alla Ricerca del “Capo Banda”
Avere 88 geni comuni è interessante, ma volevamo stringere il cerchio, identificare i veri “protagonisti”, quelli che potrebbero essere dei buoni biomarcatori diagnostici o bersagli terapeutici. Qui sono entrati in gioco il machine learning e le reti di interazione proteina-proteina (PPI).
Con il machine learning, abbiamo usato due algoritmi potenti: Random Forest e XGBoost. Immaginateli come due investigatori super intelligenti che analizzano i dati per trovare i geni più importanti nel distinguere i malati dai sani. Incrociando i risultati, sono emersi tre nomi: CLEC4E, S100A12 e IL1R2.
Parallelamente, abbiamo costruito una rete PPI. È come una mappa sociale delle proteine codificate dai nostri 88 co-DEG: chi interagisce con chi? Chi è più “connesso” e influente? Da questa analisi, sono emersi i 10 geni “hub” (cioè i più centrali) più influenti: MMP9, TLR2, TLR4, ITGAM, S100A12, FCGR1A, CD163, FCER1G, FPR2 e CLEC4D.
Notate qualcosa? Un nome spiccava in entrambe le liste (o quasi, S100A12 era tra i top della PPI e selezionato dal machine learning): S100A12. Questo gene ha iniziato a sembrarci particolarmente promettente come potenziale biomarcatore comune e bersaglio terapeutico.
S100A12: La Star dello Studio
S100A12 è una proteina legante il calcio, espressa principalmente da neutrofili e monociti-macrofagi. È coinvolta nelle risposte infiammatorie e nel mantenimento dell’omeostasi immunitaria. Diversi studi l’hanno già collegata a malattie coronariche, sindrome da distress respiratorio acuto (ARDS) e malattie cerebrovascolari. Sembrava proprio il candidato ideale!
Per essere sicuri, dovevamo validare i nostri risultati. Abbiamo usato una doppia strategia:
- Validazione con dataset indipendenti: Abbiamo preso altri tre dataset GEO (uno per COVID, uno per IMA, uno per IIA) non usati prima e abbiamo controllato l’espressione di S100A12. Risultato? L’espressione di S100A12 era significativamente più alta nei pazienti rispetto ai controlli sani in tutte e tre le malattie!
- Validazione in vitro: Abbiamo raccolto campioni di sangue da pazienti reali con COVID-19, IMA e IIA (5 per ogni gruppo) e da controlli sani, e abbiamo misurato i livelli di S100A12 con QRT-PCR. Anche qui, S100A12 era significativamente sovraespresso nei gruppi di pazienti.
Ma S100A12 è anche un buon “dottore” per la diagnosi? Abbiamo eseguito analisi delle curve ROC. Per farla semplice, misurano quanto bene un biomarcatore distingue tra malati e sani. L’area sotto la curva (AUC) ci dà un’idea della sua performance. Per S100A12, l’AUC era di 0.775 per il COVID-19 (abilità diagnostica moderata), 0.782 per l’IMA (buona abilità) e ben 0.812 per l’IIA (forte abilità diagnostica). Non male davvero!

Cosa Significa Tutto Questo? Implicazioni e Prospettive Future
Il nostro studio, quindi, suggerisce che S100A12 potrebbe essere un importante biomarcatore comune per la diagnosi precoce e un potenziale bersaglio terapeutico per COVID-19, infarto miocardico acuto e ictus ischemico acuto. L’idea è che l’infezione da COVID-19, attraverso meccanismi infiammatori che coinvolgono cellule come i neutrofili (grandi produttori di S100A12), possa creare uno stato di ipercoagulabilità e danno endoteliale che favorisce eventi trombotici come infarti e ictus.
Pensateci: i neutrofili, attivati massicciamente durante infezioni come il COVID-19, rilasciano le famose “trappole extracellulari dei neutrofili” (NETs). Queste NETs, sebbene utili per combattere i patogeni, possono anche promuovere la coagulazione e l’infiammazione, danneggiando i vasi sanguigni. S100A12, essendo legato ai neutrofili e all’infiammazione, potrebbe essere un attore chiave in questo processo. Infatti, S100A12 può legarsi al recettore RAGE, presente sulle cellule endoteliali, attivandole e promuovendo l’espressione di molecole di adesione che favoriscono ulteriormente l’infiammazione e potenzialmente la trombosi.
Certo, il mio studio ha delle limitazioni. I dati provenivano da database pubblici, i campioni per la validazione in vitro erano pochi, e non abbiamo considerato altre comorbidità. Però, i risultati sono coerenti con molte altre ricerche e aprono la strada a studi futuri più ampi.
L’obiettivo finale? Poter usare S100A12, magari insieme ad altri biomarcatori, per identificare precocemente i pazienti a rischio, monitorare la progressione della malattia e, chissà, sviluppare nuove terapie mirate. Immaginate kit di rilevamento rapido per S100A12 che aiutino i medici a prendere decisioni più tempestive. Sarebbe un grande passo avanti!
Questa ricerca è un piccolo pezzo di un puzzle enorme, ma ogni pezzo ci avvicina a comprendere meglio le complesse interazioni tra virus, sistema immunitario e malattie cardiovascolari e cerebrovascolari. E la combinazione di bioinformatica e machine learning si sta rivelando uno strumento potentissimo in questa esplorazione. Continuerò a scavare, promesso!
Fonte: Springer
