Genetica e Big Data: La Chiave per Farmaci Mirati e Pazienti Giusti?
Amici della scienza e curiosi di scoperte mediche, mettetevi comodi! Oggi voglio parlarvi di un argomento che mi sta particolarmente a cuore e che, credetemi, potrebbe rivoluzionare il modo in cui pensiamo allo sviluppo di nuovi farmaci: l’uso della genetica e dell’analisi di dati longitudinali per scovare, quasi come dei detective, i gruppi di pazienti che beneficeranno di più da una specifica terapia. Immaginate di poter sapere in anticipo, con un buon grado di probabilità, quale farmaco funzionerà meglio per chi, soprattutto per malattie complesse e diffuse come quelle cardiovascolari. Sembra fantascienza? Forse non più.
La Scommessa della Ricerca Farmaceutica
Partiamo da un dato di fatto: sviluppare un nuovo farmaco è un’impresa titanica. Costa un occhio della testa (parliamo di una media di oltre un miliardo di dollari per farmaco approvato!) e richiede anni, a volte decenni, di investimenti e ricerca. E il rischio di fallimento? Altissimo. Specialmente per patologie eterogenee come l’insufficienza cardiaca (HF), gli studi clinici devono arruolare migliaia di pazienti per dimostrare un’efficacia che, a volte, è modesta se guardiamo alla popolazione generale. Ma qui casca l’asino, o meglio, qui entra in gioco l’idea geniale: e se quel piccolo effetto generale nascondesse in realtà un grande beneficio per un sottogruppo specifico di pazienti? È un po’ come cercare un ago in un pagliaio, ma se avessimo una calamita super potente?
Questa “calamita” potrebbe essere proprio la genetica. Già in oncologia, l’informazione genetica è diventata cruciale per definire prognosi e disegnare terapie mirate. Ma perché non estendere questo approccio anche alle malattie cardiovascolari? L’idea è proprio questa: usare la nostra conoscenza del DNA per affinare la mira.
Entra in Scena la Genetica (e i Big Data!)
Qui vi presento un approccio analitico che, a mio parere, è davvero affascinante. Immaginate di avere accesso a un’enorme banca dati, come la UK Biobank, che contiene informazioni genetiche e dati clinici longitudinali (cioè raccolti nel tempo) di centinaia di migliaia di persone. Ora, selezioniamo delle varianti genetiche ben note, che sappiamo avere un impatto sulla funzione di geni che sono bersaglio di farmaci già esistenti o in studio. Queste varianti diventano i nostri “proxy genetici”, cioè dei sostituti che mimano l’effetto del farmaco. Ad esempio, una variante che riduce l’attività di un gene bersaglio di un farmaco inibitore ci dice cosa succederebbe se quel farmaco fosse somministrato a lungo termine.
Poi, armati di questi proxy, andiamo a vedere cosa succede nel tempo a questi pazienti “geneticamente trattati”. Utilizziamo le cosiddette analisi “time-to-event” (o analisi di sopravvivenza), che ci permettono di valutare l’effetto di queste varianti su esiti come la morte per cause cardiovascolari, il trapianto di cuore, o la riospedalizzazione per fibrillazione atriale (AF) o insufficienza cardiaca (HF).
Ma c’è un “ma”. I dati del mondo reale sono complessi. Ci sono un sacco di fattori confondenti: altre malattie, altri farmaci assunti, stili di vita. Per mitigare questo problema, entra in gioco una tecnica statistica chiamata “propensity score matching”. In parole povere, cerchiamo di creare gruppi di confronto il più simili possibile per tutte le caratteristiche rilevanti, tranne che per la variante genetica che stiamo studiando. È un po’ come cercare di simulare la randomizzazione di uno studio clinico, ma usando dati già esistenti.

Come Funziona, in Pratica? Qualche Esempio Concreto?
Per mettere alla prova questo sistema, abbiamo preso in esame alcune varianti genetiche legate a farmaci cardiovascolari ben noti:
- PCSK9: Questo gene è il bersaglio degli inibitori di PCSK9, farmaci rivoluzionari per abbassare il colesterolo. Abbiamo usato varianti (come rs11591147) che mimano l’effetto di questi farmaci.
- ADRB1: Codifica per il recettore beta-1 adrenergico, bersaglio dei beta-bloccanti, usati per ipertensione, HF e AF. La variante rs7076938 è stata il nostro proxy.
- ACE: Il gene dell’enzima di conversione dell’angiotensina, target degli ACE-inibitori, fondamentali per ipertensione, HF e AF. Qui abbiamo testato varianti come rs4968782.
- GLP1R e ABCC8: Geni legati al metabolismo del glucosio e bersagli di farmaci antidiabetici (agonisti del recettore GLP-1 e sulfoniluree). Abbiamo esaminato varianti come rs10305492 (GLP1R) e rs757110 (ABCC8) per i loro effetti cardiovascolari.
Per ciascuna di queste “simulazioni genetiche”, abbiamo definito popolazioni di pazienti con specifiche diagnosi (es. cardiopatia ischemica, fibrillazione atriale) e abbiamo seguito nel tempo gli esiti cardiovascolari.
I Risultati? Promettenti, con Qualche “Ma”!
Ebbene, i risultati sono stati davvero incoraggianti! Ad esempio:
- Il proxy genetico per l’inibizione di PCSK9 (rs11591147) ha mostrato un miglioramento della sopravvivenza da morte cardiovascolare/trapianto di cuore in individui con diagnosi di cardiopatia ischemica, ma solo dopo il matching. Questo sottolinea l’importanza di tener conto dei fattori confondenti! L’Hazard Ratio (HR), che misura il rischio, è sceso a 0.78, indicando un effetto protettivo.
- Un proxy per i beta-bloccanti (rs7076938 in ADRB1) ha migliorato la libertà da riospedalizzazione o morte in individui con fibrillazione atriale (HR 0.92).
- Un proxy per gli ACE-inibitori (rs4968782 in ACE) ha migliorato la libertà da riospedalizzazione per insufficienza cardiaca o morte (HR 0.8) e per fibrillazione atriale (HR 0.85).
- La variante protettiva in GLP1R (rs10305492) ha mostrato una riduzione del rischio di sviluppare insufficienza cardiaca o morte cardiovascolare dopo una diagnosi di cardiopatia ischemica (HR 0.82).
- E la variante protettiva in ABCC8 (rs757110) ha indicato una riduzione del rischio di mortalità cardiovascolare post-cardiopatia ischemica (HR 0.88) e una diminuzione del rischio di fibrillazione atriale in pazienti diabetici con cardiopatia ischemica (HR 0.68).
Una cosa notevole è che, spesso, nonostante la riduzione della dimensione del campione dopo il matching, abbiamo osservato Hazard Ratio numericamente più bassi e valori di P (che indicano la significatività statistica) ridotti. Questo suggerisce che gli effetti erano più pronunciati e l’associazione statistica più forte una volta “ripuliti” i dati dai confondenti. Certo, non tutti i proxy genetici hanno replicato perfettamente gli effetti noti dei trattamenti, come nel caso di un’altra variante nel gene ACE (rs4363), il che ci ricorda che la biologia è complessa e questo approccio ha ancora margini di miglioramento.

Perché Tutto Questo è Importante?
Vi starete chiedendo: “Ok, interessante, ma a che serve tutto ciò?”. Beh, pensateci: questo tipo di analisi genetica di sopravvivenza offre un vantaggio critico rispetto agli studi di associazione genome-wide (GWAS) standard o alla Randomizzazione Mendeliana, che tipicamente considerano solo covariate non genetiche come età e sesso. Il nostro approccio, invece, non solo stima la direzione dell’effetto di un farmaco o di un target in un contesto “reale”, ma incorpora anche covariate cliniche, fattori causali e terapie standard che si incontrano normalmente negli studi clinici.
Nel ciclo di vita dello sviluppo di un farmaco, i costi degli studi sull’uomo superano di gran lunga quelli pre-clinici. Quindi, è fondamentale definire il prima possibile lo stato della malattia e la popolazione di pazienti che potrebbero beneficiare maggiormente del nuovo trattamento. Questa “analisi genetica di sopravvivenza” potrebbe offrire l’opportunità di esplorare l’efficacia potenziale di un target farmacologico specifico usando dati del mondo reale e di sviluppare ipotesi sulla selezione dei pazienti (co-morbilità, trattamenti standard), sullo stato della malattia e sui biomarcatori – il tutto in modo efficiente dal punto di vista dei costi, senza dover subito testare su un trial clinico umano.
In pratica, la genetica non solo ci aiuta a identificare i bersagli farmacologici, ma ha anche il potenziale per individuare le popolazioni di pazienti in cui quei bersagli farmacologici potrebbero avere il massimo beneficio. È un passo avanti verso la medicina personalizzata!
Un altro aspetto cruciale è che abbiamo utilizzato dati ospedalieri (Hospital Episode Statistics – HES) e codici ICD, escludendo disturbi cardiovascolari auto-riferiti senza diagnosi mediche dirette, per garantire una maggiore precisione. Inoltre, non ci siamo limitati a individui di ascendenza europea (tranne in casi specifici e motivati), includendo tutti i partecipanti, per aumentare la diversità ancestrale, in linea con le migliori pratiche per l’arruolamento negli studi clinici.
Certo, Non è Tutto Oro Ciò che Luccica
Come ogni approccio scientifico, anche questo ha i suoi limiti. Sebbene abbiamo scelto strumenti genetici basati su terapie efficaci e ampiamente accettate, i nostri risultati derivano da una singola, seppur grande, coorte (la UK Biobank) e beneficerebbero enormemente da una validazione con un dataset indipendente. Usiamo una singola variante genetica come variabile strumentale, il che è necessario per la procedura analitica descritta, ma in teoria si potrebbero usare score poligenici (anche se questo va oltre lo scopo attuale).
Abbiamo scelto varianti genetiche comuni, che tipicamente hanno effetti modesti e potrebbero essere mascherati da altri fattori clinici se il numero di individui ed eventi non è sufficientemente grande. D’altro canto, varianti rare con grandi effetti potrebbero soffrire di un basso numero di portatori. Inoltre, il matching, sebbene utile, non elimina la possibilità di causalità inversa o bias da collisore. E, al momento, questo metodo non fornisce una stima precisa dell’entità dell’effetto del trattamento, informazione cruciale per enti regolatori e decisori.
![]()
Guardando al Futuro
Nonostante i limiti, la forza di questo lavoro risiede nella diversità delle varianti genetiche esaminate e nell’ampia gamma di esiti cardiovascolari valutati (cardiopatia ischemica, insufficienza cardiaca, fibrillazione atriale). Questo approccio completo aiuta a identificare popolazioni di pazienti specifiche che trarrebbero maggior beneficio da trattamenti potenziali.
Un’estensione logica sarebbe condurre “studi clinici in silico” per selezionare e ottimizzare variabili cliniche e co-morbilità specifiche, con l’obiettivo di massimizzare l’effetto (e minimizzare costi e durata di uno studio clinico) per un nuovo trattamento. Questo potrebbe includere anche altri fattori genetici, come score poligenici o la stratificazione per forme mendeliane di malattie cardiovascolari.
In conclusione, se è disponibile un proxy genetico per l’efficacia di un farmaco, l’analisi genetica di sopravvivenza potrebbe essere uno strumento potentissimo per generare ipotesi significative per lo sviluppo clinico precoce di nuovi farmaci, nonché per trovare le popolazioni di pazienti giuste per farmaci già esistenti. È un modo per identificare individui e malattie che probabilmente beneficeranno dal trattamento di un target specifico e, quindi, può aiutare a guidare la progettazione di futuri studi clinici. Insomma, la strada verso una medicina sempre più precisa e personalizzata passa anche da qui, e io non vedo l’ora di scoprire cosa ci riserverà il futuro!
Fonte: Springer
