Metilazione DNA: Viaggio nel Cuore del Codice Genetico con Oxford Nanopore (R9 vs R10!)
Ciao a tutti! Oggi voglio portarvi con me in un viaggio affascinante, un’esplorazione nel microscopico mondo del nostro DNA, ma con un focus particolare: la metilazione del DNA. Sembra un parolone, vero? In realtà, è uno dei meccanismi epigenetici più furbi che la natura abbia inventato. Immaginate il DNA come un enorme libretto di istruzioni: la metilazione è come mettere dei piccoli post-it su alcune pagine, senza cambiare il testo scritto, per dire al macchinario cellulare “questa parte leggila” oppure “questa saltala”.
Ma cos’è esattamente questa metilazione?
Nel genoma umano, la forma più comune è la 5-metilcitosina (5mC). In pratica, un piccolo gruppo metile (CH3) si attacca a una base del DNA, la citosina. Questo piccolo cambiamento può avere effetti enormi! Gioca un ruolo cruciale in processi biologici fondamentali come:
- Lo “spegnimento” dei geni (gene silencing)
- La protezione di quelle sequenze ripetute che abbondano nel nostro genoma
- Il mantenimento della stabilità del nostro genoma
E, cosa ancora più importante per noi, livelli anomali di metilazione 5mC sono stati collegati a un sacco di malattie umane. Capite bene, quindi, quanto sia fondamentale poterla studiare in modo affidabile!
La sfida: come “vedere” la metilazione?
Per investigare la metilazione del DNA e il suo impatto, abbiamo bisogno di metodi di rilevamento accurati. Ci sono diverse tecniche: i microarray, il sequenziamento con bisolfito, metodi senza bisolfito e, la star di cui parleremo oggi, il sequenziamento a lunga lettura. I metodi tradizionali a lettura corta, come il bisolfito, fanno un po’ fatica nelle regioni ripetute del genoma, che sono circa la metà del totale! È come cercare di leggere un libro con molte pagine identiche usando solo piccoli frammenti di testo.
Qui entrano in gioco le tecnologie Oxford Nanopore Technologies (ONT). Offrono una soluzione a lunga lettura più economica e superano brillantemente le difficoltà nel rilevare la metilazione proprio in quelle ostiche regioni ripetute.
R9 contro R10: la “vecchia” guardia e la nuova promessa
Nel mondo ONT, abbiamo avuto principalmente due “chimiche” di sequenziamento, cioè due tipi di “sensori” per leggere il DNA: le flowcell R9.4.1 (che chiameremo R9) e le più recenti R10.4.1 (che chiameremo R10). La R9 è stata usatissima, ha generato montagne di dati sulla metilazione e ha spinto lo sviluppo di tanti tool di analisi. Immaginatela come un cavallo di battaglia affidabile.
Poi, nel 2023, sono arrivate le flowcell R10.4.1, con una marcia in più: due sensori per nanoporo invece di uno, promettendo di ridurre gli errori di lettura. Dato che la R9 è andata “in pensione” a metà 2024, la R10 sta iniziando a sfornare dati a pieno ritmo. E qui sorge la domanda: possiamo confrontare i dati ottenuti con R9 con quelli ottenuti con R10? È inevitabile doverlo fare, visto l’enorme patrimonio di dati R9 esistente. Ma queste due chimiche, avendo design diversi, potrebbero introdurre dei “bias”, delle distorsioni, nel rilevamento della metilazione, complicando le analisi incrociate.
La nostra indagine: mettere alla prova R9 e R10
Per capirci qualcosa di più, ci siamo messi al lavoro. Abbiamo preso due coppie di campioni: cellule umane di un tipo specifico (HCT116, per i più curiosi) “normali” (wild-type, WT) e la loro versione “modificata” in cui avevamo messo KO un gene chiamato IPMK. Perché proprio queste? Perché sapevamo che togliere IPMK avrebbe causato cambiamenti nella metilazione, dandoci così un terreno di gioco interessante per i nostri test.
Abbiamo sequenziato una coppia WT/KO usando la chimica R9 e un’altra coppia WT/KO usando la chimica R10, assicurandoci una buona profondità di sequenziamento (oltre 30x, il che significa che ogni pezzetto di DNA è stato letto più di 30 volte). Poi, abbiamo usato una serie di strumenti bioinformatici (Dorado per la “basecalling”, cioè la traduzione del segnale elettrico del nanoporo in sequenza di DNA, minimap2 per allineare le sequenze al genoma di riferimento, e modbam2bed per riassumere i dati di metilazione).
L’obiettivo? Verificare la concordanza tra i dati di metilazione R9 e R10 e scovare eventuali bias specifici di ciascuna chimica. Volevamo anche capire quale fosse il modo migliore per calcolare la copertura e le percentuali di metilazione partendo dai risultati di modbam2bed.
I risultati: concordanza alta, ma con qualche “ma”
Ebbene, la prima buona notizia è che i dati di metilazione generati dalle due chimiche ONT sono altamente concordi! Abbiamo confrontato i nostri dati R9 e R10 con quelli ottenuti dal classico sequenziamento con bisolfito (scaricati da un database pubblico) e abbiamo visto correlazioni molto buone. Anzi, i dati R10 mostravano una correlazione leggermente superiore rispetto a R9 quando confrontati con il bisolfito, suggerendo un miglioramento della nuova chimica.
Quando abbiamo confrontato direttamente R9 con R10 sui nostri campioni WT (o KO), le correlazioni erano alte (intorno a 0.91-0.92, dove 1 è la perfezione). Per esempio, confrontando i campioni WT, ben il 72% dei siti di metilazione mostrava una differenza nella percentuale di metilazione inferiore o uguale al 10% tra R9 e R10. Percentuali simili per i campioni KO. Questo ci dice che, in generale, le due chimiche “vedono” la metilazione in modo simile.
Tuttavia, abbiamo notato che le analisi incrociate tra chimiche diverse (es. R9 WT contro R10 KO) mostravano correlazioni leggermente più basse rispetto a quelle entro la stessa chimica (es. R9 WT contro R9 KO). Questo è un primo campanello d’allarme: le differenze tra le chimiche possono influenzare le nostre conclusioni quando cerchiamo siti di metilazione differenziale (DMP), cioè quei siti che cambiano il loro stato di metilazione tra due condizioni (es. WT vs KO).
Il “superpotere” di R10: le regioni ripetute
Andando più a fondo, abbiamo cercato quei siti di metilazione che mostravano grandi differenze (>30%) tra R9 e R10. Abbiamo identificato dei siti “preferiti da R10” (dove R10 vedeva alta metilazione e R9 bassa) e siti “preferiti da R9”. E qui arriva una scoperta interessante: una buona fetta di questi siti “discordanti” cadeva nelle famigerate regioni ripetute del genoma.
In particolare, la chimica R10 sembrava cavarsela molto meglio della R9 nel rilevare i livelli di metilazione in queste zone. Per esempio, R10 riusciva a identificare 9 volte più siti metilati nelle regioni a “ripetizione semplice” (quelle sequenze tipo AAAAAA o CGCGCGCG). Questo ha senso, perché le flowcell R10.4.1, con i loro due sensori per nanoporo, sono state progettate proprio per migliorare la lettura in regioni a bassa complessità come gli omopolimeri. R10 ha mostrato miglioramenti anche nelle regioni SINE, retro-trasposoni e satelliti. Insomma, per le regioni ripetute, R10 è un passo avanti!
L’impatto sui siti di metilazione differenziale (DMP)
Ok, R10 è bravo nelle ripetizioni, ma cosa succede quando cerchiamo le differenze di metilazione dovute, per esempio, al nostro knockout genico? Abbiamo fatto un po’ di confronti:
- Analisi cross-condizione: R9 WT vs R9 KO, e R10 WT vs R10 KO.
- Analisi cross-chimica: R9 WT vs R10 WT, e R9 KO vs R10 KO.
- Analisi cross-condizione e cross-chimica: R9 WT vs R10 KO, e R9 KO vs R10 WT.
Abbiamo scoperto che l’analisi cross-condizione e cross-chimica identificava un numero significativo di DMP (circa 298.000) che non venivano rilevati dalla sola analisi cross-condizione. E, cosa ancora più interessante, l’analisi puramente cross-chimica (la numero 2) identificava circa 180.000 DMP. Questo ci dice che una parte considerevole delle differenze osservate quando si mescolano dati da R9 e R10 potrebbe essere dovuta alla variabilità della chimica stessa, piuttosto che al fattore biologico che stiamo studiando (come il knockout di IPMK). In pratica, rischiamo di trovare falsi positivi. Quindi, massima attenzione quando si fanno analisi di metilazione differenziale usando dati da chimiche ONT diverse!
Questione di calcoli: come usare al meglio modbam2bed
Anche se abbiamo strumenti potenti come modbam2bed, c’è più di un modo per calcolare la copertura e le percentuali di metilazione partendo dai suoi output. Abbiamo testato tre metodi diversi (chiamiamoli “modbam2bed-calculation”, “method-1 calculation” e “method-2 calculation”).
Senza scendere troppo nei dettagli tecnici delle formule, abbiamo visto che il “method-1 calculation” sembrava dare risultati più ragionevoli e correlazioni più alte quando si confrontavano repliche dello stesso tipo (es. R10 WT vs R9 WT). Il “modbam2bed-calculation” tendeva a includere più siti, ma quelli “unici” rispetto al metodo 1 mostravano correlazioni più basse, suggerendo una minore affidabilità. Il “method-2 calculation”, invece, dava correlazioni decisamente peggiori.
Quindi, per chi usa modbam2bed, il nostro consiglio è di dare un’occhiata attenta a come vengono calcolate queste percentuali, e il “method-1” sembra una scelta migliore per studi di metilazione robusti.
Cosa ci portiamo a casa da questa avventura?
Il sequenziamento ONT è una tecnica potentissima per studiare la metilazione. Anche se le flowcell R9.4.1 non ci sono più, i dati che hanno prodotto sono un tesoro. Per sfruttarli al meglio insieme ai nuovi dati R10.4.1, è fondamentale capire le concordanze e i bias.
Il nostro studio suggerisce che:
- I dati di metilazione R9 e R10 sono altamente concordi.
- La chimica R10 migliora il rilevamento della metilazione nelle regioni ripetute.
- Tuttavia, entrambe le chimiche hanno i loro bias. Decine di migliaia di siti di metilazione rilevati affidabilmente in R9 non lo erano in R10, e viceversa.
- Gli studi di metilazione che confrontano dati ottenuti da chimiche ONT diverse devono fare molta attenzione per ridurre le differenze dovute alla variabilità delle chimiche stesse, altrimenti si rischiano falsi positivi.
- Se usate modbam2bed, il modo in cui calcolate copertura e percentuali di metilazione conta: il nostro “method-1 calculation” sembra il più indicato.
Certo, il nostro studio ha delle limitazioni: abbiamo usato solo due coppie di repliche da una singola linea cellulare umana. Più campioni potrebbero rafforzare ulteriormente le analisi. Ma crediamo che le nostre scoperte offrano già una guida pratica e applicabile per condurre indagini cross-chimica robuste sui dati di metilazione ONT, aiutando a distinguere le vere differenze biologiche dai “rumori di fondo” tecnologici.
L’indagine sulla metilazione del DNA è un campo in continua evoluzione, e con strumenti sempre più sofisticati e un approccio critico ai dati, siamo pronti a svelare ancora tanti segreti nascosti nel nostro genoma!
Fonte: Springer