WarpDemuX: Decodificare l’RNA come mai prima d’ora, un campione alla volta (ma tutti insieme!)
L’incredibile mondo del sequenziamento diretto dell’RNA
Ciao a tutti! Oggi voglio parlarvi di qualcosa che mi appassiona tantissimo nel campo della biologia molecolare: il sequenziamento diretto dell’RNA con nanopori (dRNA-seq). Immaginate di poter leggere le molecole di RNA così come sono, senza doverle prima “tradurre” in DNA. È una tecnica potentissima perché ci permette di vedere non solo la sequenza, ma anche le modifiche chimiche naturali presenti sull’RNA (l’epitranscrittoma!) e dettagli come la lunghezza della coda poli(A), che è super importante per la vita della molecola stessa. Insomma, ci dà una visione molto più completa e fedele di ciò che accade nella cellula a livello di trascrittoma.
Però, c’è sempre un “però”, vero? Sebbene fantastica, questa tecnologia aveva un limite non da poco: analizzare tanti campioni diversi contemporaneamente, quello che noi chiamiamo multiplexing. Fare multiplexing è fondamentale: riduce i costi, minimizza le differenze dovute all’esperimento stesso e rende possibili analisi su larga scala, come quelle sulle singole cellule. L’idea è semplice: attacchi un’etichetta unica (un “barcode” molecolare) a ciascun campione, li mischi tutti insieme e li sequenzi in un colpo solo. Poi, grazie ai barcode, puoi risalire a quale sequenza appartiene a quale campione originale. Facile, no? Beh, non proprio con il dRNA-seq.
La sfida del multiplexing nel dRNA-seq
Vedete, nel sequenziamento a nanopori, le molecole passano attraverso un minuscolo poro proteico. Mentre passano, disturbano una corrente elettrica in modo caratteristico, generando un segnale elettrico che poi viene interpretato per capire la sequenza. Per controllare il passaggio, si usa una proteina “motore” attaccata a un adattatore di DNA legato all’RNA. Il problema è che gli adattatori usati nel dRNA-seq sono di DNA, e il software che “legge” l’RNA (il basecaller RNA) non è bravo a leggere il DNA. Quindi, i metodi classici di multiplexing usati per il DNA, dove il barcode è nell’adattatore e viene letto dal basecaller, qui non funzionano.
Si potrebbe pensare di attaccare barcode fatti di RNA direttamente all’RNA, ma questo complica la preparazione dei campioni, aggiunge passaggi, potenziali errori e costa un occhio della testa (gli oligo di RNA sono molto più cari di quelli di DNA!). Un’altra strada è stata quella di usare comunque barcode di DNA nell’adattatore e provare a riconoscerli analizzando direttamente il segnale elettrico grezzo, senza passare dal basecalling. Un metodo chiamato DeePlexiCon (DPC) ha provato a fare questo, trasformando il segnale in immagini e usando reti neurali profonde. Figo, ma richiedeva computer potentissimi (GPU) ed era lento, oltre a non essere precisissimo a causa delle naturali fluttuazioni nel segnale nanopore. Insomma, serviva qualcosa di meglio.
La nostra soluzione: arriva WarpDemuX!
Ed è qui che entriamo in gioco noi con WarpDemuX! Abbiamo pensato: e se invece di complicarci la vita con immagini e reti neurali pesanti, usassimo un approccio più “smart” e leggero, lavorando direttamente sul segnale grezzo? L’idea chiave è stata usare un algoritmo chiamato Dynamic Time Warping (DTW). Il DTW è fantastico perché è fatto apposta per confrontare serie temporali (come il nostro segnale elettrico) che possono avere velocità diverse – proprio come le molecole che a volte rallentano o accelerano nel nanoporo! Abbiamo integrato il DTW in un classificatore basato su machine learning molto efficiente, la Support Vector Machine (SVM).
Il risultato? WarpDemuX è ultra-veloce e molto accurato. Non solo: abbiamo anche sviluppato un metodo computazionale per disegnare set di barcode ottimizzati. In pratica, abbiamo cercato sequenze di barcode che generassero segnali elettrici il più diversi possibile tra loro, massimizzando la distanza misurata con il DTW. Questo rende ancora più facile per l’algoritmo distinguerli. Siamo partiti creando un set ottimizzato di 12 barcode (WDX12), ma il sistema è scalabile.
WarpDemuX alla prova del nove: lo studio del SARS-CoV-2
Per dimostrare che WarpDemuX non è solo teoria, l’abbiamo messo alla prova in uno scenario reale e importante: lo studio del virus SARS-CoV-2. Abbiamo infettato cellule con due varianti diverse del virus (quella originale e una modificata con GFP) e abbiamo prelevato campioni di RNA a diversi tempi dall’infezione (8, 24, 48, 72 ore), più campioni dal surnatante (il liquido dove “nuotano” i virus rilasciati) a 72 ore e controlli non infetti.
Abbiamo etichettato ogni campione con uno dei nostri 12 barcode WDX12, mischiato tutto e sequenziato su una singola flow cell MinION. WarpDemuX ha fatto il suo lavoro egregiamente: ha riconosciuto correttamente i barcode nel 95.4% delle letture di buona qualità! Anche impostando una soglia di confidenza molto alta (0.99) per essere sicurissimi di non mischiare dati tra campioni (specialmente quelli con poco RNA, come il surnatante), abbiamo mantenuto quasi il 70% delle letture, con una contaminazione crociata minima.
Questo ci ha permesso di fare cose fantastiche:
- Seguire la cinetica di replicazione del virus nel tempo, vedendo come l’RNA virale aumentava fino a 48 ore per poi calare, senza differenze apparenti tra le due varianti.
- Identificare e quantificare i diversi RNA subgenomici (sgRNA) prodotti dal virus, osservando come la loro composizione relativa rimanesse stabile nel tempo.
- Analizzare la lunghezza della coda poli(A). Abbiamo scoperto che l’RNA del SARS-CoV-2 ha code poli(A) più corte rispetto all’RNA della cellula ospite e che, nel tempo, compare una popolazione di RNA virali con code ancora più corte, soprattutto negli sgRNA cellulari, ma non nell’RNA presente nei virioni nel surnatante. Questo suggerisce meccanismi di regolazione o degradazione specifici!
Il tutto, ricordiamolo, da un singolo esperimento di sequenziamento grazie al multiplexing con WarpDemuX.
La ciliegina sulla torta: l’Adaptive Sampling specifico per barcode
Ma WarpDemuX ha un altro asso nella manica. La sua velocità pazzesca ci ha permesso di implementare una cosa fichissima del sequenziamento nanopore: l’adaptive sampling. In pratica, il sequenziatore può decidere in tempo reale, mentre una molecola sta passando nel poro, se continuare a leggerla o “respingerla” invertendo brevemente il voltaggio. Perché farlo? Beh, immaginate di avere nel mix campioni molto abbondanti e altri molto rari. Potreste dire al sequenziatore: “Ok, di questo campione ne ho già letto abbastanza, respingilo e passa al prossimo!”. Questo si chiama barcode balancing.
Con WarpDemuX, la decisione viene presa in una frazione di secondo (spesso in meno di 200 millisecondi da quando inizia a passare la coda poli(A) dell’RNA!), prima ancora che la parte “interessante” della molecola venga letta. Questo libera il poro molto più velocemente per analizzare altre molecole. Nel nostro esperimento con SARS-CoV-2, dove i campioni dal surnatante erano molto meno abbondanti di quelli cellulari, l’adaptive sampling guidato da WarpDemuX ha funzionato alla grande:
- Ha aumentato il numero totale di molecole campionate grazie al turnover più rapido dei pori.
- Ha reso la copertura tra i diversi barcode molto più uniforme.
- Ha arricchito i campioni a bassa abbondanza (quelli del surnatante) dal 33% al 73%!
È come avere un buttafuori intelligente all’ingresso del poro che fa entrare preferenzialmente gli ospiti VIP (i campioni rari)!
Sempre al passo coi tempi: WarpDemuX e la nuova chimica RNA004
La tecnologia nanopore è in continua evoluzione. Recentemente è uscita una nuova chimica di sequenziamento, la SQK-RNA004, con un poro specifico per l’RNA e un motore più veloce. Ovviamente, ci siamo chiesti: WarpDemuX funzionerà ancora? La risposta è sì! Abbiamo ri-addestrato i nostri modelli sui dati generati con la nuova chimica (usando gli stessi barcode WDX12 ottimizzati per la vecchia versione) e le performance sono rimaste eccellenti: accuratezza del 98-99% con una resa del 79-90% per il set da 12 barcode, e ancora meglio per set più piccoli.
E la velocità? Grazie ai miglioramenti nella chimica e all’integrazione di un metodo ancora più rapido per identificare il segnale dell’adattatore (il nostro tool ADAPTed), WarpDemuX sulla RNA004 è diventato una scheggia: demultiplexa 100.000 letture in soli 2-3 minuti su un normale laptop! Abbiamo anche introdotto un sistema di calibrazione che permette all’utente di scegliere il livello di accuratezza desiderato, bilanciandolo con la resa.
Perché WarpDemuX fa la differenza?
Insomma, cosa ci portiamo a casa? WarpDemuX rappresenta un bel passo avanti per il dRNA-seq. Rende il multiplexing non solo possibile, ma anche accurato, veloce, economico e scalabile. Questo apre le porte a esperimenti più complessi e informativi, permettendo di sfruttare appieno le potenzialità uniche del sequenziamento diretto dell’RNA per studiare il trascrittoma e l’epitranscrittoma in modi prima impensabili. L’integrazione con l’adaptive sampling, poi, è la vera svolta per analizzare campioni difficili o per ottimizzare l’uso delle costose flow cell.
Pensate alle possibilità: profilare rapidamente nuove varianti virali, studiare nel dettaglio la regolazione genica in diverse condizioni o tipi cellulari, esplorare le modifiche dell’RNA su larga scala… tutto in modo più efficiente e accessibile. Noi siamo davvero entusiasti e crediamo che strumenti come WarpDemuX aiuteranno a spingere ancora più in là i confini della ricerca nel campo dell’RNA.
Se siete curiosi e volete provarlo, trovate tutto il necessario (codice e istruzioni) su GitHub! [https://github.com/KleistLab/WarpDemuX]
Fonte: Springer