Schermi di computer in un laboratorio mostrano diverse pipeline bioinformatiche complesse e visualizzazioni di dati genomici che convergono verso uno schermo centrale che mostra un'analisi di cluster unificata. Obiettivo grandangolare 20mm, messa a fuoco nitida sugli schermi, leggero motion blur sulle attrezzature di laboratorio sullo sfondo, a rappresentare l'integrazione di dati diversi.

Geni Sotto la Lente: Far Dialogare i Laboratori nella Sorveglianza dei Patogeni Alimentari

Ciao a tutti! Oggi voglio parlarvi di un argomento che mi sta molto a cuore e che riguarda qualcosa che tocca le vite di tutti noi: la sicurezza alimentare. Nello specifico, voglio raccontarvi di una sfida affascinante nel mondo della genomica applicata alla sorveglianza delle malattie trasmesse da alimenti e acqua (le cosiddette FWD, Food and Waterborne Diseases). Immaginate tanti investigatori che cercano di risolvere lo stesso caso, ma ognuno usa strumenti e metodi leggermente diversi. Riusciranno a comunicare efficacemente e a mettere insieme i pezzi del puzzle? Ecco, nel campo della sorveglianza genomica dei batteri cattivi che possono contaminare il cibo, la situazione è un po’ questa.

Il Problema: Tante Pipeline, Una Sola Salute

Negli ultimi anni, il sequenziamento dell’intero genoma (Whole-Genome Sequencing, WGS) ha rivoluzionato il modo in cui tracciamo i patogeni alimentari come Listeria monocytogenes, Salmonella enterica, Escherichia coli e Campylobacter jejuni. Questi “superpoteri” genomici ci permettono di identificare focolai epidemici con una precisione mai vista prima. Il punto è che diversi laboratori, in diversi paesi e persino in diversi settori (salute umana, veterinaria, sicurezza alimentare), hanno sviluppato e adottato le proprie “pipeline” bioinformatiche per analizzare questi dati WGS.

Una pipeline non è altro che una sequenza di passaggi software per processare i dati grezzi del sequenziamento e arrivare a capire quanto due batteri siano geneticamente “parenti”. Alcune si basano sull’analisi degli alleli (varianti di geni specifici), come le famose cgMLST (core-genome MultiLocus Sequence Typing) o wgMLST (whole-genome MLST), altre si concentrano sulle differenze puntiformi nel DNA, i cosiddetti SNP (Single-Nucleotide Polymorphisms). Ognuna ha i suoi pro e i suoi contro, i suoi software preferiti, i suoi parametri specifici.

Questa eterogeneità, però, solleva un dubbio enorme: i risultati ottenuti con pipeline diverse sono davvero confrontabili? Se un laboratorio in Italia identifica un cluster di casi di Salmonellosi usando la sua pipeline “A”, e un laboratorio in Germania ne trova uno simile con la pipeline “B”, stiamo parlando della stessa epidemia? Capite bene che in un’ottica “One Health”, dove la salute umana, animale e ambientale sono interconnesse, e in un contesto di epidemie che non conoscono confini, questa mancanza di comunicazione ottimale è un bel problema.

Fotografia di un gruppo eterogeneo di scienziati che collaborano intensamente attorno a schermi di computer in un laboratorio moderno, visualizzando sequenze di DNA complesse e mappe geografiche con punti dati. Obiettivo prime 35mm, profondità di campo che mette a fuoco l'interazione collaborativa, sfocando leggermente lo sfondo del laboratorio.

Il Progetto BeONE: Unire le Forze per Capirci Meglio

Ed è qui che entro in gioco io, o meglio, il progetto europeo BeONE (parte del programma One Health EJP), in cui ho avuto la fortuna di collaborare. Undici istituti da tutta Europa, rappresentanti dei settori della salute umana, animale e alimentare, hanno unito le forze. Il nostro obiettivo? Valutare proprio questa “congruenza” tra le diverse pipeline WGS usate quotidianamente per la sorveglianza dei quattro patogeni che vi ho menzionato prima. Volevamo capire quanto i “cluster” (gruppi di batteri molto simili geneticamente, potenziali spie di un’epidemia) identificati da una pipeline corrispondessero a quelli identificati dalle altre.

Abbiamo preso dei dataset belli corposi per ogni batterio (parliamo di migliaia di genomi per specie!) e li abbiamo fatti analizzare da tutti i partner, ognuno con la propria pipeline di routine. Un lavoraccio, ve lo assicuro, che ha coperto una vasta gamma di approcci:

  • Pipeline basate su alleli (cgMLST/wgMLST) con diversi schemi (set di geni analizzati) e software (chewieSnake, INNUENDO-like, SeqSphere+, Bionumerics, MentaLiST).
  • Pipeline basate su SNP (snippySnake, WGSBAC, CSI Phylogeny, SnapperDB) con diversi metodi di allineamento e identificazione delle varianti.

Per poter confrontare i risultati in modo omogeneo, abbiamo usato uno strumento fantastico chiamato ReporTree, che ci ha permesso di ottenere le informazioni di clustering a tutte le possibili “distanze” genetiche per ogni pipeline.

Cosa Abbiamo Scoperto? Luci e Ombre della Comparabilità

Allora, quali sono stati i risultati di questo mega-confronto? La notizia generale è piuttosto buona: c’è una concordanza di fondo tra le pipeline basate sugli alleli (cg/wgMLST) per quasi tutti i batteri studiati. Questo significa che, a grandi linee, i gruppi identificati da una pipeline tendono a essere simili a quelli identificati dalle altre, specialmente quando si guardano i livelli di parentela più ampi (come quelli che corrispondono ai tradizionali Tipi Sequenziali – ST – o Complessi Clonali – CC).

Tuttavia, il diavolo, come si suol dire, sta nei dettagli.

  • Campylobacter jejuni fa eccezione: Per questo batterio, le differenze nel potere risolutivo degli schemi cgMLST usati (alcuni molto più grandi di altri) hanno portato a discrepanze marcate. Una pipeline con uno schema “corto” potrebbe raggruppare batteri che una pipeline con uno schema “lungo” terrebbe ben separati.
  • Differenze nell’identificazione dei focolai: Anche quando la concordanza generale è buona, abbiamo identificato differenze non trascurabili proprio al livello di risoluzione che ci interessa di più per la salute pubblica: quello dei focolai epidemici. Usando le soglie “standard” (ad esempio, 7 differenze alleliche per Listeria), non sempre le pipeline concordavano esattamente sulla composizione dei cluster.
  • La flessibilità è la chiave: Qui arriva una delle scoperte più interessanti! Abbiamo dimostrato che se si adotta un approccio più flessibile con le soglie (permettendo, ad esempio, una piccola variazione di 1-3 differenze alleliche in più o in meno rispetto alla soglia standard), la probabilità che due pipeline diverse identifichino esattamente lo stesso cluster epidemico aumenta significativamente, anche del 10%! Questo suggerisce che definire i casi di un focolaio basandosi su una soglia rigidissima e uguale per tutti potrebbe non essere l’approccio migliore in un contesto multi-laboratorio.
  • Non tutti i “tipi” sono uguali: Abbiamo anche confermato che diversi gruppi tradizionali (come i sierotipi di Salmonella o gli ST) hanno una diversità genetica interna molto variabile. Alcuni sono incredibilmente omogenei (tutti i batteri di quel tipo sono quasi identici), altri sono molto più eterogenei. Questo è importante quando si definisce un caso sospetto di epidemia: applicare la stessa soglia a un batterio “super clonale” o a uno molto più “variabile” potrebbe portare a conclusioni diverse.

Fotografia macro di colonie batteriche brillanti (possibilmente Salmonella o Listeria) che crescono su un terreno di coltura in una piastra di Petri. Obiettivo macro 90mm, illuminazione controllata da laboratorio che evidenzia i dettagli delle colonie, messa a fuoco precisa, sfondo sterile e sfocato.

SNP vs Alleli: Due Facce della Stessa Medaglia?

Un altro aspetto che abbiamo esplorato è stato il confronto tra le pipeline basate sugli alleli (cg/wgMLST), che sono sempre più lo standard per la sorveglianza di routine, e quelle basate sugli SNP, spesso usate per analisi più fini all’interno di un focolaio già identificato.

I risultati suggeriscono che le pipeline SNP, specialmente quando usano un genoma di riferimento specifico per l’ST o il sierotipo che si sta analizzando, tendono ad avere un potere discriminatorio uguale o superiore a quelle cgMLST. Questo si riflette nel fatto che, all’interno di un cluster definito da cgMLST, spesso si osserva una maggiore diversità in termini di SNP rispetto alle differenze alleliche.

Tuttavia, anche tra le pipeline SNP ci sono differenze, legate ad esempio ai criteri di qualità applicati, che possono influenzare notevolmente la risoluzione. Inoltre, la loro comparabilità è generalmente più complessa rispetto a quella delle pipeline alleliche. Questo rafforza l’idea che le cg/wgMLST siano più adatte come approccio di prima linea per la sorveglianza e il rilevamento di cluster, mentre le SNP rimangono uno strumento potente per “zoomare” sui dettagli all’interno di un focolaio specifico. A questo proposito, abbiamo anche testato un approccio “dinamico” di wgMLST, che aumenta automaticamente la risoluzione includendo geni accessori specifici del cluster, dimostrando che può essere un’alternativa promettente all’analisi SNP per ottenere maggiori dettagli intra-focolaio.

Visualizzazione astratta di flussi di dati digitali luminosi, simili a fibre ottiche, che convergono da diversi punti periferici (rappresentanti laboratori o paesi) verso un nodo centrale luminoso (rappresentante un database condiviso o una comprensione unificata). Obiettivo grandangolare 15mm, effetto di lunga esposizione con linee fluide, atmosfera tecnologica e futuristica.

Stabilità e Nomenclatura: Dare un Nome ai “Parenti” Genomici

Oltre ai focolai, il WGS è fondamentale per monitorare nel tempo le principali “famiglie” (lignaggi) di patogeni circolanti. Abbiamo identificato delle “regioni di stabilità” nelle nostre analisi: intervalli di distanza genetica in cui la composizione dei cluster rimane molto simile. Queste regioni, trovate in modo abbastanza concorde tra le diverse pipeline (tranne per il solito C. jejuni!), potrebbero essere la base per sviluppare o affinare sistemi di nomenclatura basati sul WGS, un po’ come un albero genealogico ad alta risoluzione per i batteri.

È stato interessante notare come queste regioni di stabilità spesso si sovrapponessero ai livelli di distanza genetica che meglio corrispondevano alle classificazioni tradizionali (ST, CC, sierotipi). Ad esempio, per Listeria, abbiamo trovato una forte congruenza con i CC intorno alle 400-500 differenze alleliche e con gli ST intorno alle 150-190. Questo non solo aumenta la fiducia nel passaggio al WGS, ma fornisce anche informazioni preziose: sapere che un certo ST è geneticamente molto omogeneo mentre un altro è più disperso è cruciale per interpretare correttamente i segnali della sorveglianza.

Allora, Cosa Portiamo a Casa?

Questo grande sforzo collaborativo ci ha insegnato molto. Innanzitutto, ha confermato che, sebbene la standardizzazione completa delle pipeline WGS sia forse un’utopia, la valutazione continua della comparabilità tra i metodi è non solo necessaria, ma assolutamente fattibile. Abbiamo sviluppato strumenti e metodologie che possono aiutare i laboratori a capire quanto i loro risultati siano “allineati” con quelli degli altri, sia a livello nazionale che internazionale.

In secondo luogo, abbiamo evidenziato l’importanza della flessibilità nelle soglie usate per definire i cluster epidemici, specialmente in contesti multi-laboratorio o multi-paese. Un approccio meno rigido, magari adattato al contesto specifico dell’epidemia e alla diversità genetica nota del ceppo coinvolto, potrebbe migliorare notevolmente la comunicazione e l’efficacia della risposta.

Infine, questo studio apre ottime prospettive per una cooperazione intersettoriale e internazionale più fluida. Capire come “traducono” le diverse pipeline è il primo passo per costruire un sistema di sorveglianza genomica One Health veramente integrato ed efficiente. La strada è ancora lunga, ma abbiamo dimostrato che gli strumenti per capirci meglio ci sono. Dobbiamo solo usarli!

Spero che questo viaggio nel mondo della genomica dei patogeni alimentari vi sia piaciuto e vi abbia fatto capire quanto lavoro complesso e collaborativo ci sia dietro la sicurezza di ciò che mangiamo. Alla prossima!

Un funzionario della sanità pubblica osserva pensieroso una mappa del mondo proiettata su un grande schermo, con punti dati luminosi che indicano focolai epidemici collegati da linee. Obiettivo zoom 50mm, messa a fuoco sull'espressione concentrata del funzionario, mappa leggermente sfocata, atmosfera seria ma orientata alla soluzione.

Fonte: Springer

Articoli correlati

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *