DNA Maschile e Alberi Genealogici: Rivoluzioniamo l’Interpretazione delle Corrispondenze Y-STR!
Ciao a tutti! Oggi voglio parlarvi di qualcosa che mi appassiona profondamente e che potrebbe cambiare le carte in tavola nel mondo della genetica forense. Immaginate la scena di un crimine, magari un’aggressione. Spesso, l’unica traccia biologica maschile che riusciamo a isolare è minima, magari mista a quella della vittima. Qui entrano in gioco i marcatori Y-STR. Cosa sono? Sono brevi sequenze ripetute di DNA che si trovano sulla parte del cromosoma Y che non si ricombina, quella che passa quasi immutata di padre in figlio. Proprio per questa loro specificità maschile, sono diventati uno strumento preziosissimo, specialmente nei casi di violenza sessuale, per identificare il donatore maschile.
Il Dilemma Decennale: Quanto Vale Davvero una Corrispondenza Y-STR?
Sembra semplice, no? Troviamo una traccia sulla scena del crimine, la analizziamo, otteniamo un profilo Y-STR. Poi lo confrontiamo con quello di un sospettato. Se corrispondono, bingo! Beh, non proprio. Ed è qui che le cose si complicano, e parecchio. Per decenni, noi addetti ai lavori ci siamo interrogati su come quantificare il “peso” probatorio di una corrispondenza Y-STR. L’approccio comune, quasi istintivo, è stato quello di cercare la frequenza di quel profilo Y-STR in un database di popolazione e usare quel numero come stima della probabilità che la corrispondenza sia casuale (cioè, che la traccia provenga da un uomo non imparentato con il sospettato).
Ma c’è un problema enorme, anzi due. Primo: il cromosoma Y, non ricombinando, fa sì che un uomo condivida tipicamente lo stesso profilo Y-STR con molti dei suoi parenti maschi stretti lungo la linea paterna (padre, fratelli, zii paterni, cugini paterni…). Quindi, una corrispondenza non punta il dito solo sul sospettato, ma su un intero gruppo familiare. A meno di non poter escludere tutti i parenti maschi con altre prove, l’identificazione non è così certa. Secondo: equiparare la frequenza in un database alla probabilità di corrispondenza casuale è, diciamocelo, scientificamente traballante. I database contengono per lo più individui non imparentati, campionati da popolazioni specifiche. Ma la “popolazione” rilevante in un caso forense è quella dei possibili donatori alternativi, che quasi certamente include parenti del sospettato, i quali sono sottorappresentati o assenti nei database! Questo approccio rischia di essere “anti-conservativo”, cioè di sottostimare la probabilità di una corrispondenza casuale, svantaggiando ingiustamente il sospettato. Questo dibattito va avanti da anni, senza un consenso chiaro.
Una Nuova Prospettiva: Guardiamo all’Albero Genealogico!
Di fronte a questo stallo, abbiamo pensato: e se cambiassimo completamente approccio? Invece di cercare frequenze in database generici, perché non concentrarci proprio sul punto critico, la famiglia del sospettato? L’idea che vi propongo è questa: dividiamo l’insieme dei potenziali donatori alternativi (tutti gli uomini tranne il sospettato) in due gruppi distinti:
- I parenti maschi stretti del sospettato, lungo la linea paterna (quello che chiameremo il suo “pedigree” o albero genealogico maschile).
- Tutti gli altri uomini nella popolazione.
Per il secondo gruppo (gli “altri”), possiamo calcolare un limite superiore abbastanza facilmente per la probabilità di corrispondenza, basandoci sui tassi di mutazione dei marcatori Y-STR e sul numero minimo di generazioni che li separano dal sospettato. Ma la vera sfida, e la vera novità, sta nel calcolare questa probabilità per il primo gruppo, il pedigree.
La Magia della Simulazione: Ricostruire i Profili Mancanti
Ed è qui che entra in gioco il nostro nuovo framework matematico. Abbiamo sviluppato un metodo che utilizza una tecnica statistica potente chiamata “campionamento per importanza” (importance sampling). In pratica, cosa facciamo? Prendiamo l’albero genealogico maschile del sospettato. Alcuni membri potrebbero essere stati genotipizzati (cioè, conosciamo il loro profilo Y-STR), altri no. Il nostro sistema simula migliaia, o anche milioni, di volte i possibili profili Y-STR dei membri non genotipizzati, basandosi su:
- La struttura esatta del pedigree (chi è figlio di chi).
- I profili Y-STR dei membri che conosciamo (incluso il sospettato).
- I tassi di mutazione specifici per ogni marcatore Y-STR utilizzato (sappiamo con che frequenza un marcatore può cambiare da una generazione all’altra).
Attraverso queste simulazioni, possiamo stimare con grande accuratezza la probabilità che uno o più membri non testati del pedigree abbiano un profilo Y-STR identico a quello del sospettato (e quindi della traccia). Questo ci dà una stima solida e specifica per *quel* caso, per *quella* famiglia.
Messo alla Prova: Funziona!
Ovviamente, non ci siamo fermati alla teoria. Abbiamo implementato questo framework in un software (usando Python) e lo abbiamo testato rigorosamente. Abbiamo usato alberi genealogici “elementari” di diversa complessità, simulando vari scenari con un singolo marcatore Y-STR e diversi tassi di mutazione (inclusi alcuni molto alti, tipici dei cosiddetti RM Y-STR, o Y-STR a mutazione rapida, che sono ancora più discriminanti ma anche più problematici per l’approccio basato sui database). I risultati? Sono stati estremamente incoraggianti! Le stime di probabilità ottenute con le nostre simulazioni si avvicinano moltissimo ai risultati analitici corretti (quando calcolabili), soprattutto aumentando il numero di simulazioni. Questo ci conferma che l’approccio è valido e l’implementazione software funziona come dovrebbe.
Perché è Importante: Verso una Giustizia più Equa
Ma al di là della matematica e del codice, perché tutto questo è così rilevante? Perché offre una soluzione più appropriata e valida al problema annoso dell’interpretazione delle corrispondenze Y-STR. Invece di affidarci a frequenze di popolazione che, come abbiamo visto, possono essere fuorvianti e potenzialmente ingiuste, questo metodo calcola una probabilità di corrispondenza specifica per il contesto familiare del sospettato. Se questa probabilità risulta alta, significa semplicemente che l’evidenza Y-STR, da sola, non è così forte per quel caso specifico. Non stiamo cercando di ottenere a tutti i costi la probabilità più bassa possibile per favorire l’accusa; stiamo cercando di fornire una valutazione corretta del peso dell’evidenza. Starà poi agli investigatori concentrarsi sull’ipotesi familiare (Zf, nel gergo tecnico), cercando di escludere altri membri del pedigree tramite test genetici diretti o prove non genetiche (alibi, età, luogo di residenza, etc.).
Siamo consapevoli che questo approccio si discosta dalle raccomandazioni più recenti dell’International Society of Forensic Genetics (ISFG), che tendono ancora a basarsi molto sulle frequenze dei database. Tuttavia, secondo noi, ignorare il contesto familiare del sospettato e fare affidamento unicamente su stime di frequenza, specialmente con i moderni pannelli di Y-STR sempre più diversificati, non rispetta pienamente gli standard di equità e giustizia che dovrebbero guidarci.
Le Sfide e la Strada da Percorrere
Certo, non è tutto rose e fiori. Questo approccio ha dei prerequisiti. Richiede una conoscenza dettagliata dell’albero genealogico maschile del sospettato, informazione che non sempre è facile da ottenere, specialmente in certi contesti geografici o legali. Inoltre, per essere davvero efficace, idealmente alcuni parenti maschi dovrebbero essere disponibili per la genotipizzazione, e questo dipende dalla loro volontà di collaborare e dalle normative legali vigenti (genotipizzare persone non sospettate è spesso complesso). Infine, richiede un cambio di mentalità: i genetisti forensi dovrebbero collaborare più strettamente con le forze dell’ordine e gli investigatori per ottenere le informazioni genealogiche e i campioni necessari.
Il nostro lavoro futuro si concentrerà sul perfezionamento del software, testandolo su scenari più complessi (più marcatori, pedigree più grandi, tassi di mutazione reali), valutando come gestire marcatori multi-copia o alleli frazionati, e rendendolo uno strumento pratico e accessibile alla comunità forense. L’obiettivo finale è fornire uno strumento che permetta un’interpretazione più giusta e scientificamente fondata delle corrispondenze Y-STR. Se questo approccio entrerà nella routine forense dipenderà molto dall’apertura delle forze dell’ordine e del sistema giudiziario verso questo cambiamento, che comporta sicuramente un lavoro aggiuntivo ma, a nostro avviso, necessario per una giustizia più accurata.
In sintesi, abbiamo sviluppato un nuovo modo di pensare e calcolare il valore di una corrispondenza del DNA maschile, mettendo l’albero genealogico al centro dell’analisi. È un passo avanti, secondo me affascinante, verso la soluzione di un problema che ha tenuto banco nella genetica forense per troppo tempo. Speriamo possa contribuire a rendere le analisi più solide e il processo giudiziario più equo.
Fonte: Springer