Contare le Balene con il DNA: Un’Avventura Genetica Senza Età
Ciao a tutti! Avete mai provato a contare qualcosa che si muove costantemente, vive nelle profondità oceaniche e emerge solo per brevi istanti? È una bella sfida, vero? Ecco, questo è un po’ il dilemma che affrontiamo noi scienziati quando cerchiamo di capire quante sono le balene franche australi (Eubalaena australis), magnifici giganti che solcano gli oceani del sud. I metodi tradizionali, come il “mark-recapture” (marca e ricattura), dove si cerca di ‘riavvistare’ individui già identificati, a volte non bastano, specialmente se le ricatture sono poche. Ma la scienza, si sa, è piena di sorprese e soluzioni ingegnose!
La Magia del CKMR: Trovare Parenti per Contare Individui
Negli ultimi anni è emersa una tecnica affascinante chiamata Close-Kin Mark-Recapture (CKMR). L’idea di base è geniale: invece di aspettare di “ricatturare” lo *stesso* individuo, cerchiamo i suoi parenti stretti nel campione! Se troviamo un genitore, un figlio, o magari un fratellastro di un individuo già campionato, è come se avessimo effettuato una “ricattura genetica”. Fantastico, no? Questo metodo sfrutta le informazioni nascoste nel DNA, raccolto magari con una piccola biopsia indolore, per svelare legami di parentela e, da lì, stimare parametri fondamentali come la dimensione della popolazione.
Il Problema dell’Età: Un Ostacolo Comune
Di solito, per far funzionare bene il CKMR, conoscere l’età degli animali campionati è un’informazione preziosissima. L’età ci aiuta a calcolare meglio le probabilità di trovare un parente. Ma cosa succede quando, come nel caso di molte balene studiate con metodi non letali (tipo le biopsie), l’età è un mistero? Chiedere la carta d’identità a una balena è, diciamo, complicato! Questo è esattamente il problema che abbiamo affrontato in un nostro recente studio. Come possiamo applicare il CKMR quando l’età dei nostri “soggetti” è sconosciuta?
Senza Età? Nessun Problema (o Quasi): Sviluppare Nuove Formule
Ci siamo rimboccati le maniche e abbiamo sviluppato delle formule matematiche specifiche per questa situazione. Abbiamo dovuto fare alcune ipotesi semplificative, come spesso accade nella scienza per rendere i modelli trattabili:
- Abbiamo ipotizzato di campionare casualmente solo gli adulti.
- Abbiamo assunto che la popolazione avesse raggiunto una distribuzione stabile dell’età (un concetto demografico che indica un equilibrio nelle proporzioni tra le varie fasce d’età).
- Abbiamo considerato la mortalità degli adulti indipendente dall’età (una volta raggiunta la maturità, il rischio di morire è costante).
- Abbiamo ipotizzato una riproduzione casuale.
- Infine, abbiamo assunto che il campionamento stesso non influenzasse la mortalità o la riproduzione (cosa vera per le biopsie).
Con queste basi, abbiamo derivato le formule per calcolare la probabilità di campionare coppie di parenti di primo grado (genitore-figlio, PO) e di secondo grado (nonno-nipote, GP; fratellastri, HS). Immaginate di dover calcolare quante probabilità ci sono che, pescando a caso due individui dalla popolazione, questi siano madre e figlio, oppure nonna e nipote, o magari fratellastri da parte di un genitore. Le nostre formule fanno proprio questo, tenendo conto del tempo trascorso tra i campionamenti dei due individui ((Delta t)) e dei parametri vitali della popolazione (come il tasso di crescita ‘r’ e il tasso di mortalità ‘d’).

Il Caso Studio: Le Balene Franche Australi
Per mettere alla prova il nostro metodo “senza età”, abbiamo usato un dataset reale: campioni di DNA prelevati da 161 balene franche australi. Questi campioni provenivano da individui avvistati nel settore Indo dell’Antartide e a sud-ovest dell’Australia. Avevamo a disposizione i profili genetici basati su 14 marcatori microsatelliti. Il problema? Questi 14 marcatori non sono potentissimi. Non ci permettono di dire con certezza assoluta “questi due sono madre e figlio” o “questi sono fratellastri”. C’è sempre un margine di incertezza.
Affrontare l’Incertezza Genetica
Come abbiamo gestito questa incertezza? Abbiamo usato un approccio statistico chiamato “modello a mistura”. In pratica, invece di assegnare una parentela certa a ogni coppia, calcoliamo la probabilità che quella coppia appartenga a *ciascuna* delle categorie di parentela possibili (genitore-figlio, nonno-nipote, fratellastro, non imparentati), basandoci sui loro profili genetici (usando i cosiddetti punteggi LOD, Log Odds). Poi combiniamo queste probabilità con le probabilità di campionamento derivate dalle nostre formule “senza età”. Sommiamo il contributo di tutte le possibili coppie nel nostro campione (ben 12880 coppie, dopo aver escluso quelle campionate troppo vicine nel tempo e nello spazio per evitare bias legati a gruppi familiari) per costruire una “pseudo-verosimiglianza”. Massimizzando questa funzione, otteniamo le stime dei parametri che ci interessano: la dimensione della popolazione all’inizio del periodo di campionamento ((N_0)), il tasso di crescita (r) e il tasso di mortalità (d).
Cosa Abbiamo Scoperto (con Cautela)
Applicando il nostro modello ai dati delle balene franche, abbiamo ottenuto delle stime. Ad esempio, abbiamo stimato una dimensione della popolazione adulta ((N_0)) di circa 901 individui nel 1994 (l’inizio del nostro periodo di riferimento) e un certo tasso di crescita e mortalità. Il modello matematico ha funzionato, ha prodotto risultati biologicamente plausibili.
MA… c’è un grosso “ma”. Le incertezze associate a queste stime sono molto alte. Cosa significa? Che il valore “vero” potrebbe essere abbastanza diverso da quello stimato. Immaginate una stima con margini molto, molto larghi. Perché tutta questa incertezza? Principalmente per due motivi:
- I 14 marcatori microsatelliti non sono abbastanza informativi per distinguere bene le parentele.
- Il modello stesso ha delle difficoltà di “identificabilità”, specialmente quando non c’è informazione sull’età e il campionamento avviene in un periodo relativamente breve rispetto alla vita delle balene. In pratica, diventa difficile separare nettamente l’effetto del tasso di crescita (r) da quello della mortalità (d), e questi a loro volta sono correlati con la stima della dimensione della popolazione ((N_0)).
Abbiamo visualizzato questa incertezza: la traiettoria stimata della popolazione nel tempo ha una “fascia di confidenza” molto ampia. Se invece assumessimo di conoscere ‘r’ e ‘d’ (cosa che non possiamo fare senza dati sull’età), la fascia si restringerebbe notevolmente.

Quanto sono Robuste le Nostre Ipotesi? La Prova di Sensibilità
Ci siamo anche chiesti: quanto cambiano i risultati se modifichiamo leggermente alcune delle nostre ipotesi iniziali? Ad esempio:
- E se l’età di maturità ((alpha)) fosse diversa da 9 anni (il valore che abbiamo usato)?
- E se la riproduzione non fosse perfettamente casuale, ma ci fosse una certa variabilità nel successo riproduttivo tra individui ((gamma_1 > 0))? Questo influenza soprattutto il numero atteso di fratellastri.
- E se avessimo ignorato parenti un po’ più distanti (come i primi cugini, FHC) che potrebbero essere confusi con i non imparentati ((gamma_2 > 0))?
- E se il tasso di errore nel genotipaggio ((varepsilon)) fosse leggermente diverso?
Abbiamo fatto delle analisi di sensibilità, cambiando uno alla volta questi parametri “fissi” e ri-stimando (N_0), r e d. Abbiamo visto che i risultati cambiano, a volte anche in modo significativo, e in alcuni casi il modello diventa instabile (ad esempio, tende a stimare r e d vicini a zero), sottolineando ancora una volta la delicatezza delle stime con dati limitati. Ad esempio, aumentare l’età di maturità ipotizzata tende a far diminuire la stima di (N_0). Introdurre variabilità riproduttiva o considerare l’effetto di parenti più distanti tende invece ad aumentarla. Questo ci dice che le nostre ipotesi iniziali hanno un impatto e che servono dati migliori per ridurre queste incertezze.
Le Sfide e il Futuro del CKMR Senza Età
Questo lavoro dimostra che il CKMR può, in linea di principio, funzionare anche senza informazioni sull’età, ma evidenzia anche le sfide. L’assenza di età rende più difficile stimare i parametri demografici (r e d), specialmente se il campionamento avviene in un breve lasso di tempo. È un po’ come cercare di capire la dinamica di una folla guardando solo una fotografia istantanea invece di un video.
Le ipotesi semplificatrici (popolazione stabile, mortalità costante, ecc.) sono necessarie ma potrebbero non rispecchiare perfettamente la realtà complessa delle popolazioni selvatiche. Inoltre, l’incertezza genetica rimane un punto cruciale: servirebbero marcatori più potenti (come un gran numero di SNP, polimorfismi a singolo nucleotide) per distinguere meglio le parentele, anche quelle più distanti, e ridurre la necessità del modello a mistura.
L’uso dei fratellastri è particolarmente delicato, perché il loro numero atteso dipende non solo dalla dimensione della popolazione ma anche dalla varianza nel successo riproduttivo, un parametro difficile da stimare.

Un Passo Avanti, Nonostante Tutto
Nonostante le sfide e le incertezze emerse nel caso specifico delle balene franche australi con i dati attuali, lo sviluppo di un framework CKMR che non richiede l’età è un passo avanti importante. Apre la porta all’applicazione di questo potente metodo a molte specie elusive per cui ottenere stime di età affidabili è difficile o impossibile. Certo, l’ideale sarebbe avere sia dati genetici potenti sia informazioni sull’età (magari da nuovi metodi molecolari di datazione?), ma nel frattempo, abbiamo uno strumento in più nella nostra cassetta degli attrezzi per cercare di capire e proteggere queste meravigliose creature degli abissi. La ricerca continua!
Fonte: Springer
