Salvare il Passato per Capire il Futuro: Il Tesoro Nascosto dei Dati Ecologici Britannici
Ciao a tutti! Oggi voglio parlarvi di qualcosa che mi sta molto a cuore: il valore nascosto nei dati, specialmente quelli vecchi, quelli che rischiano di finire dimenticati in qualche archivio polveroso. Viviamo in un’epoca in cui la crisi della biodiversità è sulla bocca di tutti, ed è fondamentale capire come sono cambiate le cose nel tempo per poter agire in modo efficace. Ecco, immaginate di avere tra le mani decenni di informazioni preziose sull’ambiente, raccolte con metodi rigorosi… ma di rischiare di perderle per sempre. Sembra un incubo, vero? Eppure, è successo, e sta succedendo.
L’Eredità di Bunce: Un Tesoro da Proteggere
Negli anni ’70, un pioniere dell’ecologia, il Professor Robert Bunce (per gli amici, Bob), insieme ai suoi colleghi della Nature Conservancy (oggi parte del UK Centre for Ecology e Hydrology – UKCEH), ha gettato le basi per una serie di indagini ecologiche strategiche in Gran Bretagna. Parliamo dei famosi Countryside Surveys, ma anche di studi specifici sui boschi, sulle isole Shetland, sulla Cumbria… insomma, un lavoro immenso. Questi studi non erano semplici passeggiate nella natura: si basavano su campionamenti statistici robusti, metodi standardizzati e ripetibili per monitorare piante vascolari, alberi, suoli, caratteristiche del paesaggio. Un approccio rivoluzionario per l’epoca, pensato fin dall’inizio per poter essere ripetuto nel tempo e misurare oggettivamente i cambiamenti. Pensate che il primo Countryside Survey nazionale della Gran Bretagna risale al 1978! Da allora, è stato ripetuto più volte, diventando il programma di monitoraggio ecologico su larga scala più longevo del Regno Unito.
Il Rischio Concreto: Dati Fantasma
Il problema? Mentre i dati più recenti dei Countryside Surveys sono stati mantenuti con cura, molti dei dataset storici di Bunce, quelli dagli anni ’70 fino ai primi anni ’90, erano sull’orlo dell’oblio. Perché? Beh, per una serie di motivi che chiunque lavori con dati datati conosce bene:
- Tecnologia obsoleta: Molti dati erano su supporti illeggibili oggi, come i nastri per i vecchi computer PDP-8. Immaginate la frustrazione!
- Mancanza di gestione e risorse: Per anni, l’enfasi è stata sulla raccolta di nuovi dati e sulla pubblicazione dei risultati più recenti. La cura e l’organizzazione dei dati storici non erano una priorità, e mancavano fondi e personale dedicato.
- Metadati incompleti o perduti: I metadati – le informazioni essenziali su “chi, cosa, quando, dove, come” sono stati raccolti i dati – tendono a degradarsi nel tempo, specialmente quando chi li ha raccolti non è più disponibile. È quella che viene chiamata “entropia dell’informazione”. Purtroppo, con la scomparsa del Professor Bunce nel 2022, abbiamo raggiunto il punto finale di questa entropia per i suoi dataset.
- Complessità dei dati: Questi survey raccoglievano informazioni diversificate (mappe, campioni di suolo, elenchi di specie, foto…), rendendo la gestione e l’organizzazione una vera sfida.
Si stima che l’80% dei dati ecologici usati in pubblicazioni scientifiche fino agli anni ’90 sia andato perso. Perso nel senso di non essere più FAIR (Findable, Accessible, Interoperable, Reusable – Reperibili, Accessibili, Interoperabili e Riutilizzabili). Dati che non sono FAIR sono dati “a rischio”, destinati a essere dimenticati e, alla fine, eliminati. Un vero spreco di conoscenza.

La Nostra Missione di Salvataggio: Un Approccio in Cinque Passi
Fortunatamente, negli anni 2010 è partita una vera e propria operazione di salvataggio e salvaguardia. Non è stato semplice, ha richiesto un decennio di lavoro, ma ci ha permesso di mettere a punto un approccio strutturato che spero possa essere utile anche ad altri. Lo abbiamo chiamato il nostro “piano in cinque passi”:
- Identificare le Risorse Disponibili: Il primo passo, ovvio ma cruciale, è stato scovare tutto il materiale esistente. Documenti cartacei (manuali, fogli di campo, mappe, foto, appunti), eventuali file digitali superstiti… Abbiamo cercato ovunque: archivi ufficiali, uffici, casseforti ignifughe, drive di rete e persino, in un caso, una rimessa in giardino!
- Elaborare i Dataset: Qui inizia il lavoro “sporco”. Digitalizzare i documenti cartacei (decifrando calligrafie a volte ostiche!), convertire formati, ma soprattutto progettare uno schema dati sensato (un “data schema”) per organizzare tutto in modo logico all’interno di un database relazionale (come MS Access o Oracle). Bisogna capire come collegare le varie informazioni (es. dati di un plot specifico al sito generale).
- Assemblare i Metadati: Mentre si lavora sui dati, emergono mille domande: cosa significa quel codice? Qual era l’unità di misura? Come era strutturato esattamente l’esperimento? È fondamentale rispondere a queste domande usando i documenti disponibili e, finché è stato possibile, parlando direttamente con Bob Bunce. Queste risposte diventano i metadati, la “carta d’identità” del dataset, senza la quale i dati sono quasi inutilizzabili.
- Produrre Output Utilizzabili: Una volta che i dati sono organizzati e capiti, bisogna creare dei “prodotti” finali che siano facili da usare per altri ricercatori. Questo significa esportare i dati in formati robusti e non proprietari (come i file .csv) e preparare una documentazione chiara e completa (i metadati in formato “leggibile”).
- Pubblicare e Diffondere: L’ultimo passo è depositare questi prodotti (dati + metadati) in un archivio dati affidabile e a lungo termine, come il NERC Environmental Information Data Centre (EIDC) nel nostro caso. Ottenere un DOI (Digital Object Identifier) rende il dataset citabile, come un articolo scientifico. Spesso, si accompagna la pubblicazione dei dati con un articolo su una rivista scientifica o un “data journal” che li descrive.

Le Sfide (e le Soddisfazioni) del Lavoro
Non vi nascondo che le sfide sono state tante. La mancanza iniziale di fondi e riconoscimento per questo tipo di lavoro “dietro le quinte” è stata frustrante. Richiede tempo, dedizione e competenze specifiche, a cavallo tra ecologia, informatica e archivistica. Non è il tipo di attività che porta gloria accademica immediata. Decifrare vecchi codici, capire protocolli dimenticati, ricostruire relazioni tra tabelle… a volte è stato un vero puzzle. E poi c’è la questione della confidenzialità: le posizioni esatte dei siti di campionamento, spesso su terreni privati, devono rimanere riservate per proteggere la privacy dei proprietari e l’integrità scientifica dei campioni (evitare che qualcuno “modifichi” il sito sapendo di essere monitorato). Questo pone un limite all’ideale di “open data” completamente aperti, ma è un compromesso necessario per garantire la continuità dei monitoraggi futuri.
Ma la soddisfazione di vedere questi dati tornare alla luce, pronti per essere usati, è impagabile. Pensate che grazie al recupero dei dati del Woodland Survey del 1971, è stato possibile finanziare e realizzare un re-survey completo tra il 2018 e il 2022. Cinquant’anni dopo! Avere i dati storici pronti e utilizzabili ha permesso di analizzare i cambiamenti in modo tempestivo.

Perché Tutto Questo Sforzo? Il Valore Inestimabile dei Dati Storici
Ma perché sbattersi tanto per dei vecchi dati? Perché sono una miniera d’oro!
- Comprendere il cambiamento a lungo termine: Forniscono una finestra temporale profonda, essenziale per capire le tendenze reali della biodiversità e degli ecosistemi, al di là delle fluttuazioni di breve periodo.
- Stabilire baseline: Ci dicono com’era la situazione “prima”, un punto di riferimento cruciale per valutare l’impatto delle nostre azioni e l’efficacia delle politiche di conservazione e ripristino.
- Informare le politiche: I dati dei Countryside Surveys, ad esempio, hanno quantificato il drammatico calo delle siepi negli anni ’80, portando direttamente all’Hedgerows Regulations Act del 1997 per proteggerle.
- Nuove analisi e scoperte: I dati salvati possono essere rianalizzati con tecniche moderne (anche intelligenza artificiale!) per rispondere a domande che i ricercatori originali non si erano nemmeno posti.
- Base per nuovi monitoraggi: Come visto per i boschi, avere i dati storici rende possibile e molto più significativo ripetere i survey, misurando il cambiamento con precisione. I dati recuperati per Shetland, Cumbria e gli “Key Habitats” sono lì, pronti per future campagne.
In un mondo che finalmente si sta rendendo conto dell’urgenza della crisi ecologica e fissa obiettivi ambiziosi come quelli dell’accordo di Kunming-Montreal, avere accesso a dati storici robusti non è un lusso, è una necessità.
Lezioni Apprese: Un Messaggio per Tutti Noi
Questa avventura nel passato ci ha insegnato molto, e credo che queste lezioni siano valide per chiunque si occupi di scienza e dati:
- L’ crescente valore dei dati storici: Non sottovalutiamo mai il potenziale nascosto negli archivi. Ciò che oggi sembra “vecchio”, domani potrebbe essere fondamentale.
- Risorse e riconoscimento per il data rescue: Il salvataggio dei dati è un lavoro scientifico a tutti gli effetti e merita finanziamenti, tempo e riconoscimento adeguati. Non è un’attività secondaria.
- Il valore inestimabile degli “originatori”: Parlare con chi ha raccolto i dati, finché possibile, è cruciale per capirne il contesto, le sfumature, i potenziali problemi.
- Capire utenti e utilizzi: Prima di salvare e pubblicare dati, chiediamoci: a chi potrebbero servire? Per quali scopi? Questo aiuta a presentarli nel modo più utile possibile.

L’eredità scientifica di Bob Bunce, racchiusa in questi preziosi dataset, è ora al sicuro e disponibile per le generazioni future di ricercatori, policy maker e chiunque voglia capire e proteggere il nostro ambiente. È stata una lunga strada, ma ne è valsa assolutamente la pena. Salvare il passato, in questo caso, significa davvero investire nel nostro futuro.
Fonte: Springer
