Prevedere il Cancro con Google? Una Svolta Rivoluzionaria!
Ammettiamolo, quando si parla di cancro, un brivido corre lungo la schiena di tutti. È una delle principali cause di morte a livello globale, responsabile di circa 10 milioni di decessi all’anno secondo l’Organizzazione Mondiale della Sanità (OMS). Un dato spaventoso, quasi una morte su sei. E se vi dicessi che c’è un modo nuovo, più rapido e potenzialmente più accurato per prevedere quanti nuovi casi di cancro ci saranno? Sembra quasi fantascienza, ma è proprio quello di cui voglio parlarvi oggi.
La Sfida della Previsione: Un Ritardo Cronico
Uno dei grossi problemi che affrontiamo nella lotta contro il cancro è il ritardo con cui riceviamo i dati sull’incidenza, cioè sul numero di nuovi casi. Pensate che le cifre ufficiali arrivano con un ritardo di 2-4 anni! Questo perché raccogliere, compilare, controllare e diffondere questi dati richiede tempo, tantissimo tempo. E perché è così importante avere previsioni accurate? Semplice: per la pianificazione sanitaria. Sapere in anticipo quale sarà il “peso” del cancro permette alle organizzazioni sanitarie di allocare le risorse giuste per la diagnosi, il trattamento e la riabilitazione.
Storicamente, per fare queste previsioni ci siamo affidati a diversi metodi. Negli ultimi quarant’anni, il modello più gettonato è stato l’Age-Period-Cohort (APC). In pratica, questo modello descrive l’incidenza del cancro come una somma di effetti legati all’età, al periodo di diagnosi e alla coorte di nascita. Il problema è che queste tre variabili sono interconnesse (Coorte = Periodo – Età), il che crea un inghippo statistico noto come “problema di identificazione”. Risultato? Spesso il modello APC tende a sovrastimare i casi di cancro, e nonostante i tentativi di correggerlo, resta complicato e non sempre super affidabile.
Entra in Scena Google Trends: L’Intuizione Geniale
E qui arriva la parte che mi ha davvero affascinato. Molti anni fa, Google ha lanciato uno strumento gratuito e accessibile a tutti: Google Trends. Questo strumento ci mostra la popolarità di specifiche ricerche in determinati periodi e luoghi. Avete presente quei grafici che mostrano l’interesse per un argomento nel tempo? Ecco, quello è il Relative Search Volume Index (RSVI). Un punteggio di 100 significa che l’argomento è al top della popolarità in quel momento e luogo, mentre 55 indica che è popolare al 55% rispetto al picco massimo.
Google Trends non è una novità assoluta per il mondo della ricerca. È stato usato in finanza per prevedere l’andamento dei mercati azionari, nel turismo, nel business, nella moda e persino nell’industria petrolifera. E, cosa più importante per noi, nel settore sanitario. Ci sono stati studi che hanno esplorato l’uso di Google Trends per prevedere epidemie di influenza, dengue, MERS-CoV, morbillo, Ebola e Zika. L’idea di base è che l’interesse delle persone per una malattia, misurato dalle loro ricerche online, può riflettere la sua diffusione reale. Pensate al COVID-19: quando i casi aumentavano, aumentava anche l’interesse (e la preoccupazione) delle persone, e questo si vedeva nelle ricerche su Google. C’era una correlazione notevole!

Il Modello CanTrend: Semplice, Veloce, Accurato
Ed è proprio su questa intuizione che si basa il nuovo modello di cui vi parlo, chiamato CanTrend. L’idea è sorprendentemente semplice ma potente: combinare i dati storici reali sull’incidenza del cancro forniti dalle agenzie sanitarie con i dati di Google Trends. In pratica, per prevedere i tassi di incidenza del cancro per un determinato anno, ad esempio il 2017, si prendono i tassi reali del 2016 e li si moltiplica per il rapporto tra l’RSVI per la parola “cancro” nel 2017 e l’RSVI nel 2016. Se le ricerche per “cancro” aumentano, ci si aspetta un aumento corrispondente dei casi, e viceversa.
Questo modello è stato testato per prevedere i tassi di nuovi casi di cancro in tutti i cinquanta stati americani per quattro anni consecutivi (2017, 2018, 2019, 2020), con una limitazione dovuta alla disponibilità dei dati. I risultati? Davvero notevoli! Nella maggior parte degli stati, l’errore percentuale tra i tassi previsti e quelli reali non ha superato il 6%. Certo, alcuni stati come le Hawaii e il Vermont hanno mostrato un errore maggiore, ma nel complesso la somiglianza tra i dati previsti e quelli effettivi è stata impressionante. Immaginate delle mappe di calore degli Stati Uniti, una con i dati reali e una con quelli previsti: erano incredibilmente simili!
Perché CanTrend Potrebbe Fare la Differenza
Rispetto ai modelli attuali, CanTrend si è dimostrato più semplice, più veloce e potenzialmente più accurato. Uno dei suoi punti di forza è che Google Trends sembra “smorzare” l’eccessiva sensibilità dei modelli lineari tradizionali a cambiamenti improvvisi nei dati osservati. Questo è cruciale.
La previsione del carico di malattia oncologica è fondamentale, come dicevo, per la pianificazione sanitaria. Avere stime attendibili a breve termine aiuta le organizzazioni a preparare le risorse necessarie. Pensate all’impatto della pandemia di COVID-19: i servizi sanitari sono stati interrotti o parzialmente sospesi in molti paesi, causando ritardi nella raccolta dei dati sull’incidenza del cancro. In queste circostanze, un modello come CanTrend diventa ancora più prezioso. Durante la pandemia, l’interesse si è spostato dal cancro al COVID-19, e questo si è riflesso nelle ricerche. Per superare il problema della mancanza di dati attuali (ad esempio, i dati OMS per il 2021 non erano disponibili al momento dello studio), il modello ha utilizzato gli ultimi dati previsti disponibili per proiettare i tassi attesi per l’anno successivo. Ad esempio, per prevedere l’incidenza nel 2021, si sono usati i dati reali del 2020 e gli RSVI del 2020 e 2021. Lo stesso principio è stato applicato per il 2022 e il 2023. Chiaramente, l’accuratezza di queste proiezioni “a catena” non può essere verificata finché non arrivano i dati reali, e c’è il rischio di un errore cumulativo. Ma è un problema che si risolve non appena i dati aggiornati diventano accessibili.

Uno Sguardo al Futuro Globale
Il modello non si è fermato agli Stati Uniti. È stato applicato con successo anche per prevedere i nuovi casi di cancro nel 2021 in 54 diverse popolazioni in altrettanti paesi. Secondo queste proiezioni, ad esempio, per il 2023 gli Stati Uniti d’America avrebbero il carico di cancro più elevato con oltre 2 milioni di nuovi casi, seguiti dal Regno Unito con poco più di 1 milione.
Certo, questo modello non è pensato per previsioni a lungo termine, perché dipende dalla disponibilità continua dei dati di ricerca su Google Trends. Tuttavia, i vantaggi sono innegabili: fa risparmiare tempo e fatica, e soprattutto aiuta a superare il frustrante ritardo nella disponibilità dei tassi di incidenza reali.
In conclusione, credo che CanTrend rappresenti un passo avanti davvero significativo. Sfruttare l’intelligenza collettiva che emerge dalle ricerche online per affinare le nostre previsioni sul cancro è un’idea brillante. Potrebbe davvero aiutare i team sanitari a pianificare meglio la diagnosi e il trattamento, e questo, alla fine, significa migliorare la vita delle persone. Una piccola rivoluzione digitale al servizio della salute.
Fonte: Springer
