Un'immagine evocativa del traffico mattutino su un'autostrada che attraversa un confine internazionale, con il sole che sorge all'orizzonte. I veicoli sono resi con scie luminose per indicare movimento e flusso. Landscape wide angle, 18mm, long exposure, sharp focus sui cartelli stradali di confine, atmosfera dinamica.

Scovare i Pendolari Nascosti nel Traffico? Ci Pensa un Mix Gaussiano!

Ammettiamolo, chi non si è mai chiesto, bloccato nel traffico mattutino, “ma dove va tutta questa gente?”. Ecco, oggi vi racconto una storia affascinante su come, armati di un po’ di matematica e dati dai sensori stradali, possiamo iniziare a dare una risposta a questa domanda, concentrandoci su una categoria specifica di viaggiatori: i pendolari. Sì, proprio loro, gli eroi (o le vittime, a seconda dei punti di vista) del tragitto casa-lavoro. Capire i loro movimenti è cruciale per un sacco di cose: dalla gestione del traffico nelle ore di punta alle statistiche sui lavoratori transfrontalieri, fino alla pianificazione in caso di emergenze o interruzioni dei trasporti.

Perché i vecchi metodi non bastano più?

Tradizionalmente, per capire i flussi dei pendolari, ci si affidava principalmente ai sondaggi, come la cara vecchia indagine nazionale sugli spostamenti. Immaginate un po’: questionari, interviste… metodi utili, certo, ma con qualche problemino. Primo fra tutti, il rischio di bias di selezione: non tutti rispondono, e chi risponde potrebbe non essere rappresentativo dell’intera popolazione. E poi, diciamocelo, le nostre abitudini lavorative stanno cambiando a una velocità pazzesca! Pensate al boom del lavoro da remoto o agli orari flessibili. I sondaggi, spesso annuali o anche meno frequenti, faticano a tenere il passo con queste trasformazioni. La pandemia di COVID-19, ad esempio, ha stravolto le abitudini di pendolarismo, e c’è ancora tanto da capire su questi cambiamenti.

Ecco perché è diventato fondamentale esplorare nuove fonti di dati. Negli ultimi vent’anni, l’attenzione si è spostata su dati da reti cellulari, app per smartphone, tracciamento GPS, biglietti elettronici e altre tracce digitali che lasciamo viaggiando. Persino app come Strava sono state usate per studiare le abitudini di viaggio, anche se pure qui bisogna fare i conti con possibili distorsioni. Ma c’è un tipo di dato ampiamente disponibile quasi ovunque: i dati sul traffico stradale raccolti dai sensori installati sulle nostre strade. Questi dati, spesso aggregati come conteggi di veicoli (a volte distinti per lunghezza o tipo), hanno il grande vantaggio di non contenere informazioni sensibili sulle persone e possono essere condivisi facilmente. Il problema? Non ci dicono perché le persone viaggiano. Ed è qui che entriamo in gioco noi.

La nostra “bacchetta magica”: i Modelli a Mistura Gaussiana (GMM)

Nonostante l’importanza di capire il pendolarismo, mancavano metodi affidabili per estrarre queste informazioni direttamente dai dati del traffico stradale. E qui, modestamente, abbiamo cercato di dare il nostro contributo. Abbiamo sviluppato un metodo che utilizza proprio questi dati e applica i cosiddetti Modelli a Mistura Gaussiana (GMM) per identificare schemi che corrispondono ai viaggi dei pendolari.

L’idea di base è semplice ma potente: catturare il pendolarismo durante le ore lavorative tradizionali identificando il pattern costante e ripetitivo dei viaggi mattutini nei giorni feriali. Immaginate il traffico giornaliero come una melodia composta da diverse “onde” sonore. Il nostro metodo, basato sui GMM, fa proprio questo: scompone il “rumore” del traffico in diverse componenti gaussiane (le nostre “onde”). Ogni componente ha una sua media (il picco dell’onda) e una sua varianza (quanto è larga l’onda). L’ipotesi è che ci siano diverse ondate di viaggiatori durante il giorno, e alcune di queste corrispondano ai pendolari.

Visualizzazione astratta di un Modello a Mistura Gaussiana applicato ai dati di traffico. Diverse curve gaussiane colorate si sovrappongono per formare un profilo di traffico complesso, con un picco mattutino evidenziato. Macro lens, 80mm, high detail, controlled lighting.

Come funziona nel dettaglio?

  • Prendiamo i dati di traffico da un sensore, che ci dicono l’ora di passaggio di ogni veicolo.
  • Adattiamo un modello GMM a questi dati per ogni giorno della settimana (perché, si sa, il traffico del lunedì non è quello della domenica!). Per velocizzare, campioniamo 10.000 passaggi per ogni giorno della settimana.
  • Una volta che il modello ha “imparato” le varie componenti del traffico, andiamo a caccia di quelle che sembrano appartenere ai pendolari. La nostra definizione operativa di pendolare è una persona con un pattern di viaggio ripetitivo, che va al lavoro la mattina e torna a casa la sera. Quindi, cerchiamo le componenti con un picco (media) tra le 5:30 e le 10:00 del mattino, dal lunedì al venerdì.
  • Infine, stimiamo il numero di veicoli pendolari usando la probabilità che ogni veicolo appartenga a queste componenti “pendolari”.

Abbiamo usato 10 componenti gaussiane per modellare il segnale. Se ne usassimo meno, ad esempio solo 5, rischieremmo di perdere quella componente mattutina distintiva che ci serve per “stanare” i pendolari.

Il test sui confini nordici: cosa abbiamo scoperto?

Per mettere alla prova il nostro metodo, abbiamo analizzato i dati del traffico stradale ai confini tra i paesi nordici: Finlandia-Svezia, Norvegia-Svezia e Danimarca-Svezia, nel periodo dal 2017 al 2023. Questi dati provenivano da diverse fonti, come l’API Digitraffic di Fintraffic per il confine finlandese-svedese e l’API Traffic Data dell’Amministrazione Stradale Norvegese per quello norvegese-svedese. Per il ponte Øresund tra Danimarca e Svezia, i dati sono stati forniti su richiesta dal Consorzio Øresundsbro. Ci siamo concentrati sui veicoli più corti, assimilabili alle autovetture, quando questa distinzione era disponibile.

I risultati sono stati davvero interessanti! Ad esempio, analizzando un singolo sensore sul confine tra Finlandia e Svezia, abbiamo visto chiaramente un picco di traffico mattutino nei giorni feriali che spariva nel weekend. Il nostro modello GMM riusciva a catturare queste differenze. E, cosa ancora più importante, il numero stimato di pendolari diminuiva durante le vacanze estive e natalizie, anche se il traffico totale magari aumentava. Questo è esattamente quello che ci aspettavamo: meno gente va al lavoro durante le feste, anche se magari c’è più traffico turistico. Questa correlazione inversa tra pendolari e festività ci ha dato molta fiducia nel modello.

Estendendo l’analisi a tutti i sensori sui confini nordici, abbiamo osservato alcuni pattern significativi:

  • Direzioni del pendolarismo: Tra Finlandia e Svezia, il pendolarismo maggiore è dalla Finlandia verso la Svezia (circa il 6.9% del traffico di auto piccole). Tra Norvegia e Svezia, è dalla Svezia verso la Norvegia (circa il 6.5%). Queste direzioni principali sono in linea con quanto riportato in letteratura.
  • Impatto del COVID-19: All’inizio della pandemia, a metà marzo 2020, sia il traffico totale che quello pendolare hanno subito un crollo. Tuttavia, ai confini Norvegia-Svezia e Finlandia-Svezia, il traffico totale è diminuito molto di più (87-92%) rispetto a quello pendolare (42-71%). Questo riflette le diverse restrizioni di viaggio per i pendolari rispetto ai viaggi di piacere. La frazione di pendolari sul totale è addirittura aumentata nel 2020 e 2021!
  • Ripresa post-pandemia: Nel 2023, il traffico tra Finlandia e Svezia è tornato più o meno ai livelli pre-pandemici. Invece, tra Norvegia e Svezia, il traffico si è ripreso solo parzialmente, attestandosi a circa il 73-76% dei livelli del 2019.
  • Danimarca-Svezia: Qui la situazione è un po’ diversa. Stimiamo una quota di pendolari molto alta (circa 32.6% dalla Svezia alla Danimarca nel 2019). Tuttavia, l’effetto “vacanze” non è così marcato nella direzione Danimarca-Svezia. Una possibile spiegazione è che i dati del ponte Øresund includono anche veicoli pesanti (trasporto merci), che potrebbero avere pattern di viaggio meno influenzati dalle festività.

Grafico stilizzato che mostra due linee di tendenza del traffico su uno sfondo che richiama una mappa dei paesi nordici durante la pandemia. Una linea (traffico totale) scende drasticamente, l'altra (pendolari) scende meno. Telephoto zoom, 150mm, action or movement tracking per catturare il 'movimento' dei dati.

Per valutare la bontà del nostro modello nel tempo, abbiamo calcolato la divergenza di Kullback-Leibler (KL) giornaliera. Questo indice ci dice quanto il nostro modello (addestrato sui dati pre-pandemici) si discosta da un modello GMM addestrato giorno per giorno. Come previsto, la divergenza KL è aumentata durante la pandemia, quando i pattern di viaggio sono stati stravolti, per poi tornare a livelli simili a quelli pre-pandemici una volta passata l’emergenza.

Limiti e prospettive future: la strada è ancora lunga

Ora, siamo onesti. Il nostro metodo non è una sfera di cristallo. Definiamo “pendolare” chi viaggia regolarmente al mattino per lavoro, ma ci sono tanti modi di essere pendolare! C’è chi fa il pendolare settimanalmente su lunghe distanze, chi lavora da remoto alcuni giorni… Il nostro approccio attuale non cattura tutte queste sfumature. Inoltre, identificare il flusso di ritorno serale dei pendolari è più complicato, perché il traffico pomeridiano è generalmente più “misto” e meno caratterizzato da picchi netti.

Un’altra questione importante è che il nostro modello non ci dice se sono sempre le stesse persone a fare le pendolari o se c’è un ricambio. Per questo servirebbero dati più dettagliati, come quelli da telefonia mobile. E, naturalmente, la validazione definitiva del numero esatto di pendolari che stimiamo è difficile, perché manca un “ground truth” (una verità di riferimento) facilmente accessibile. Abbiamo cercato dati per confrontare le nostre stime, ma senza successo.

Nonostante questi “ma”, credo fermamente che questo approccio basato sui GMM sia un passo avanti enorme. Ci permette di avere stime dinamiche e in tempo reale dei flussi pendolari usando dati già ampiamente disponibili. I risultati ottenuti sui confini nordici, con la loro coerenza rispetto agli effetti delle vacanze e alle dinamiche pandemiche, sono molto incoraggianti. Spero che il nostro lavoro non sia solo una prima stima, pur con i suoi limiti, ma anche uno stimolo per ulteriori ricerche, magari integrando altri metodi e fonti di dati, per capire sempre meglio come ci muoviamo. E chissà, magari la prossima volta che sarete in coda, penserete con un sorriso a quei “mix gaussiani” che cercano di dare un senso a tutto quel viavai!

Fonte: Springer

Articoli correlati

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *