Visualizzazione astratta di reti neurali e dati pediatrici che si interconnettono, con un bambino stilizzato al centro, colori blu e verde duotone, illuminazione controllata, alta definizione, obiettivo macro da 60mm per dettaglio.

Bambini e Sanità: L’Intelligenza Artificiale Prevede i Costi per Salvare Risorse (e Vite)!

Amici, parliamoci chiaro: la spesa sanitaria è un osso duro un po’ ovunque nel mondo, e una bella fetta di questa torta se la mangiano i cosiddetti pazienti “ad alto bisogno e ad alto costo” (HNHC, per gli amici). Pensate che questi, pur essendo solo il 5% del totale, arrivano a pesare per oltre la metà delle spese sanitarie complessive! Una cifra da capogiro, vero? E finora, i tentativi di tenere a bada questi costi intervenendo su pazienti già HNHC hanno dato risultati un po’ così, senza un impatto duraturo.

Ora, se parliamo di bambini, la faccenda si fa ancora più delicata. In Cina, per esempio, c’era un vuoto di studi su come prevedere quali piccoli pazienti sarebbero diventati HNHC. Ed è qui che entro in gioco io, o meglio, la ricerca che vi sto per raccontare. L’idea? Sfruttare la potenza del machine learning per creare un modello predittivo che ci aiuti a identificare prima che i costi schizzino alle stelle quali bambini potrebbero rientrare in questa categoria. Immaginate: interventi proattivi, cure personalizzate, e un bel risparmio per il sistema sanitario. Mica male, eh?

Il Problema dei “Pazienti Super-Spender”

Come vi dicevo, questi pazienti HNHC sono una bella gatta da pelare. Nel Regno Unito, nel 2022, il 5% dei pazienti ha generato il 54% delle spese. Negli Stati Uniti, nel 2021, il 51.2%. E potrei continuare con Canada, Spagna, Germania… insomma, è un problema globale. Questo peso finanziario enorme ci dice che c’è un bisogno disperato di interventi mirati per ottimizzare le risorse. E non è solo una questione di soldi: questi pazienti e le loro famiglie affrontano un carico economico e di malattia pesantissimo, spesso con risultati di salute peggiori. Questo suggerisce che qualcosa nell’erogazione dei servizi e nell’allocazione delle risorse non funziona come dovrebbe.

Molti paesi hanno provato a mettere i pazienti HNHC al centro delle riforme sanitarie, sperimentando vari modelli di assistenza. Ma, come accennavo, i risultati sono stati altalenanti. Alcuni programmi hanno mostrato una certa efficacia nel ridurre i servizi di emergenza e i ricoveri per sottogruppi specifici, ma l’impatto a lungo termine sul controllo dei costi è rimasto limitato. La ricerca precedente sottolinea proprio questo: puntare sui pazienti già HNHC serve fino a un certo punto. La vera svolta sarebbe prevedere e identificare i pazienti potenzialmente ad alto rischio prima che lo diventino, per poter intervenire preventivamente.

Perché i Bambini? E Perché la Cina?

Gli studi internazionali si sono concentrati soprattutto sulla previsione di pazienti HNHC adulti, in paesi come Stati Uniti, Corea del Sud e Giappone. Ma sui bambini? Buio quasi totale. E in Cina, la ricerca si era focalizzata su singole malattie, come quelle cardiache o polmonari croniche, mancando di un’analisi completa su diverse categorie di patologie. C’era, quindi, una carenza di modelli predittivi specifici per i pazienti pediatrici HNHC in Cina. E fidatevi, bambini e adulti sono mondi diversi: caratteristiche, malattie prevalenti, utilizzo dei servizi sanitari, spese… tutto cambia! Ecco perché serviva un modello specifico, valido e affidabile basato sul machine learning, cucito su misura per i piccoli pazienti.

Il nostro studio si è basato su un’analisi retrospettiva di una coorte di pazienti pediatrici (sotto i 18 anni) di Shanghai, utilizzando dati raccolti in 7 anni, dal 2017 al 2023. Abbiamo attinto da due database amministrativi: l’assicurazione medica di base per residenti urbani e rurali (URBMI) e il fondo mutualistico per il ricovero dei bambini (CHMF), che insieme coprono la quasi totalità dei bambini di Shanghai. L’obiettivo era chiaro: sviluppare un modello di machine learning per prevedere i pazienti pediatrici HNHC e dare così a chi decide e a chi paga strumenti per strategie di intervento precoce, mitigando l’escalation dei costi.

La Magia del Machine Learning al Servizio della Salute

Per farla semplice, abbiamo “addestrato” dei computer a riconoscere schemi nei dati. Abbiamo usato diversi algoritmi di machine learning:

  • Regressione Logistica (il nostro modello di riferimento)
  • K-Nearest Neighbors (KNN)
  • Random Forest (RF)
  • Multi-layer Perceptron (MLP), una specie di rete neurale artificiale
  • Naive Bayes

Abbiamo diviso i dati del periodo 2021-2022: il 70% per “allenare” i modelli (training set) e il 30% per testarli (test set). Per evitare che i modelli fossero “sbilanciati” visto che i pazienti HNHC sono una minoranza, abbiamo usato una tecnica chiamata SMOTE (Synthetic Minority Over-sampling Technique). E per trovare i parametri migliori per ogni modello, abbiamo usato una strategia di “grid search” con validazione incrociata (k-fold cross-validation, con k=10).
Le prestazioni dei modelli sono state valutate con 5 metriche: ROC-AUC (una misura della capacità discriminatoria del modello), accuratezza, sensibilità (quanto bene individua i veri HNHC), specificità (quanto bene individua i non-HNHC) e F1 score (una media armonica di precisione e sensibilità).

Un team di data scientist in un ambiente moderno e luminoso che discute davanti a schermi con grafici complessi di machine learning, obiettivo da 24mm per un ampio angolo di visuale, luce naturale, dettagli nitidi.

Nello studio sono stati inclusi 91.882 bambini ricoverati nel 2021. Di questi, 4.595 erano HNHC (il 5% con i costi annuali più alti) e 87.287 non-HNHC. E le differenze tra i due gruppi erano significative! I bambini HNHC tendevano ad avere meno di 1 anno o più di 13 anni, essere femmine, residenti a Shanghai e con doppia assicurazione. Inoltre, il 49.14% di loro aveva una delle 20 principali malattie HNHC identificate (un tasso molto più alto dei non-HNHC).

Le 20 Malattie “Top Spender” nei Bambini

Abbiamo identificato le 20 patologie più comuni tra i bambini HNHC, che si possono raggruppare in cinque categorie:

  1. Malattie neonatali comuni: come nascita pretermine e sindrome da distress respiratorio neonatale.
  2. Traumi e deformità degli arti: fratture, lussazioni, distorsioni.
  3. Malattie respiratorie: come la polmonite.
  4. Neoplasie maligne.
  5. Malattie cardiovascolari, cerebrovascolari e rare: come malformazioni cardiache congenite, emofilia, morbo di Crohn.

Questa classificazione è oro colato per allocare le risorse pediatriche e, come vedremo, un fattore predittivo importante.
Riguardo all’utilizzo dei servizi, il 91.64% dei bambini HNHC ha subito interventi chirurgici (contro il 74.94% dei non-HNHC), con una degenza media più lunga (34.15 giorni) e ricoveri annuali più frequenti (2.86 volte). Tendenzialmente, venivano ricoverati in ospedali terziari del centro città. E i costi? Tra il 2021 e il 2023, la spesa per i pazienti HNHC si è mantenuta stabile, rappresentando circa il 35-36% della spesa totale per i ricoveri pediatrici.

Cosa Abbiamo Scoperto (Numeri alla Mano!)

E veniamo ai risultati dei nostri modelli. Tutti i modelli di machine learning hanno superato la regressione logistica (che aveva un ROC-AUC di 0.827). Il campione? Il modello Multi-layer Perceptron (MLP), che ha mostrato le prestazioni predittive più elevate, con un ROC-AUC di 0.872! Seguito a ruota dal Random Forest (0.869), KNN (0.836) e Naive Bayes (0.828). Il Naive Bayes aveva la sensibilità più alta (0.567), mentre RF, MLP e KNN avevano una specificità praticamente perfetta (1.000).
Un ROC-AUC superiore a 0.8 indica una buona performance predittiva, quindi il nostro MLP ci ha dato grandi soddisfazioni!

Ma quali fattori contano di più nel predire se un bambino diventerà HNHC? Grazie a una tecnica chiamata SHAP (SHapley Additive exPlanations), abbiamo visto che nel modello MLP i fattori più influenti sono:

  • Durata della degenza
  • Numero di ricoveri
  • Status HNHC precedente (se il bambino era già HNHC l’anno prima)
  • Età
  • Presenza di una delle 20 principali malattie HNHC

Questi risultati confermano studi precedenti che evidenziavano una forte correlazione tra costi e utilizzo dei servizi sanitari dell’anno precedente e quelli dell’anno successivo.

Validazione: La Prova del Nove

Un modello è bravo solo se funziona anche “fuori casa”. Per questo abbiamo fatto una validazione esterna, usando dati del 2022-2023 su 77.774 bambini, per vedere se i modelli “allenati” riuscivano a predire i casi HNHC del 2023. Ebbene, anche se le prestazioni sono leggermente calate (cosa normale), il modello MLP è rimasto il migliore (ROC-AUC di 0.843). Abbiamo anche fatto validazioni interne cambiando le proporzioni tra training e test set (80:20 e 90:10), e l’MLP ha continuato a brillare, confermando la sua robustezza. Questo ci dice che il modello MLP è affidabile per prevedere l’insorgenza di HNHC tra i bambini ricoverati.

Un grafico astratto che mostra la curva ROC-AUC del modello MLP nettamente superiore alle altre, su uno sfondo digitale high-tech, obiettivo macro da 100mm per enfatizzare la linea del grafico, illuminazione controllata.

Cosa Significa Tutto Questo, in Pratica?

Questo studio è importante per due motivi. Dal punto di vista accademico, è il primo, per quanto ne sappiamo, a fare previsioni HNHC sulla popolazione pediatrica in Cina confrontando diversi metodi di machine learning, che hanno surclassato i modelli statistici tradizionali. Abbiamo visto che i fattori predittivi chiave (come i tipi di malattie) sono diversi tra bambini e adulti. L’uso di validazione interna ed esterna rafforza i nostri risultati e offre una base per future ricerche. Certo, l’uso del machine learning solleva questioni etiche su privacy e potenziale discriminazione, temi da affrontare con trasparenza e approcci fattibili per la raccolta dati.

Dal punto di vista pratico e politico, questo modello predittivo per l’identificazione precoce dei pazienti pediatrici HNHC può aiutare a ottimizzare quei modelli di servizio sanitario che finora hanno avuto successo limitato. Immaginate di integrare il modello MLP nei flussi di lavoro clinici: identificazione in tempo reale, stratificazione del rischio, interventi precoci e ottimizzazione delle risorse. Individuando la finestra di intervento ottimale, si possono prevenire costi sanitari elevati.

Limiti e Prospettive Future (Siamo Realisti!)

Ogni studio ha i suoi limiti. Primo, l’accesso ai dati medici in Cina è complesso, quindi non abbiamo potuto collegare dati ambulatoriali e ospedalieri, né ottenere molte informazioni socio-demografiche o fisiologiche. Un problema comune nella ricerca cinese. Abbiamo cercato di includere tutti i fattori teoricamente influenti, ma ricerche future dovrebbero esplorare più predittori.
Secondo, la generalizzabilità dei risultati ad altri paesi, popolazioni (come gli anziani) o contesti va discussa con cautela. Noi abbiamo usato dati di Shanghai, una grande città, per ridurre il bias di campionamento.
Infine, l’impatto delle politiche di lockdown per il COVID-19 potrebbe aver influenzato i dati 2021-2022. Però, la validazione esterna con dati 2022-2023 ha confermato la robustezza dei modelli, specialmente dell’MLP.

In sintesi, abbiamo scoperto che il 5% dei pazienti pediatrici HNHC incide per oltre il 35% dei costi totali di ricovero. Usando un’ampia coorte di bambini, il modello MLP si è dimostrato il migliore nel predire questi casi. I predittori chiave sono durata della degenza, numero di ricoveri, status HNHC precedente, età e presenza delle 20 principali malattie HNHC. Questi risultati sottolineano l’importanza di integrare modelli predittivi nella pratica clinica e nelle politiche sanitarie per identificare precocemente le popolazioni pediatriche HNHC, ottimizzare le risorse, facilitare interventi mirati e controllare i costi.
Per il futuro? Dati longitudinali da più regioni, più fattori predittivi (socio-demografici, comportamenti sanitari) e algoritmi di machine learning più complessi (ensemble methods) per migliorare ancora performance e generalizzabilità. La strada è tracciata!

Fonte: Springer

Articoli correlati

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *