Globuli Bianchi al Setaccio delle IA: Come le CNN Combinate Rivoluzionano la Diagnostica!
Ciao a tutti! Oggi voglio parlarvi di qualcosa che mi sta davvero a cuore e che, credetemi, ha del potenziale incredibile nel campo medico. Immaginate i globuli bianchi: sono i nostri piccoli ma potentissimi guerrieri, sempre pronti a difendere il corpo da invasori esterni. Ogni tipo di globulo bianco ha un compito specifico, e capire bene chi fa cosa è cruciale. Pensate che classificare correttamente queste cellule può aiutarci a prevedere malattie toste come l’AIDS, la malaria, la leucemia e tante altre. Mica poco, eh?
La Sfida: Occhi Esperti vs. Complessità
Tradizionalmente, contare e identificare i tipi di globuli bianchi è un lavoro da certosini: richiede tempo, è faticoso e, diciamocelo, dipende molto dall’abilità di chi sta al microscopio. Un piccolo errore può avere conseguenze serie. Ecco perché da un po’ si guarda con interesse ai sistemi computerizzati. Questi sistemi possono “imparare” da una quantità di dati che un esperto vedrebbe in anni, e lo fanno in pochi secondi! Non si distraggono, possono essere addestrati continuamente e, con lo sviluppo del deep learning, le cose si sono fatte ancora più interessanti.
L’Idea Geniale: Unire le Forze delle Reti Neurali Convoluzionali (CNN)
Nel nostro studio, abbiamo pensato: perché affidarsi a un solo “cervello” artificiale quando possiamo combinarne diversi? Così è nata l’idea di usare differenti Reti Neurali Convoluzionali (CNN). Queste sono architetture di intelligenza artificiale particolarmente brave a “vedere” e interpretare le immagini. Abbiamo preso le immagini dei globuli bianchi da un dataset pubblico, chiamato Blood Cell Classification and Detection (BCCD), e le abbiamo date in pasto a queste CNN.
La vera “magia”, se così vogliamo chiamarla, sta nel come abbiamo gestito le informazioni, o features, che queste reti estraggono. Invece di fermarci ai risultati finali di ogni singola rete, siamo andati a pescare le informazioni da strati un po’ più “profondi”, quelli che precedono lo strato completamente connesso. Perché? Beh, abbiamo notato sperimentalmente che queste features “intermedie” sono spesso più ricche e meno “inquinate” dalla specializzazione della rete su un dataset generico come ImageNet. Abbiamo usato tre architetture piuttosto note: GoogLeNet, ResNet-50 ed EfficientNet-B0.
Come Funziona il Nostro Metodo “Multi-Cervello”?
Il processo che abbiamo messo a punto si articola in alcuni passaggi chiave:
- Estrazione delle Caratteristiche (Features): Ogni CNN analizza le immagini dei globuli bianchi (ridimensionate a 224×224 pixel) ed estrae un set di caratteristiche numeriche. Per GoogLeNet abbiamo usato l’output del layer “pool5-7x7_s1”, per ResNet-50 “avg_pool” e per EfficientNet-B0 “GlobAvgPool”.
- Unione delle Forze: Le caratteristiche estratte da ciascuna delle tre CNN vengono combinate in un unico, grande “super-vettore” di features.
- Scegliere il Meglio del Meglio: Avere tante features è bello, ma non tutte sono ugualmente utili. Alcune potrebbero essere ridondanti o addirittura controproducenti. Qui entra in gioco l’algoritmo mRMR (Minimum Redundancy Maximum Relevance). Questo piccolo genio ci aiuta a selezionare solo le caratteristiche più efficaci, quelle che sono altamente correlate con la classe del globulo bianco ma poco correlate tra loro. Abbiamo deciso di selezionare le 500 features più “forti” da ogni architettura.
- Classificazione Finale: Con il nostro set di features ottimizzato (1500 in totale, 500 per ciascuna delle tre CNN), siamo pronti per la classificazione vera e propria. Abbiamo testato due classificatori molto usati: le Support Vector Machines (SVM) e il K-Nearest Neighbors (KNN).
Un aspetto importante è che il nostro metodo non ha bisogno di passaggi complicati di pre-elaborazione o post-elaborazione delle immagini, il che lo rende più snello e potenzialmente più veloce da implementare.

I Risultati che Parlano da Soli: Precisione da Record!
E ora, il momento della verità: i risultati! Combinando le 500 features selezionate da ciascuna delle tre CNN (per un totale di 1500 features) e usando il classificatore SVM, abbiamo raggiunto un’accuratezza del 98.63% nella classificazione dei quattro tipi di globuli bianchi (Eosinofili, Linfociti, Monociti, Neutrofili)! Anche con KNN i risultati sono stati eccellenti, con un’accuratezza del 98.55%.
Pensateci: usare le features dagli strati precedenti a quello completamente connesso si è rivelato vincente. Ad esempio, per GoogLeNet, le 1024 features dal layer “pool5-7x7_s1” hanno dato un’accuratezza (con SVM) dell’88.74%, mentre le 1000 features dal layer finale “loss3-classifier” (quello usato più comunemente in letteratura) si fermavano all’81.26%. Un bel salto! La selezione con mRMR ha poi dato un’ulteriore, incredibile spinta: le 500 features selezionate da GoogLeNet da sole hanno raggiunto il 94.29% con SVM.
Abbiamo anche notato che la semplice fusione di tutte le features estratte dalle CNN (senza selezione) non è sempre la strategia migliore. Ad esempio, EfficientNet-B0 da sola (1280 features) otteneva l’88.10% con SVM. Combinandola con ResNet-50 (totale 3328 features) l’accuratezza scendeva leggermente all’87.62%. Ma combinando tutte e tre le architetture (4352 features) si arrivava all’89.23%. Questo dimostra quanto sia cruciale il passaggio di selezione intelligente delle features!
Non Solo Numeri: L’Impatto sulla Diagnosi Medica
Un’accuratezza del 98.63% non è solo un bel numero su un grafico. Significa poter fornire ai medici uno strumento di supporto diagnostico estremamente affidabile. Immaginate la possibilità di analizzare campioni di sangue in modo rapido e preciso, aiutando a identificare tempestivamente segnali di malattie importanti. Questo potrebbe fare una differenza enorme, specialmente in contesti con risorse limitate o dove è necessario processare un gran numero di campioni.
Analizzando più nel dettaglio, il nostro modello ha mostrato metriche come sensibilità (la capacità di identificare correttamente i positivi) del 98.63%, specificità (la capacità di identificare correttamente i negativi) del 99.54% e precisione (l’affidabilità delle previsioni positive) del 98.70%. L’F1_Score, che bilancia precisione e sensibilità, è stato del 98.64%. Questi valori confermano la robustezza del sistema.
Dalla matrice di confusione, è emerso che il tipo di cellula più difficile da distinguere sono stati i neutrofili, spesso confusi con gli eosinofili, probabilmente a causa di somiglianze morfologiche e della qualità dell’immagine. Nonostante ciò, il linfocita è stato il tipo di cellula classificato con la maggiore accuratezza individuale.

Confronto con i “Grandi”: Come si Posiziona la Nostra Ricerca?
Ovviamente, non siamo i primi a lavorare su questo. Ci sono molti studi validissimi là fuori. Però, il nostro approccio ha alcuni vantaggi. Molti metodi usano tecniche di data augmentation o pre-processing complesse, oppure si affidano alle features degli strati finali delle CNN. Noi abbiamo dimostrato che si può ottenere un’accuratezza molto alta (superiore a molti metodi attuali) senza questi passaggi aggiuntivi e sfruttando meglio le informazioni interne delle CNN. Ad esempio, uno studio di Toğaçar et al. [11], con un approccio simile, aveva raggiunto il 97.95%, ma noi siamo riusciti a migliorare questo risultato dello 0.68% usando un dataset leggermente diverso per il training/testing e la nostra strategia di feature extraction e selection.
Altri metodi, pur raggiungendo accuratezze elevate come quello di Davamani et al. [43] (99.82% con MobileNet), si basano su fine-tuning di architetture pre-allenate, limitando la novità dell’approccio. Il nostro metodo, allenando le CNN da zero (from scratch) e con la specifica strategia di feature selection, offre un contributo originale e altamente performante.
La Prova del Nove: Test su un Nuovo Campo di Battaglia
Per essere sicuri che il nostro metodo non fosse solo “fortunato” con il dataset BCCD, lo abbiamo messo alla prova su un altro dataset pubblico [47], contenente immagini di ottima qualità di cellule del sangue periferico. Abbiamo selezionato le stesse quattro classi di globuli bianchi (per un totale di 9.080 immagini). Ebbene, le 1500 features estratte dalle tre CNN hanno raggiunto un’accuratezza del 99.67% con SVM e addirittura del 99.72% con KNN! Questo risultato pazzesco dimostra la robustezza e l’adattabilità del nostro approccio. La maggiore chiarezza delle immagini in questo secondo dataset ha sicuramente aiutato, semplificando il compito di classificazione.
Guardando al Futuro: Prossimi Passi e Nuove Sfide
Certo, c’è sempre spazio per migliorare. Al momento ci siamo limitati a tre architetture CNN. In futuro, pensiamo di esplorare l’integrazione di altre architetture potenti, come DenseNet o i Vision Transformers, che stanno mostrando risultati promettenti in molti campi della visione artificiale. Inoltre, vorremmo estendere il nostro metodo per classificare anche altri tipi di cellule del sangue, come i globuli rossi e le piastrine, e testarlo su nuovi dataset ancora più ampi e variegati.
Credo fermamente che la combinazione intelligente di diverse tecniche di intelligenza artificiale, come abbiamo fatto noi con le CNN e la selezione mirata delle features, sia la strada giusta per fare passi da gigante. La classificazione dei globuli bianchi è solo un esempio, ma le potenzialità per la medicina sono immense. È un campo di ricerca affascinante e sono entusiasta di vedere cosa ci riserverà il futuro!
Fonte: Springer
