Immagine concettuale che rappresenta l'intersezione tra neuroscienze e intelligenza artificiale: un cervello stilizzato con circuiti digitali sovrapposti, e una mano che disegna una spirale, simboleggiando l'analisi della scrittura per la diagnosi del Parkinson. Prime lens, 24mm, duotone blu e grigio, profondità di campo.

Parkinson e Scrittura: Canny Edge Detection, un Alleato o un Intralcio per l’Intelligenza Artificiale?

Ciao a tutti! Oggi voglio portarvi con me in un viaggio affascinante, un po’ tecnico ma spero di renderlo stuzzicante, nel mondo dell’intelligenza artificiale applicata a una sfida medica importante: la diagnosi precoce del Parkinson. In particolare, ci siamo chiesti: ma quella famosa tecnica di pre-elaborazione delle immagini chiamata Canny Edge Detection, aiuta davvero i nostri modelli di machine learning a fare meglio il loro lavoro, o rischia di essere un bastone tra le ruote? Una domanda non da poco, ve lo assicuro!

Il Parkinson, come saprete, è una malattia neurodegenerativa che colpisce milioni di persone nel mondo. Uno dei primi campanelli d’allarme, a volte sottovalutato, può essere un cambiamento nella scrittura, la cosiddetta micrografia. Immaginate quanto sarebbe utile poter analizzare un semplice disegno, come una spirale tracciata su un tablet, per avere un’indicazione precoce. È qui che entra in gioco il machine learning (ML), con la sua capacità di scovare pattern invisibili all’occhio umano.

I Nostri “Ingredienti”: I Dataset al Microscopio

Per capirci qualcosa, abbiamo preso un dataset originale di immagini di spirali disegnate da persone sane e da pazienti con Parkinson (chiamiamolo DS0). Poi, abbiamo iniziato a “giocarci”.

Abbiamo creato un secondo dataset (DS1) applicando a DS0 il Canny Edge Detection, che in pratica evidenzia i contorni, e un filtro Hessiano, che li affina ulteriormente. L’idea era: se diamo al modello solo i bordi belli puliti, magari capisce meglio?

Ma non ci siamo fermati qui. Sappiamo che i modelli ML spesso lavorano meglio con tanti dati. Così, abbiamo “aumentato” artificialmente entrambi i dataset, creando DS2 (versione ingrandita di DS0) e DS3 (versione ingrandita di DS1). L’aumento dei dati significa, ad esempio, ruotare leggermente le immagini, fare piccoli spostamenti, così da avere più esempi, un po’ diversi tra loro, su cui allenare i modelli.

Su questi quattro “campi di battaglia” abbiamo scatenato una squadra di modelli ML piuttosto variegata: dalla Regressione Logistica (LR) agli Alberi Decisionali (DT), dalle Random Forest (RF) al Gradient Boosting (GB), passando per XGBoost (XBG), Naive Bayes (NB), Support Vector Machine (SVM) e AdaBoost (AdB). Insomma, un bel po’ di cervelli artificiali al lavoro!

La Sorpresa del Canny: Non Sempre Oro Ciò che Luccica

E qui arriva il bello, o meglio, la prima grande osservazione. Ci aspettavamo che il preprocessing con Canny (quello usato per DS1 e DS3) desse una marcia in più. E invece? Colpo di scena! Per la maggior parte dei modelli, questa operazione ha peggiorato le prestazioni. Sembra quasi che, togliendo “rumore” e dettagli, abbiamo tolto anche informazioni utili che i modelli usavano per distinguere le spirali.

Pensateci: forse la texture del tratto, le piccole esitazioni, le variazioni di pressione che Canny tende a “pulire”, sono in realtà indizi preziosi per la diagnosi. È come se, per riconoscere un amico da una foto, gli cancellassimo le rughe d’espressione: magari il viso è più “pulito”, ma abbiamo perso qualcosa di caratteristico.

Abbiamo analizzato l’accuratezza, certo, ma anche quanto diventavano “pesanti” i modelli in termini di memoria e quanto tempo ci mettevano a fare una previsione (la latenza). E qui, un’altra conferma: i dataset più grandi (DS2 e DS3) tendevano a far lievitare l’impronta di memoria e i tempi di risposta, specialmente per modelli come KNN e SVM. La Random Forest (RF), invece, si è dimostrata una roccia, mantenendo una memoria stabile di 61 KB su tutti i fronti. Modelli come Regressione Logistica, Alberi Decisionali e Naive Bayes sono rimasti agili e veloci, il che è un’ottima notizia se pensiamo a dispositivi con poche risorse, come uno smartphone o un tablet in ambulatorio.

Un ricercatore scientifico, maschio, di mezza età, osserva con concentrazione un monitor che mostra grafici complessi e spirali disegnate digitalmente, in un laboratorio moderno e luminoso. Prime lens, 35mm, profondità di campo, illuminazione controllata.

XGBoost, un modello spesso molto performante, ha visto i suoi tempi di predizione schizzare alle stelle con i dataset aumentati, passando da 180-200 millisecondi su DS0 a ben 700-3000 ms su DS2. Non proprio l’ideale per una diagnosi rapida!

Numeri che Parlano: L’Analisi Statistica

Per essere sicuri che le nostre non fossero solo impressioni, abbiamo usato un test statistico bello tosto, il test U di Mann-Whitney. Confrontando le prestazioni dei modelli allenati su DS0 (originale) e DS2 (originale aumentato), abbiamo visto differenze enormi (p-values bassissimi, tipo < 1e-34, il che significa che non è un caso). Anche misurando l'"effetto" di queste differenze con il delta di Cliff (che si avvicinava a -1), abbiamo capito che il cambiamento era notevole, specialmente per SVM e XGBoost.

Questi risultati ci dicono una cosa fondamentale: quando si sviluppano applicazioni per la sanità, soprattutto se devono girare su dispositivi con poche risorse (pensate a un’app per lo screening in zone remote), bisogna scegliere modelli “leggeri” come la Regressione Logistica (LR) o gli Alberi Decisionali (DT). Modelli più complessi come KNN, SVM e XGBoost, sebbene potenti, possono diventare troppo esigenti con dataset grandi, specialmente se si applica un preprocessing come Canny.

Perché la Scrittura? Un Biomarcatore Promettente

Vi chiederete: ma perché proprio la scrittura e le spirali? Beh, la scrittura è un’abilità complessa che coinvolge funzioni cognitive, visive e motorie. Problemi nella scrittura, come la già citata micrografia (quando si scrive sempre più piccolo), possono essere un segnale che spinge le persone a cercare un medico. E non è un criterio diagnostico ufficiale per il Parkinson, ma è spesso un sintomo precoce.

L’analisi cinematica della scrittura, grazie ai tablet digitali, ha fatto passi da gigante. Studi come quello di McLennan sulla micrografia hanno raccolto campioni da pazienti con Parkinson, evidenziando la sfida di quantificare informazioni così qualitative. Altri, come il lavoro di Ranzato, hanno usato macchine di Boltzmann ristrette e caratteristiche estratte da immagini scritte a mano, sottolineando l’importanza di analizzare i tremori.

Noi, nel nostro studio, ci siamo concentrati sulle spirali perché la “spirografia” è una tecnica consolidata per valutare sintomi del Parkinson come tremori e micrografia, e per capire come le persone compensano questi deficit. Disegnare una spirale può rivelare molto: chi ha il Parkinson, ad esempio, tende a fare spirali con un raggio che cresce meno rispetto a una persona sana, risultando in spirali più strette.

Il “Come”: Feature Extraction e Selezione

Una parte cruciale del nostro lavoro è stata l’estrazione delle “feature”, cioè delle caratteristiche significative dalle immagini. Invece di dare le immagini “grezze” in pasto ai modelli, abbiamo calcolato undici parametri statistici per ogni immagine: media, deviazione standard, asimmetria (skewness), curtosi, energia, potenza, mediana, varianza, minimo, massimo e valore quadratico medio (rms). Un bel po’ di numeri!

Per i dataset DS0 e DS2 (quelli senza Canny), abbiamo usato una tecnica chiamata Histogram of Oriented Gradients (HoG), che descrive l’immagine analizzando la distribuzione delle direzioni dei gradienti (cioè, i cambiamenti di intensità). Per DS1 e DS3, invece, c’era il Canny seguito dal filtro Hessiano.

Poi, non tutte queste undici feature sono ugualmente utili. Per scegliere le migliori, abbiamo usato un algoritmo chiamato Recursive Feature Elimination (RFE). In pratica, RFE prova a togliere le feature una ad una e vede come cambia la performance del modello, tenendo solo quelle più importanti. È un po’ come uno chef che assaggia gli ingredienti per trovare la combinazione perfetta per la sua ricetta.

Curiosamente, abbiamo notato che diversi modelli preferivano set di feature leggermente diversi. Per DS0, il set ottimale che andava bene un po’ per tutti era composto da [deviazione standard, asimmetria, curtosi]. Per DS2, invece, era [deviazione standard, asimmetria, curtosi, energia, mediana]. Questo ci dice che la “ricetta” giusta dipende anche dalla quantità e dal tipo di dati.

Primo piano di una mano anziana che disegna con fatica una spirale su un tablet digitale, con linee tremolanti. Macro lens, 100mm, high detail, precise focusing, illuminazione controllata per evidenziare la texture della pelle e del tratto.

Memoria e Tempi di Predizione: Non Dettagli da Poco

Abbiamo già accennato a memoria e velocità. Ma diamo qualche numero in più. Su DS0 (piccolo, originale), modelli come RF e AdB erano i più “pesanti” (61KB e 33KB rispettivamente), mentre gli altri stavano sotto i 7KB. Su DS2 (grande, originale), KNN e SVM hanno visto la loro memoria crescere parecchio, da 5.7-7KB a 102-220KB! Un balzo notevole.

Passando ai dataset con Canny (DS1 e DS3), la situazione della memoria era simile per RF e AdB, ma anche KNN e SVM mostravano aumenti con più feature o con il dataset aumentato. Questo rinforza l’idea che il preprocessing e la dimensione del dataset possono avere un impatto significativo sulle risorse richieste.

E i tempi di predizione? Su DS0, modelli come SVM, LR, NB, KNN e DT erano fulminei (meno di 10 ms). RF, XGB, AdB e GB erano più lenti (oltre 100 ms). Con i dataset aumentati o processati con Canny, i tempi tendevano generalmente ad aumentare, a volte anche di parecchio. Ad esempio, SVM, che era veloce su DS0, diventava molto più lento su DS3 (il dataset con Canny aumentato).

Queste osservazioni sono cruciali. Se voglio un’app che dia una risposta immediata sul cellulare del medico, non posso permettermi un modello che ci mette secondi a elaborare un’immagine e che occupa troppa memoria.

Cosa Ci Portiamo a Casa?

Allora, qual è il succo di tutta questa storia? Primo, che il preprocessing con Canny Edge Detection, almeno in questo specifico contesto dell’analisi della scrittura per il Parkinson, sembra fare più male che bene. Rischia di eliminare dettagli fini che invece sono utili ai modelli.

Secondo, che aumentare i dati è generalmente positivo per l’accuratezza, ma bisogna tenere d’occhio memoria e latenza, specialmente per certi modelli. Non è detto che “più grande” sia sempre “meglio” in termini pratici.

Terzo, esistono modelli come la Regressione Logistica e gli Alberi Decisionali che si confermano “campioni di leggerezza”, offrendo un buon compromesso tra prestazioni e risorse. La Random Forest si distingue per la sua stabilità di memoria.

Quindi, la prossima volta che sentirete parlare di una nuova tecnica “miracolosa” di preprocessing o di un modello super complesso che promette meraviglie, ricordatevi che la realtà è spesso più sfumata. Nel campo medico, e in particolare per applicazioni destinate a dispositivi portatili o a basso consumo, la semplicità, l’efficienza e una profonda comprensione di come i dati vengono trattati possono fare davvero la differenza.

Il nostro lavoro, spero, aggiunge un piccolo tassello a questo enorme puzzle, aiutando a scegliere gli strumenti giusti per una diagnosi del Parkinson sempre più accurata, accessibile e tempestiva. E chissà, magari in futuro, analizzando una semplice spirale, potremo davvero cambiare la vita di molte persone.

Visualizzazione astratta di un cervello umano con connessioni neurali luminose che si trasformano in una spirale disegnata digitalmente, simboleggiando il legame tra attività cerebrale, controllo motorio e diagnosi tramite IA. Wide-angle, 10mm, long exposure, focus nitido.

C’è ancora tanta strada da fare, ovviamente. Ad esempio, sarebbe interessante vedere cosa succede calibrando meglio i modelli prima dell’allenamento, o combinando l’analisi della scrittura con altri biomarcatori. Ma ogni passo, anche quello che sembra “smentire” un’aspettativa (come l’utilità universale di Canny), è un passo avanti nella conoscenza.

Spero che questa “chiacchierata” vi sia piaciuta e vi abbia incuriosito. Alla prossima!

Fonte: Springer

Articoli correlati

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *