Deep Learning: L’Occhio Hi-Tech che Svela i Segreti delle Fette di Acorus
Ciao a tutti! Oggi voglio parlarvi di una sfida affascinante che abbiamo affrontato nel campo della Medicina Tradizionale Cinese (MTC), un mondo ricco di sapienza millenaria ma che, a volte, presenta dei veri e propri rompicapi. Avete presente quelle situazioni in cui due cose sembrano identiche, ma nascondono differenze cruciali? Beh, nel mondo delle erbe medicinali cinesi, questo è un bel grattacapo, specialmente quando si parla di Acorus tatarinowii Rhizoma (che chiameremo d’ora in poi Shi Chang Pu) e Acorus calamus Rhizoma (noto come Shui Chang Pu). Entrambi sono rizomi del genere Acorus, usati sotto forma di fettine essiccate, ma le loro proprietà terapeutiche sono diverse. E qui casca l’asino: sul mercato, spesso, finiscono per essere confusi o mischiati, con potenziali ricadute sull’efficacia e la sicurezza dei trattamenti.
Il Problema: Due Gocce d’Acqua (o Quasi!) con Effetti Diversi
Immaginatevi di dover distinguere due tipi di fettine essiccate di rizoma che, a occhio nudo, sembrano gemelle separate alla nascita. Lo Shi Chang Pu, secondo la Farmacopea Cinese, serve ad “aprire gli orifizi”, scacciare il catarro, rinfrescare la mente e migliorare l’intelligenza, oltre a trasformare l’umidità per stimolare l’appetito. Lo Shui Chang Pu, invece, è noto per riscaldare lo stomaco e alleviare infiammazioni e dolori. Capite bene che scambiarli non è proprio l’ideale!
Tradizionalmente, la loro identificazione si basa su metodi che hanno i loro limiti:
- Identificazione Empirica: Si basa sull’aspetto (colore, lunghezza degli internodi, sezione trasversale, odore). È un metodo diretto, ma dipende tantissimo dall’esperienza dell’esperto. Come dice un vecchio adagio, “il calamo affettato è una sfida anche per gli esseri celesti”. Soggettività e necessità di anni di pratica la fanno da padrone.
- Identificazione Microscopica: Analisi al microscopio di tessuti e polveri. Molto specifica, ma richiede personale e attrezzature specializzate.
- Identificazione Fisico-Chimica: Si sfruttano le diverse proprietà fisico-chimiche, ad esempio tramite cromatografia liquida o gassosa accoppiata a spettrometria di massa. Metodi accurati, ma lenti, costosi e che necessitano di strumentazione avanzata.
- Metodi Biologici: Sequenziamento del DNA, analisi dei codici a barre genetici, PCR-RFLP. Altamente specializzati e costosi, difficili da applicare su larga scala.
Viste queste limitazioni, urgeva trovare metodi più precisi, efficienti e accessibili.
La Svolta Tecnologica: Entra in Scena il Deep Learning
Ed è qui che entriamo in gioco noi, o meglio, la nostra passione per la tecnologia applicata a problemi concreti! Abbiamo pensato: e se potessimo insegnare a un computer a “vedere” e “capire” queste differenze sottili, proprio come un esperto erborista, ma con la velocità e la precisione di una macchina? Così è nata l’idea di usare il deep learning, una branca dell’intelligenza artificiale che sta facendo faville nel riconoscimento di immagini.
Il nostro obiettivo era duplice:
- Creare un sistema per classificare con alta precisione le fettine di Shi Chang Pu e Shui Chang Pu.
- Sviluppare un metodo per il rilevamento rapido degli oggetti (object detection) quando queste due specie si trovano mescolate.
Abbiamo quindi deciso di “tradurre” l’esperienza degli esperti in “esperienza macchina”, costruendo un sistema di riconoscimento intelligente, efficiente e accurato.

Costruire le Fondamenta: Un Dataset di Alta Qualità
Per insegnare a una macchina, servono “libri di testo” impeccabili. Nel nostro caso, questi libri sono immagini. Abbiamo messo insieme un dataset di ben 1.928 immagini di campioni di Shi Chang Pu e Shui Chang Pu, raccolti da mercati di erbe tradizionali, aziende del settore e persino direttamente da una base di coltivazione nella provincia di Hunan. Ogni campione è stato autenticato da un esperto farmacista. Niente specie protette o in via d’estinzione, sia chiaro!
La qualità del dataset è cruciale. Abbiamo scattato le foto con una fotocamera di smartphone ad alta risoluzione, in condizioni di illuminazione uniformi e su uno sfondo bianco pulito, per far risaltare le caratteristiche morfologiche delle fettine. Le fettine erano disposte piatte, singolarmente o non sovrapposte, per evitare confusione. Poi, un duro lavoro di pre-elaborazione: ritaglio e ridimensionamento delle immagini (224×224 pixel per il modello di classificazione, 640×640 per quello di object detection), correzione del colore e normalizzazione. Infine, un esperto del nostro gruppo ha etichettato meticolosamente ogni immagine, trasformando, come dicevo, l'”esperienza dell’esperto” in “esperienza macchina”. Questo passaggio è fondamentale per addestrare i modelli a riconoscere i dettagli più rilevanti.
Il dataset è stato poi suddiviso in training set (80%), validation set (10%) e test set (10%), una prassi standard per addestrare e valutare i modelli di machine learning senza barare!
ResNet50: Il Classificatore di Precisione
Per il compito di classificazione, ovvero dire se una fettina è Shi Chang Pu o Shui Chang Pu, abbiamo scelto un “campione” del deep learning: il modello ResNet50. Questo modello è famoso per la sua capacità di estrarre caratteristiche complesse dalle immagini grazie alla sua architettura profonda con “connessioni residue”, che aiutano a evitare problemi comuni nell’addestramento di reti neurali molto profonde. In pratica, l’immagine passa attraverso vari strati che ne estraggono caratteristiche sempre più astratte, dalla texture alla forma, informazioni vitali per la classificazione.
I risultati sono stati entusiasmanti: sul nostro test set, ResNet50 ha raggiunto un’accuratezza del 92,8%! Questo significa che è in grado di distinguere correttamente le due specie con grande affidabilità. Abbiamo anche fatto un passo in più, integrando nel ResNet50 dei moduli chiamati SE (Squeeze-and-Excitation). Questi moduli aiutano il modello a “prestare più attenzione” ai canali informativi più importanti dell’immagine, un po’ come se mettessimo degli occhiali speciali al nostro algoritmo. Ebbene, con questa aggiunta (ResNet50-SE), l’accuratezza è salita al 94,5%, un miglioramento dell’1,7% rispetto al modello base. Mica male, eh?

YOLOv8: Il Detective Hi-Tech per Oggetti Multipli
Ma cosa succede se le nostre fettine sono mescolate, come spesso accade sul mercato? Qui entra in campo un altro fuoriclasse: YOLOv8 (You Only Look Once versione 8). Questo modello è progettato per l’object detection, cioè non solo classifica gli oggetti in un’immagine, ma li localizza anche, disegnando un “rettangolo” attorno a ciascuno di essi. È l’ideale per riconoscere Shi Chang Pu e Shui Chang Pu quando appaiono contemporaneamente nel campo visivo.
YOLOv8 è noto per la sua velocità ed efficienza, mantenendo al contempo un’elevata accuratezza. E i nostri esperimenti lo confermano: abbiamo ottenuto un’accuratezza di rilevamento del 98,6% con una velocità di 22 frame al secondo (fps). Questo significa che il sistema è abbastanza veloce per applicazioni in tempo reale! Anche qui, abbiamo voluto innovare: abbiamo integrato un modulo di attenzione spaziale leggero nella rete di YOLOv8. Questo modulo aiuta il modello a concentrarsi sulle regioni dell’immagine che contengono le fettine target, sopprimendo il rumore di fondo. Il risultato? Un miglioramento del mAP50 (una metrica chiave per l’object detection) dell’1,2%, portandolo al 95,3%, mantenendo una velocità di 21 fps. Questa modifica ha aggiunto meno dell’1% di parametri aggiuntivi, dimostrando l’efficacia dei meccanismi di attenzione anche in questo contesto.
L’Innovazione dell’Attenzione: Vedere Ciò che Conta Davvero
Una delle chicche del nostro studio, come accennato, è stata l’integrazione di questi meccanismi di “attenzione” (i moduli SE per ResNet50 e l’attenzione spaziale per YOLOv8). In parole povere, questi meccanismi permettono ai modelli di deep learning di pesare l’importanza delle diverse caratteristiche estratte dalle immagini. È come se il modello imparasse a focalizzarsi sugli indizi più discriminanti, ignorando quelli irrilevanti o fuorvianti. Questo è particolarmente utile quando le differenze tra gli oggetti da classificare o rilevare sono sottili, proprio come nel caso delle nostre fettine di Acorus. L’incremento di accuratezza che abbiamo osservato dimostra quanto questa strategia sia potente per l’identificazione fine dei materiali erboristici cinesi.
Risultati Concreti e Prospettive Future
I risultati parlano chiaro: il deep learning non solo funziona, ma apre scenari incredibili per l’identificazione intelligente delle materie prime medicinali. Abbiamo dimostrato che ResNet50 può classificare con precisione le fettine di Shi Chang Pu e Shui Chang Pu, e che YOLOv8 può rilevarle rapidamente e accuratamente anche in contesti misti. Questi approcci offrono un’alternativa oggettiva, precisa ed efficiente ai metodi tradizionali, riducendo le imprecisioni e le incongruenze.
Certo, siamo consapevoli delle sfide. Ad esempio, il nostro dataset, seppur ampio, copre principalmente province della Cina meridionale; campioni da habitat particolari potrebbero non essere stati inclusi, limitando la generalizzabilità del modello in ambienti estremi. Inoltre, l’uso di YOLOv8 con i meccanismi di attenzione richiede una GPU di fascia media, il che potrebbe limitarne l’applicazione su dispositivi meno potenti.
Ma non ci fermiamo qui! Stiamo già pensando a come superare questi ostacoli:
- Aggiornamenti periodici del modello: Riaddestrare il modello annualmente con campioni locali e comprimerlo con tecniche di “distillazione della conoscenza” per renderlo adatto a dispositivi a basse prestazioni.
- Collaborazione uomo-macchina: Avviare una revisione manuale per le previsioni a bassa confidenza (ad esempio, inferiori al 90%) e registrare i casi ambigui per ottimizzare iterativamente il modello.
- Aumento della diversità dei campioni: Esplorare attivamente la cooperazione con i centri risorse di origine del calamo e creare una piattaforma dati aperta per incoraggiare i contributi della comunità.
- Adattamento all’Edge Computing: Sviluppare modelli leggeri (come YOLOv8-Tiny + Attenzione Adattiva) che supportino l’inferenza su CPU in tempo reale.
Siamo convinti che, con il continuo avanzamento tecnologico e l’affinamento dei nostri metodi, questo approccio innovativo plasmerà sempre di più il futuro del controllo qualità nell’industria delle materie prime medicinali tradizionali, inaugurando un’era di maggiore automazione e intelligenza. Un piccolo passo per noi, ma speriamo un grande passo per la MTC!

Fonte: Springer
