Grano e Orzo: L’Intelligenza Artificiale Rivela i Terreni Migliori in Etiopia!
Eccoci qui, amici appassionati di scienza e tecnologia! Oggi voglio parlarvi di una sfida che mi sta particolarmente a cuore: la sicurezza alimentare. Sembra un parolone, vero? Ma in parole povere, significa garantire che tutti abbiano abbastanza cibo per vivere bene. E credetemi, in un mondo con una popolazione in continua crescita, specialmente in paesi in via di sviluppo come l’Etiopia, questa è una vera e propria corsa contro il tempo.
Il governo etiope e diverse organizzazioni si stanno dando un gran da fare, con politiche e strategie mirate. Una delle carte vincenti? La tecnologia, ovviamente! L’idea è quella di usarla per dare una bella spinta alla produttività agricola. E qui entra in gioco l’agricoltura di precisione, un approccio super moderno che, se usato bene, può fare miracoli per i raccolti.
Sfida Globale, Soluzione Locale: Cibo per Tutti!
Pensateci un attimo: uno dei fattori chiave per un buon raccolto è scegliere il terreno giusto. Sembra banale, ma non lo è affatto. Immaginate di piantare qualcosa nel posto sbagliato… un disastro! Il problema è che i metodi tradizionali per capire se un terreno è adatto o meno a una certa coltura sono spesso lenti, costosi e, diciamocelo, non sempre precisissimi.
Ecco perché, nel mio piccolo, ho voluto esplorare come le tecniche di machine learning (sì, l’intelligenza artificiale!) possano darci una mano. Nello specifico, mi sono concentrato su due colture importantissime per l’Etiopia: il grano e l’orzo. L’obiettivo? Prevedere con accuratezza l’idoneità dei terreni per queste due coltivazioni.
Il Vecchio Metodo? Buono, Ma Si Può Fare di Meglio!
In Etiopia, l’agricoltura è la spina dorsale dell’economia: dà da vivere all’80-85% della popolazione! Ma i terreni agricoli sono una risorsa limitata e preziosa, minacciata da erosione, frane, deforestazione e impoverimento delle falde acquifere. In più, la dimensione media delle aziende agricole è piccolissima, meno di un ettaro per famiglia. Capite bene che sfruttare al meglio ogni singolo pezzetto di terra diventa fondamentale.
Tradizionalmente, la valutazione dell’idoneità dei terreni viene fatta da esperti agricoli, che usano sistemi informativi geografici (GIS) e metodi come l’AHP (Analytic Hierarchy Process). Seguono le linee guida della FAO (l’Organizzazione delle Nazioni Unite per l’Alimentazione e l’Agricoltura), che richiedono un sacco di lavoro per mappare le caratteristiche del terreno con le esigenze nutritive delle colture. Un processo che, come dicevo, porta via tempo, energie e denaro. E se si sbaglia l’abbinamento tra terreno e coltura, il raccolto ne risente.
L’agricoltura, a livello globale, contribuisce per circa il 33,3% al prodotto interno lordo (PIL) e la sua crescita è fondamentale per migliorare il benessere collettivo. Pensate che in Etiopia, stime recenti indicano che il 68,7% della popolazione vive in condizioni di povertà multidimensionale. Nonostante gli sforzi per diversificare l’economia, l’agricoltura resta la principale fonte di reddito.
La crescita demografica aumenta la domanda di cibo e mette sotto pressione la disponibilità di terra. L’espansione dell’uso del suolo e della copertura del suolo porta a una carenza di terreni agricoli disponibili, che a sua volta si traduce in carenze alimentari. C’è quindi un bisogno disperato di modi innovativi per soddisfare la domanda alimentare di una popolazione in crescita.

Entra in Scena l’Intelligenza Artificiale: La Nostra Scommessa
Il machine learning è già stato utilizzato con successo in agricoltura per un sacco di cose: riconoscimento delle specie, gestione del suolo, previsione dell’idoneità dei terreni (proprio il nostro caso!), miglioramento genetico delle specie, gestione dell’acqua, gestione delle colture, previsione dei raccolti, gestione della qualità delle colture, rilevamento delle malattie delle piante, riconoscimento delle erbe infestanti e gestione del bestiame. Insomma, un vero jolly!
Per questo studio, abbiamo quindi deciso di “allenare” dei modelli di machine learning per prevedere l’idoneità dei terreni per grano e orzo. Abbiamo utilizzato dati relativi al suolo, al clima, alla topografia e ai nutrienti necessari alle colture. Siamo convinti che una classificazione efficace dell’idoneità dei terreni possa aiutare gli agricoltori a scegliere le colture giuste per i loro appezzamenti, migliorando così i raccolti.
I dati li abbiamo ottenuti dalla Engineering Corporation of Oromia (ECO), un’azienda etiope che si occupa, tra le altre cose, di pianificazione dell’uso del suolo. Questi dati grezzi, però, non erano pronti all’uso: c’erano valori mancanti, rumore, dati imprecisi, incongruenze. Un bel lavoro di “pulizia” e pre-elaborazione è stato necessario per renderli digeribili dai nostri modelli. Abbiamo usato tecniche come l’imputazione della media per i valori mancanti, la codifica delle etichette per i dati categorici e la normalizzazione min-max per scalare le caratteristiche.
Gli “Chef” Stellati: I Nostri Algoritmi di Machine Learning
Per il nostro “esperimento culinario” abbiamo scelto tre “chef” d’eccezione, ovvero tre algoritmi di machine learning noti per la loro efficacia:
- Random Forest (RF): Immaginatelo come un comitato di alberi decisionali. Ogni albero dà il suo parere, e alla fine si sceglie la decisione più votata. È robusto e bravo a gestire dati complessi e non lineari.
- Gradient Boosting (GB): Anche questo è un metodo d’insieme, ma funziona in modo iterativo. Costruisce alberi uno dopo l’altro, dove ogni nuovo albero cerca di correggere gli errori di quello precedente. Spesso dà risultati eccellenti.
- K-Nearest Neighbour (KNN): Questo è più intuitivo. Per classificare un nuovo dato, guarda ai suoi ‘k’ vicini più prossimi nel dataset di addestramento e gli assegna la classe più comune tra questi vicini. Semplice ma efficace, soprattutto se i dati sono ben scalati.
Prima di dare in pasto i dati ai modelli, abbiamo dovuto fare un’altra cosa importante: la selezione delle caratteristiche (feature selection). Non tutte le informazioni sono ugualmente utili, alcune possono addirittura confondere i modelli. Abbiamo usato tre tecniche per scegliere solo le caratteristiche più rilevanti: Univariate Feature Selection (UFS), Recursive Feature Elimination with Cross Validation (RFECV) e Sequential Forward Selection (SFS).
La “Ricetta” del Successo: Come Abbiamo Lavorato
Il dataset originale per la modellazione dell’idoneità dei terreni per le due colture comprendeva dati sulle proprietà fisiche e chimiche del suolo, caratteristiche climatiche (temperatura e precipitazioni) e caratteristiche topografiche come la pendenza. Questi dati sono stati mappati con i requisiti di suolo, clima e topografia del grano e dell’orzo, i cui intervalli sono stabiliti dal Quadro FAO. Successivamente, è stata effettuata l’etichettatura con le classi di idoneità del terreno identificate nel Quadro FAO: S1 (altamente idoneo), S2 (moderatamente idoneo), S3 (marginalmente idoneo), N1 (attualmente non idoneo) e N2 (permanentemente non idoneo), che sono le etichette di classe di questo studio. Il dataset è stato revisionato da esperti agricoli.
L’area di studio è il sotto-bacino di Weyib, situato interamente nella zona di Bale, regione di Oromia, che copre circa 1.086.436,84 ettari. Quest’area presenta un paesaggio diversificato che causa microclimi variati, permettendo la produzione di una varietà di colture.
Una volta preparati i dati e selezionate le caratteristiche, abbiamo addestrato i nostri modelli. Per essere sicuri che i risultati fossero affidabili e non dovuti al caso, abbiamo usato la validazione incrociata stratificata a dieci fold (stratified tenfold cross-validation). In pratica, il dataset viene diviso in dieci parti: nove si usano per addestrare il modello e una per testarlo, e si ripete il processo dieci volte cambiando la parte di test. La “stratificazione” assicura che ogni “fold” abbia una proporzione simile delle diverse classi di idoneità del terreno.
E per ottenere il massimo dai nostri modelli, abbiamo fatto anche l’ottimizzazione degli iperparametri con una ricerca randomizzata convalidata incrociatamente. È come regolare finemente gli ingredienti di una ricetta per trovare il sapore perfetto!
Le metriche di valutazione delle prestazioni che abbiamo utilizzato includono accuratezza, precisione, richiamo e F1-score. L’accuratezza è la percentuale di valori classificati correttamente. La precisione è la proporzione di veri positivi classificati come positivi. Il richiamo è la proporzione di positivi classificati correttamente. L’F1-score è la media armonica di precisione e richiamo, fornendo una misura bilanciata.

I Risultati? Da Leccarsi i Baffi!
Ebbene, dopo tutto questo lavoro, qual è stato il modello migliore? Rullo di tamburi… Il Gradient Boosting (GB) abbinato alla tecnica di selezione delle caratteristiche Sequential Forward Selection (SFS) si è dimostrato il campione indiscusso! Ha raggiunto un’accuratezza del 99,41%, una precisione del 99,37%, un richiamo del 99,34% e un F1-score del 99,35%. Numeri davvero impressionanti, che ci dicono che il modello è estremamente bravo a fare previsioni corrette.
Le caratteristiche più rilevanti selezionate da SFS per ottenere questa performance sono state 10: tessitura del suolo, temperatura minima media, temperatura massima media, precipitazioni annuali, profondità del suolo, pendenza massima in percentuale, conducibilità elettrica del suolo, potassio nel suolo, fosforo disponibile e nome della coltura.
Abbiamo confrontato le prestazioni dei modelli con e senza selezione delle caratteristiche. Ad esempio, le prestazioni dei modelli RF, GB e KNN con UFS sono risultate inferiori rispetto all’utilizzo del set di caratteristiche originali. RFECV ha migliorato le prestazioni di RF rispetto al set originale, ma non ha superato GB con il set originale. SFS, invece, ha migliorato le prestazioni di tutti e tre i modelli in tutte le metriche.
È interessante notare che, per KNN, abbiamo provato anche a normalizzare le caratteristiche (scalatura min-max), ma questo non ha portato a un miglioramento delle prestazioni rispetto al dataset non normalizzato. Questo ci suggerisce che, per questo specifico problema e dataset, la normalizzazione non era un fattore critico per KNN, o che altre dinamiche erano più influenti.
Cosa Significa Tutto Questo per l’Agricoltura Etiope?
Un modello così accurato può essere la base per sviluppare un sistema di supporto decisionale. Immaginate agricoltori o agronomi che, inserendo i dati del loro terreno, possono ricevere indicazioni precise su quanto quel terreno sia adatto per coltivare grano o orzo. Questo significa decisioni più informate, meno sprechi e, si spera, raccolti più abbondanti. Potrebbe davvero aiutare ad aumentare la produttività di queste colture vitali per l’Etiopia.
Questo studio, a mio avviso, dimostra che l’approccio basato sul machine learning supera i metodi tradizionali di mappatura dell’idoneità dei terreni in termini di accuratezza e può far risparmiare tempo prezioso.
Un Confronto con il Passato: Perché Siamo Entusiasti
Abbiamo dato un’occhiata anche a studi precedenti. Ad esempio, Komolafe et al. avevano ottenuto un’accuratezza dell’87,5% per la manioca usando SVM e alberi decisionali, ma con un dataset molto più piccolo. Kennedy et al. avevano raggiunto il 90% di accuratezza per il sorgo con Random Forest, ma non avevano considerato alcune caratteristiche importanti del suolo come pH, azoto (N) e fosforo (P). Altri studi su grano e altre colture hanno mostrato buoni risultati, ma spesso con dataset limitati, meno caratteristiche o senza una robusta selezione delle caratteristiche e ottimizzazione degli iperparametri come quella che abbiamo cercato di implementare noi.
Il nostro modello proposto, GB con SFS, ha quindi prestazioni superiori rispetto a molti lavori precedenti, grazie anche all’inclusione di più caratteristiche, un dataset più ampio e una metodologia rigorosa.

Uno Sguardo al Futuro: L’Agricoltura Diventa Smart
Certo, questo è solo un passo. Il futuro potrebbe essere ancora più “smart”. Penso a sistemi basati sull’Internet of Things (IoT): sensori installati direttamente nei campi che raccolgono dati in tempo reale su nutrienti del suolo, temperatura, umidità, pioggia… Questi dati potrebbero alimentare direttamente i modelli di machine learning, fornendo agli agricoltori previsioni e consigli personalizzati direttamente sul loro smartphone. Fantascienza? Non proprio, la tecnologia esiste già!
Si potrebbe anche estendere questo lavoro per prevedere l’idoneità dei terreni per altre colture rilevanti, non solo grano e orzo.
Conclusioni: Un Futuro Fertile Grazie alla Tecnologia
In conclusione, sono davvero convinto che il machine learning possa giocare un ruolo cruciale nel migliorare la produttività agricola e affrontare la sfida della sicurezza alimentare, specialmente in contesti come quello etiope. Il nostro studio ha dimostrato che è possibile prevedere l’idoneità dei terreni per grano e orzo con un’accuratezza molto elevata.
Speriamo che questo lavoro possa essere d’aiuto agli esperti agricoli, ai pianificatori dell’uso del suolo e, soprattutto, agli agricoltori, per classificare in modo accurato e tempestivo i terreni più adatti, aprendo la strada a un futuro agricolo più prospero e sostenibile. La strada è ancora lunga, ma ogni piccolo passo basato sulla scienza e sull’innovazione ci avvicina all’obiettivo.
Fonte: Springer
