Occhi Elettronici e Muscoli Intelligenti: La Rivoluzione Anti-Groviglio per le Gru!
Ciao a tutti! Oggi voglio portarvi con me in un’avventura tecnologica che, credetemi, potrebbe cambiare le carte in tavola per la sicurezza nei cantieri. Parliamo di gru, macchinari imponenti e fondamentali, ma che nascondono un’insidia tanto piccola quanto potenzialmente disastrosa: l’avvolgimento scorretto della fune sul tamburo. Sembra una cosa da poco, vero? Eppure, una fune che si accavalla, che crea “vuoti” o si allenta, può portare a slittamenti, usura anomala e, nei casi peggiori, a blocchi improvvisi o addirittura al cedimento. Un vero incubo per la sicurezza e per i costi di manutenzione!
Da operatore del settore, so bene quanto sia cruciale tenere d’occhio questo aspetto. Spesso, ci si affida all’occhio esperto del gruista, ma l’errore umano è sempre dietro l’angolo, specialmente dopo ore di lavoro o in condizioni di scarsa visibilità. E se vi dicessi che abbiamo trovato un modo per dare alle gru degli “occhi” super intelligenti e dei “muscoli” pronti a reagire prima che sia troppo tardi? Proprio di questo tratta la nostra ultima fatica: un sistema che combina la potenza dei Vision Transformers (una branca fichissima dell’Intelligenza Artificiale) con le informazioni sul carico della gru per monitorare l’avvolgimento della fune in tempo reale.
Il Problema: Quando la Fune Fa i Capricci
Immaginate la scena: la fune si avvolge sul tamburo. Se non c’è la giusta tensione, o se il carico è troppo leggero, la fune può “ammollarsi”, creando delle spire lasche. Queste zone, chiamate in gergo “gaps” o “slacks”, sono il male. Una spira successiva potrebbe incastrarsi in uno di questi vuoti, causando un avvolgimento inverso – un bel pasticcio che blocca tutto e richiede manutenzione forzata. Pensate che, secondo gli esperti, fino al 40% dei costi di un progetto può essere assorbito dalle sole macchine, quindi ogni fermo macchina è una perdita secca, per non parlare dei rischi per chi lavora.
Tradizionalmente, la soluzione è la vigilanza costante dell’operatore o, in alcune gru moderne, dispositivi meccanici che guidano la fune. Ma non tutte le gru ne sono dotate, e l’intervento umano, per quanto prezioso, non è infallibile. Da qui la nostra domanda: è possibile “aggiornare” una gru, anche non di ultimissima generazione, con un sistema di sensori intelligenti che assista l’operatore, aumentando la sicurezza e riducendo il suo carico di lavoro?
L’Idea Geniale: Unire Vista e Forza (dati di carico!)
La nostra scommessa è stata quella di usare una semplice telecamera RGB – quelle che ormai costano poco, sono piccole e offrono immagini ad alta risoluzione – abbinata all’Intelligenza Artificiale. L’idea è di installare questa telecamera puntata sul tamburo della fune e far analizzare le immagini in tempo reale da un algoritmo. Ma non ci siamo fermati qui. Perché solo le immagini non bastano?
Beh, pensateci:
- Se ci basassimo solo sul peso del carico: se il gancio è a terra, il sensore della gru rileverebbe un peso bassissimo, interpretandolo come condizione di pericolo e fermando tutto. L’operatore dovrebbe intervenire per sbloccare la situazione.
- Se ci basassimo solo sulle immagini: la fune potrebbe mostrare una curvatura sospetta (magari per una rapida inversione di marcia) anche con un carico pesante, situazione che normalmente non sarebbe pericolosa, ma l’AI potrebbe interpretarla male e fermare la gru.
Abbiamo osservato che un avvolgimento scorretto può verificarsi anche con carichi tra i 10 e i 60 kg, mentre un avvolgimento corretto avviene tipicamente con carichi tra i 30 e i 90 kg. Vedete? C’è una sovrapposizione! Quindi, né l’uno né l’altro dato, da solo, è sufficiente. La soluzione? Fondere le informazioni visive con quelle del carico! In questo modo, il sistema diventa molto più robusto e affidabile, riducendo i falsi positivi e i veri negativi.

Mettiamoci all’Opera: Il Nostro Setup Tecnologico
Per mettere alla prova la nostra idea, abbiamo scelto una minigru Jekko SPX532. Il bello di questa gru è che ha un’interfaccia sensori integrata che ci permette di “spiare” dati cruciali come la rotazione della torre, l’inclinazione del braccio e, soprattutto per noi, il peso sul gancio. Questi dati viaggiano su un bus CAN, un protocollo di comunicazione standard nel mondo automotive e industriale.
Il cuore del nostro sistema? Un paio di Raspberry Pi! Sì, quei piccoli computer grandi come una carta di credito. Uno dei Raspberry Pi, equipaggiato con un ricetrasmettitore CAN, si collega alla centralina della gru per leggere i dati e, se necessario, inviare comandi (come quello di stop!). L’altro Raspberry Pi si occupa di elaborare le immagini provenienti dalla telecamera RGB, installata vicino al tamburo. Per far comunicare tutto agilmente, abbiamo usato il framework ROS2 (Robot Operating System 2), una specie di coltellino svizzero per sviluppare applicazioni robotiche. Questo ci ha permesso di creare un’interfaccia flessibile, dove i comandi alla gru possono arrivare da diverse fonti, e il nostro sistema di visione può inviare il segnale di “allarme” in modo efficiente. Per ottimizzare le prestazioni, i Raspberry Pi sono collegati via cavo Ethernet a un router 5G, minimizzando latenze e interferenze.
Il Cervello AI: Vision Transformer e Compagni
E qui viene il bello: l’Intelligenza Artificiale. Abbiamo deciso di puntare sui Vision Transformers (ViT). Senza entrare in tecnicismi pazzeschi, immaginate che il ViT divida l’immagine del tamburo e della fune in tanti piccoli “quadratini” (patch). Ognuno di questi pezzetti viene trasformato in un codice numerico (embedding) e poi analizzato da una serie di “strati intelligenti” (encoder) che cercano pattern e relazioni. La vera novità del nostro approccio è che, a questa sequenza di “pezzi d’immagine”, abbiamo aggiunto un token extra: un codice che rappresenta il peso del carico rilevato dalla gru. Questo token viene “fuso” con le informazioni visive, permettendo al modello di avere un quadro completo della situazione. All’inizio della sequenza c’è anche un token speciale, il CLS token, che alla fine del processo ci dirà se l’avvolgimento è “Normale” o “Pericoloso”. Se è pericoloso, scatta lo stop alla gru!
Per darvi un’idea, il sensore di carico della gru fornisce il peso a incrementi di 10 kg. Noi abbiamo scalato questa lettura in 10 valori interi, da 0 (fune completamente scarica, gancio a terra) a 9 (peso del solo gancio e della fune, o carichi superiori, che per noi non aggiungono info utili sullo stato della fune in sé). Questo valore numerico viene poi “embeddato” e dato in pasto al Transformer insieme alle patch dell’immagine.
Abbiamo anche testato un’alternativa, una rete neurale convoluzionale (CNN) chiamata MobileNetV2. Le CNN sono note per essere più facili da addestrare con dataset limitati e meno esigenti dal punto di vista computazionale, il che le rende interessanti per dispositivi “piccoli” come il Raspberry Pi. Abbiamo adattato MobileNetV2 per fargli digerire sia l’immagine che l’informazione sul carico, concatenandole prima del classificatore finale.

I Risultati sul Campo: Parla la Gru!
Abbiamo raccolto un bel po’ di dati: oltre 40.000 immagini, equamente divise tra avvolgimenti corretti e scorretti. Dopo aver addestrato i nostri modelli (vari Vision Transformer con un numero diverso di strati encoder, da 2 a 8, e il MobileNetV2 modificato), li abbiamo messi alla prova su un set di 20.000 immagini mai viste prima.
I risultati? Davvero incoraggianti! Un Vision Transformer con soli 2 strati encoder ha raggiunto un’accuratezza di quasi il 98%. E la cosa ancora più interessante è il tempo di inferenza, cioè quanto ci mette il modello a dare un responso su una nuova immagine: circa 1/4 di secondo sul Raspberry Pi. Considerando che la velocità di avvolgimento della fune è relativamente lenta (0.20-0.25 m/s), questo tempo di reazione è più che sufficiente per fermare l’operazione prima che si creino situazioni critiche.
Aumentando il numero di encoder nel ViT, l’accuratezza migliora leggermente, ma aumentano anche i parametri da calcolare e, di conseguenza, il tempo di inferenza. Abbiamo anche provato a “quantizzare” i modelli, una tecnica per renderli più leggeri e veloci sostituendo i calcoli in virgola mobile con formati più snelli (tipo interi). Questo ha ridotto le dimensioni dei modelli di quasi la metà, ma, sorprendentemente, non ha velocizzato molto i Vision Transformer sul Raspberry Pi. L’unica eccezione è stata MobileNetV2, che grazie alla sua architettura particolare (convoluzioni separabili in profondità) ha beneficiato parecchio della quantizzazione, diventando più veloce.
Cosa Abbiamo Imparato e Dove Stiamo Andando
Questo studio, che consideriamo un “proof-of-concept”, ha dimostrato che è assolutamente fattibile rilevare problemi imminenti di avvolgimento della fune usando un Vision Transformer che combina immagini e dati di carico. Il bello è che il nostro sistema si integra con i sensori esistenti della gru e una semplice telecamera, senza modificare il cuore del sistema di controllo della gru, il che è fondamentale per questioni di sicurezza e certificazione.
Quando l’algoritmo rileva un potenziale problema, il tamburo viene fermato e un segnale acustico (un buzzer, per esempio) avvisa l’operatore. A quel punto, l’operatore può ispezionare la situazione e procedere a svolgere e riavvolgere correttamente la fune. Certo, al momento il sistema fornisce solo un avviso e richiede un intervento manuale. Ma il futuro è già qui! Stiamo pensando di integrare il Vision Transformer in un sistema automatizzato capace non solo di fermare l’avvolgimento, ma anche di svolgere la fune quanto necessario e riprendere l’avvolgimento in modo corretto, autonomamente.
Ovviamente, ci sono ancora passi da fare, soprattutto per quanto riguarda le normative di sicurezza e i livelli di affidabilità richiesti per macchinari da cantiere. Tecniche come il Quantization Aware Training (QAT), dove la quantizzazione viene considerata già durante l’addestramento, o il pruning (sfoltimento) dei modelli, potrebbero aiutarci a ottimizzare ulteriormente i tempi di inferenza senza sacrificare l’accuratezza.
Insomma, la strada è tracciata. L’idea di avere gru più “consapevoli” e capaci di auto-proteggersi (e proteggere chi ci lavora intorno) non è più fantascienza. E noi siamo entusiasti di essere in prima linea in questa piccola, grande rivoluzione per la sicurezza e l’efficienza nei cantieri!
Fonte: Springer
