Viaggio al Centro della Roccia: Ricostruzione 3D con StyleGAN e Transformer
Ciao a tutti! Oggi voglio portarvi con me in un viaggio affascinante, non nello spazio profondo, ma nelle profondità della Terra, o meglio, nelle microstrutture delle rocce che la compongono. Perché mai dovremmo interessarci a come sono fatte le rocce a livello microscopico? Beh, la risposta è più importante di quanto pensiate!
L’Importanza Nascosta nelle Rocce Digitali
Nel sottosuolo si gioca una partita fondamentale per il nostro futuro energetico. Non parliamo solo di petrolio, gas e carbone, le energie fossili tradizionali, ma anche dello stoccaggio di energie più pulite come quella eolica, solare, geotermica e persino l’idrogeno. E non dimentichiamo la possibilità di seppellire in modo sicuro i gas serra, come la CO2. Capire come sono fatte le rocce del sottosuolo, la loro porosità (quanti spazi vuoti ci sono) e la loro permeabilità (quanto facilmente i fluidi possono attraversarle), è cruciale per ottimizzare l’uso di queste risorse.
Queste caratteristiche macroscopiche dipendono direttamente da come la roccia è strutturata a livello micro, dalla sua architettura interna. Ecco perché la ricostruzione 3D di queste strutture, creando quelle che chiamiamo “rocce digitali”, è diventata un campo di ricerca caldissimo.
I Metodi Tradizionali: Tra Costi e Limiti
Finora, avevamo principalmente due strade per sbirciare dentro le rocce:
- Metodi Sperimentali Fisici: Si prende un campione di roccia, lo si “affetta” digitalmente con strumenti come la tomografia computerizzata (CT), la risonanza magnetica (MRI) o microscopi elettronici avanzati (FIB-SEM), e si mettono insieme le fette per creare un modello 3D. Affidabile? Sì. Costoso e lento? Assolutamente sì! Servono macchinari costosi, tempo e spesso i campioni sono fragili e difficili da preparare.
- Metodi di Simulazione Numerica: Si parte da immagini 2D o 3D esistenti (chiamate “training images” o TI) e si usano algoritmi per generarne di nuove, statisticamente simili. Meno costoso, certo, ma spesso richiede tempi di calcolo lunghissimi e i risultati non sono sempre perfetti, specialmente con strutture complesse. Inoltre, un grosso limite è che le informazioni statistiche calcolate per una simulazione non possono essere riutilizzate, sprecando potenza di calcolo.
L’Intelligenza Artificiale Scende in Campo: Le Reti Generative Avversarie (GAN)
Qui entra in gioco l’intelligenza artificiale, e in particolare il deep learning. Tra le tecniche più promettenti ci sono le GAN (Generative Adversarial Networks). Immaginate due reti neurali che giocano a guardie e ladri: una (il Generatore) cerca di creare immagini di rocce digitali il più realistiche possibile, partendo da rumore casuale; l’altra (il Discriminatore) cerca di distinguere le immagini finte da quelle reali (le TI). Allenandosi insieme, il Generatore diventa sempre più bravo a “ingannare” il Discriminatore, producendo immagini incredibilmente simili a quelle vere.
Le GAN hanno mostrato risultati notevoli nella ricostruzione 3D delle rocce, accelerando enormemente il processo grazie all’uso delle GPU. Tuttavia, anche le GAN hanno i loro problemi: l’allenamento può essere instabile, portando a risultati bizzarri, e i modelli esistenti faticano a integrare completamente le informazioni a diverse scale di dettaglio presenti nelle immagini di training.

La Nostra Proposta: STGAN, l’Unione Fa la Forza
Ed è qui che entra in scena il nostro lavoro. Per superare i limiti delle GAN tradizionali, abbiamo sviluppato un nuovo modello che abbiamo chiamato STGAN (Style-Transformer GAN). Cosa fa di speciale? Combina due tecnologie potentissime:
- StyleGAN: Una versione avanzata di GAN, già nota per la sua capacità di generare immagini di alta qualità e di controllare lo “stile” dell’immagine a diversi livelli. Noi la usiamo come base.
- Transformer: Una architettura di rete neurale che ha rivoluzionato il campo dell’elaborazione del linguaggio naturale (pensate a ChatGPT) e che si sta dimostrando fortissima anche con le immagini. Il suo segreto è il “meccanismo di attenzione”, che permette alla rete di “concentrarsi” sulle parti più importanti dell’input e di capire le relazioni tra di esse, anche a lunga distanza.
Nel nostro STGAN, usiamo i blocchi Transformer per estrarre caratteristiche dalle immagini di training a diverse risoluzioni (multi-scala). Questo permette al modello di catturare sia i dettagli fini (ad alta risoluzione) sia la struttura globale (a bassa risoluzione) delle rocce, cosa fondamentale per una ricostruzione accurata. È come se il Transformer potesse zoomare avanti e indietro sull’immagine per capirla meglio.
In più, abbiamo aggiunto un “trucco”: usiamo la distribuzione della porosità delle sezioni 2D dell’immagine di training 3D come “dato condizionale”. In pratica, diciamo al modello non solo di creare una roccia realistica, ma anche di assicurarsi che la variazione della porosità lungo una direzione specifica sia simile a quella del campione reale. Questo aiuta a controllare meglio il processo e a ottenere risultati più fedeli.
Alla Prova dei Fatti: Shale, Fratture e Pori
Per vedere se il nostro STGAN funzionava davvero, lo abbiamo messo alla prova confrontandolo con altri due metodi di deep learning noti: DCGAN (Deep Convolutional GAN) e lo stesso StyleGAN da cui siamo partiti. Abbiamo usato dati reali provenienti da campioni di shale (un tipo di roccia sedimentaria), ottenuti tramite scansioni nano-CT ad altissima risoluzione. Abbiamo preparato due set di dati di training (TI):
- Uno con shale caratterizzato da fratture significative (immagini 128x128x128 pixel).
- Uno con shale con pori più “generali”, distribuiti in modo più uniforme (immagini 64x64x64 pixel).
Per valutare i risultati, non ci siamo limitati a guardare le immagini. Abbiamo usato una batteria di metriche quantitative per misurare quanto le rocce ricostruite fossero simili a quelle reali:
- Porosità totale e distribuzione della porosità.
- Analisi della rete porosa: numero e dimensione di pori e “gole” (i canali che li collegano), distinguendo tra pori connessi (importanti per il flusso) e isolati.
- Permeabilità assoluta: una misura diretta di quanto facilmente un fluido può attraversare la roccia.
- Connettività multi-punto (MPC): una misura statistica di come i punti all’interno della roccia sono connessi tra loro a diverse distanze.
- Funzionali di Minkowski: descrittori morfologici che catturano l’area superficiale, l’ampiezza media e la connettività topologica (caratteristica di Eulero).
- Diversità: abbiamo verificato che il modello non producesse sempre la stessa immagine, ma una varietà di ricostruzioni realistiche, usando una tecnica chiamata MS-SWD-MDS.
- Confronto delle sequenze di porosità lungo l’asse Z.

Cosa Dicono i Risultati? STGAN Batte la Concorrenza?
I risultati sono stati davvero incoraggianti! In entrambi i casi (shale con fratture e shale con pori generali), il nostro STGAN ha generalmente superato sia DCGAN che StyleGAN nella maggior parte delle metriche.
Le immagini generate da STGAN non solo apparivano visivamente più simili ai campioni reali, ma le analisi quantitative hanno confermato questa somiglianza.
- La porosità media e la sua distribuzione erano più vicine a quelle reali.
- L’analisi della rete porosa (numero di pori, diametri, numero di gole, ecc.) prodotta da STGAN corrispondeva meglio a quella delle TI. In particolare, riusciva a distinguere meglio tra pori connessi e isolati.
- Le stime della permeabilità calcolate sui modelli STGAN erano le più vicine a quelle dei campioni reali nelle tre direzioni.
- Le curve di connettività multi-punto (MPC) e i funzionali di Minkowski delle ricostruzioni STGAN mostravano la minore differenza rispetto alle TI.
- Il test di diversità ha mostrato che STGAN, pur essendo molto fedele alle TI (grazie anche al condizionamento sulla porosità), era in grado di generare una buona varietà di campioni realistici, evitando il rischio di “overfitting” (cioè imparare troppo a memoria i dati di training).
In sostanza, l’uso combinato dell’attenzione multi-scala del Transformer e del controllo di stile di StyleGAN, unito al vincolo sulla porosità, sembra davvero migliorare la capacità del modello di catturare la complessa architettura 3D delle rocce.
Uno Sguardo alle Prestazioni e ai Requisiti
Ovviamente, queste tecniche avanzate richiedono una certa potenza di calcolo. Abbiamo eseguito i nostri esperimenti su Google Colab usando GPU NVIDIA Tesla V100. È interessante notare che, mentre StyleGAN era leggermente più veloce e richiedeva meno memoria grafica per generare le immagini finali, il nostro STGAN aveva requisiti inferiori in termini di utilizzo della CPU e della GPU durante il processo.
La sfida principale, come spesso accade nel deep learning per immagini 3D, resta la memoria della GPU necessaria per l’allenamento e la generazione, specialmente per immagini di grandi dimensioni. Per ricostruire immagini 128x128x128, abbiamo visto che servono almeno 11.68 GB di memoria grafica con STGAN sulla nostra configurazione. Per volumi più piccoli, come il Volume Elementare Rappresentativo (REV) – la dimensione minima per cui le proprietà della roccia sono stabili – che abbiamo stimato essere circa 62x60x28 voxel per il nostro campione con pori generali, i requisiti sono più contenuti (circa 2.08 GB per un volume simile).

Conclusioni: Un Passo Avanti per le Geoscienze
Cosa ci portiamo a casa da questo viaggio? La ricostruzione 3D delle rocce digitali è fondamentale per molte applicazioni ingegneristiche e geoscientifiche. Il nostro approccio STGAN, che fonde le capacità di StyleGAN e Transformer, rappresenta un passo avanti significativo.
I vantaggi principali sono:
- Migliore cattura delle caratteristiche multi-scala: Grazie al Transformer, il modello “vede” sia i dettagli fini che la struttura generale.
- Maggiore controllo e fedeltà: L’uso della sequenza di porosità come dato condizionale migliora l’accuratezza della ricostruzione.
- Qualità superiore delle immagini: I confronti con DCGAN e StyleGAN hanno dimostrato la superiorità di STGAN nel riprodurre le caratteristiche chiave delle rocce reali, sia visivamente che quantitativamente.
Certo, la strada è ancora lunga e le sfide computazionali esistono, ma crediamo che metodi come STGAN aprano nuove, entusiasmanti possibilità per studiare il sottosuolo in modo più rapido, economico ed efficace. È un esempio affascinante di come l’intelligenza artificiale possa aiutarci a svelare i segreti nascosti sotto i nostri piedi!
Fonte: Springer
