VAIM-CFF: L’Intelligenza Artificiale che Svela i Segreti Nascosti del Protone!
Amici appassionati di scienza, preparatevi perché oggi vi porto nel cuore pulsante della materia, là dove i segreti dei protoni aspettano solo di essere svelati! E come lo facciamo? Con un pizzico di magia moderna, ovvero l’intelligenza artificiale. Abbiamo sviluppato una nuova metodologia, che abbiamo battezzato VAIM-CFF, per andare a caccia dei cosiddetti Fattori di Forma di Compton (CFF). Questi CFF sono cruciali per capire come è fatto il protone in 3D, ma estrarli dai dati sperimentali, in particolare dalle reazioni esclusive profondamente virtuali come il DVCS (Deeply Virtual Compton Scattering), è un’impresa tutt’altro che semplice.
Ma cos’è questo VAIM-CFF e perché è così speciale?
Immaginate di dover risolvere un enigma complicatissimo, un vero e proprio “problema inverso”. Di solito, in fisica, conosciamo le cause (i CFF, nel nostro caso) e vogliamo prevedere gli effetti (le sezioni d’urto, cioè come le particelle interagiscono). Qui, invece, abbiamo gli effetti (le misure sperimentali) e vogliamo risalire alle cause (i CFF). Il bello del nostro VAIM-CFF, che sta per Variational Autoencoder Inverse Mapper, è che non si limita a darci una singola soluzione “fittata”, ma ci apre un ventaglio di possibilità, esplorando anche più soluzioni contemporaneamente per tutti gli 8 CFF a partire da una singola misura di sezione d’urto. Pensatelo come un investigatore super partes che considera tutte le piste possibili!
Ma c’è di più! Questo strumento ci permette anche di recuperare informazioni preziose che di solito vanno perse nel processo di “mappatura in avanti”, cioè quando si passa dai CFF teorici alla sezione d’urto. È come se, oltre a risolvere l’enigma, riuscissimo a capire anche quali indizi erano stati trascurati.
Sotto la lente d’ingrandimento: ipotesi e scoperte
Nel nostro lavoro, abbiamo messo alla prova il VAIM-CFF sotto vari aspetti. Ci siamo chiesti: cosa succede se cambiamo il modo in cui organizziamo i dati della sezione d’urto? E se proviamo a estrarre un numero diverso di CFF? Come influisce l’uso di tecniche per quantificare l’incertezza? E se “suggeriamo” al sistema delle informazioni fisiche che già conosciamo (il cosiddetto “prior”)? I risultati sono stati illuminanti! Abbiamo visto come queste scelte impattano sui CFF predetti.
Per visualizzare l’informazione “mancante” che il nostro VAIM riesce a tracciare, abbiamo usato tecniche di riduzione della dimensionalità come l’Analisi delle Componenti Principali (PCA). Immaginate di avere una mappa complicatissima e di riuscire a ridurla ai suoi elementi essenziali, evidenziando le strade principali. Ecco, la PCA fa qualcosa di simile con i dati, mostrandoci cosa si nasconde nello “spazio latente” del nostro modello VAIM. Riformulando l’estrazione dei CFF come un problema inverso, stiamo davvero spingendo i limiti di quanta informazione possiamo tirar fuori dagli esperimenti esclusivi profondamente virtuali.
Le reazioni di scattering esclusivo profondamente virtuale, come il DVCS, sono considerate il “canale d’oro” per ottenere informazioni sulla dinamica 3D dei partoni (i costituenti fondamentali) dentro il nucleone (come il protone). Nel quadro dei teoremi di fattorizzazione della QCD (la teoria delle interazioni forti), questo scattering è descritto da quantità chiamate Distribuzioni Partoniche Generalizzate (GPD). Le GPD vanno oltre le distribuzioni longitudinali che conosciamo dallo scattering inclusivo, dandoci dettagli sulla densità spaziale trasversale, sul momento angolare e persino sulle forze di pressione e taglio all’interno del protone. Un vero e proprio identikit tridimensionale!
Nel DVCS, però, il fotone virtuale scambiato non sonda direttamente tutta la dipendenza da x (la frazione di impulso del partone) delle GPD. L’ampiezza di scattering è infatti scritta in termini di Fattori di Forma di Compton (CFF), che sono delle convoluzioni (una specie di “media pesata”) delle GPD con delle funzioni coefficienti calcolabili in QCD. Questa complessità aggiuntiva rende l’analisi dei processi DVCS molto sensibile al metodo di estrazione, ed è per questo che servono tecniche nuove e sofisticate come la nostra.

Noi del gruppo FemtoNet abbiamo scommesso sulle architetture di reti neurali “physics informed”, cioè che incorporano la conoscenza fisica, per estrarre quanta più informazione possibile dagli osservabili sperimentali. Il nostro approccio si articola in più fasi:
- Analisi e modellizzazione/generalizzazione della sezione d’urto.
- Fitting dei CFF dagli osservabili e soluzione di problemi inversi con errori comprensibili.
- Estrazione e parametrizzazione delle GPD.
- Calcolo delle proprietà fisiche di interesse: momento angolare, distribuzioni di pressione e densità spaziali.
Un punto cruciale è avere dei benchmark per standardizzare le varie tecniche di estrazione. L’analisi della sezione d’urto non polarizzata è uno di questi benchmark fondamentali, vitale per capire qualsiasi altro osservabile DVCS, come le asimmetrie di polarizzazione.
Il problema inverso e la magia degli autoencoder variazionali
Estrarre tutti gli 8 CFF dalla sezione d’urto non polarizzata è un problema inverso “mal posto”, perché ci sono, in teoria, infinite soluzioni possibili. È qui che il nostro VAIM entra in scena. Un autoencoder variazionale (VAE) è un tipo di rete neurale che impara a comprimere i dati di input in uno spazio a dimensionalità ridotta (l’encoding) e poi a ricostruirli (il decoding). Facendo questo, l’autoencoder si concentra e trattiene l’informazione essenziale, quella “sepolta” nel dataset originale. Il VAIM aggiunge un “mapper inverso”, che è quello che ci serve per passare dagli osservabili (le sezioni d’urto) ai parametri che vogliamo conoscere (i CFF).
Il VAIM è composto da due reti: un “forward mapper” che mappa i CFF verso le sezioni d’urto e una variabile latente z, e un “backward mapper” che mappa le sezioni d’urto e la variabile latente z di nuovo verso i CFF. Questa variabile latente z è fondamentale: cattura l’informazione persa nel problema inverso e aiuta a ricostruire la distribuzione completa dei CFF. Imponiamo che z segua distribuzioni note (come quella Gaussiana), così da poter campionare da essa per generare le possibili soluzioni per i CFF.
Per gestire diverse condizioni cinematiche (cioè diverse energie e angoli di scattering), abbiamo esteso il VAIM al C-VAIM (Conditional VAIM). Questo ci permette di addestrare il modello su un range di variabili cinematiche come xBj, t, e Q2, e poi di generare CFF specifici per una data regione cinematica. L’architettura di queste reti (numero di neuroni, strati, ecc.) è stata ottimizzata usando Keras Tuner, uno strumento che ci aiuta a trovare la configurazione migliore.
I risultati che ci hanno entusiasmato
Abbiamo testato il nostro VAIM-CFF su dati sperimentali, in particolare quelli del Jefferson Lab. Ad esempio, per un singolo punto cinematico, il VAIM-CFF ci ha fornito un range di possibili soluzioni per gli 8 CFF. Alcuni CFF, come Re H, risultano molto ben determinati (la banda di predizione è stretta rispetto all’input), mentre altri, come Re E tilde o Im E tilde, sono meno vincolati dalla sezione d’urto non polarizzata. È interessante notare che anche i CFF legati alla GPD polarizzata longitudinalmente, Re H tilde e Im H tilde, sembrano essere abbastanza ben determinati.

Abbiamo poi esteso l’analisi per studiare la dipendenza dei CFF dalla variabile t (il momento trasferito al protone). Usando un altro modello di deep learning per interpolare i dati sperimentali, abbiamo alimentato il C-VAIM per ottenere predizioni continue dei CFF in funzione di t. I CFF che erano ben determinati nel singolo punto mostrano trend chiari anche in t, segno che il modello riesce a distinguere la loro dipendenza cinematica intrinseca.
Un aspetto affascinante è lo studio delle correlazioni tra i CFF predetti. Utilizzando dei “corner plot”, abbiamo visualizzato come i valori dei diversi CFF tendono a variare insieme. Ad esempio, abbiamo osservato forti correlazioni tra Re H e Re H tilde, e strutture organizzate per Im H. Questo ci dà indizi preziosi su come la sezione d’urto è strutturata.
Ci siamo anche chiesti: cosa cambia se usiamo formulazioni diverse della sezione d’urto teorica (ad esempio, il formalismo BKM rispetto a quello UVA/FemtoNet)? Le differenze nei valori centrali dei CFF predetti non sono enormi, ma la quantificazione dell’incertezza sì! Questo indica che la sensibilità a certi CFF varia tra le diverse formulazioni, soprattutto per quelli che compaiono nei termini di interferenza.
Un’altra indagine importante ha riguardato la propagazione degli errori sperimentali. Abbiamo confrontato i risultati ottenuti con e senza il metodo dei “random targets” per includere le incertezze dei dati. I CFF più sensibili ai dati (come Re H, Re H tilde e Im H tilde) mostrano bande di errore più ampie quando si propagano le incertezze sperimentali, suggerendo che una buona parte dell’errore sui CFF estratti deriva proprio da queste incertezze, ma anche che i nostri errori sistematici (dovuti al modello AI) sono sotto controllo.
Abbiamo anche esplorato la sensibilità dell’analisi al numero di CFF estratti. Ad esempio, se ci concentriamo solo sui 3 CFF che appaiono linearmente nel termine di interferenza (trattando il resto come un parametro da fittare), i risultati per questi 3 CFF sono consistenti con l’estrazione di tutti gli 8. Similmente, estrarre 6 CFF (ponendo a zero Re E tilde e Im E tilde) dà risultati quasi identici all’estrazione di 8 CFF, confermando che la sezione d’urto non polarizzata è poco sensibile a questi due particolari fattori di forma.
Infine, abbiamo provato a “guidare” il VAIM fornendogli degli input per i CFF non uniformi, ma basati su un modello fenomenologico (un modello spettatoriale). Come ci si poteva aspettare, le distribuzioni dei CFF predetti sono risultate più strette. È interessante notare che non sempre c’è una perfetta sovrapposizione con le predizioni basate su input uniformi, perché il modello spettatoriale non è vincolato da dati DVCS sperimentali. In un caso, per Re E tilde, abbiamo addirittura osservato un segno opposto tra le due predizioni!
Dentro lo Spazio Latente: Capire l’Informazione Perduta
La variabile latente z è il cuore del C-VAIM: è lì che si cerca di recuperare l’informazione persa nella mappatura diretta e di trasformare il problema inverso mal posto in uno ben posto. Analizzando questo spazio latente con la PCA, possiamo visualizzare i pattern appresi e capire meglio la fisica sottostante. Ad esempio, per alcuni CFF come Re E, Re H tilde, Im E e Im H, abbiamo visto emergere un’organizzazione nello spazio latente. Per Im H, l’organizzazione in valori positivi e negativi potrebbe indicare che ciò che si perde nella mappatura è l’informazione sul segno, suggerendo che questo CFF ha un impatto significativo sul termine quadratico del DVCS.

Per altri CFF, come Re H e Im H (nella sua parte reale), la casualità della distribuzione nello spazio latente suggerisce che non c’è informazione persa: la sezione d’urto può determinare il loro valore in modo abbastanza preciso. Questo è coerente con le piccole incertezze che abbiamo trovato per loro. Al contrario, per Im E tilde, la mancanza di struttura, unita alla nostra conoscenza teorica che il suo coefficiente cinematico è piccolo, ci dice che la sezione d’urto non ci dà quasi nessuna informazione su di esso. Per Im H tilde, invece, emerge un pattern circolare/ellittico, che potrebbe indicare un cambio di segno o di pendenza in t, cosa che si correla bene con il suo comportamento osservato nei grafici in funzione di t.
Conclusioni e Prospettive Future
Questo nostro studio sull’uso del VAIM-CFF per estrarre i Fattori di Forma di Compton dalla sezione d’urto DVCS non polarizzata è, a mio avviso, un passo avanti entusiasmante. Abbiamo dimostrato che è possibile affrontare questo complesso problema inverso, esplorare soluzioni multiple, quantificare le incertezze e persino “sbirciare” nell’informazione che di solito si perde, grazie all’analisi dello spazio latente.
Il confronto con altre metodologie e lo studio dell’impatto di diverse assunzioni (come la formulazione della sezione d’urto o l’inclusione di prior fisici) ci forniscono una comprensione più profonda dei limiti e delle potenzialità dell’informazione contenuta negli esperimenti esclusivi profondamente virtuali. Questo è fondamentale per guidare le future campagne sperimentali, come quelle previste al Jefferson Lab e al futuro Electron-Ion Collider (EIC).
Cosa ci riserva il futuro? Beh, pensiamo di estendere la portata delle nostre reti neurali “physics-aware” usando, ad esempio, risultati dalla QCD su reticolo (lattice QCD) sia sui momenti delle GPD che sulla loro dipendenza da x. Vogliamo anche introdurre metodi aggiuntivi per la quantificazione delle incertezze e, soprattutto, sviluppare ulteriormente le tecniche per interpretare lo spazio latente. Capire a fondo l’informazione disponibile nei dati ci dirà dove puntare i nostri strumenti per fare misure ad alto impatto, quelle che faranno davvero la differenza nell’analisi globale delle GPD. Insomma, l’avventura per svelare la struttura 3D del protone è appena iniziata, e l’intelligenza artificiale è una compagna di viaggio potentissima!
Fonte: Springer
