Kasumi: Decifrare i Pattern Nascosti nei Tessuti con l’Omica Spaziale
Un Viaggio Affascinante nel Microcosmo dei Tessuti
Avete mai pensato a cosa succede davvero, a livello microscopico, dentro i nostri tessuti? È un mondo incredibilmente complesso, un’intricata rete di cellule che comunicano, collaborano e a volte, purtroppo, prendono strade sbagliate, come nel cancro. Capire questa organizzazione è fondamentale, non solo per la ricerca di base, ma anche per la medicina: pensate alla diagnosi, a capire come progredirà una malattia o quale terapia funzionerà meglio per un paziente specifico.
Negli ultimi anni, le tecnologie di omica spaziale ci hanno regalato strumenti potentissimi, come delle mappe super dettagliate che mostrano non solo quali molecole ci sono in un tessuto, ma anche *dove* si trovano precisamente. È un’esplosione di dati ricchissimi, una vera miniera d’oro di informazioni sulla struttura e sulla funzione dei tessuti. Ma c’è un “ma”: come si fa a leggere queste mappe così complesse? Come si estraggono le informazioni davvero utili da questa mole di dati?
I Limiti degli Approcci Tradizionali
Finora, per analizzare questi dati spaziali, ci si è concentrati principalmente su due strade. La prima è il clustering: raggruppare le cellule in base alle loro caratteristiche molecolari, assegnando etichette come “tipo di cellula” o “stato funzionale”. È utile, certo, ma si basa sull’idea che l’informazione più importante sia contenuta *dentro* la singola cellula, trascurando un po’ il contesto.
La seconda strada è l’analisi del vicinato (niche analysis): si va un passo oltre e si guarda quali tipi di cellule tendono a stare vicine, cercando “motivi” o pattern di interazione ricorrenti. Molti metodi brillanti sono stati sviluppati, alcuni guardano le interazioni immediate, altri definiscono “quartieri” cellulari più ampi. Ci sono anche approcci basati su reti neurali (GNN) che imparano rappresentazioni complesse, ma hanno bisogno di molti dati etichettati e spesso risultano delle “scatole nere”, difficili da interpretare per capire *cosa* hanno imparato veramente.
Il problema è che spesso questi metodi si basano su un clustering iniziale, oppure faticano a catturare relazioni complesse, non lineari, che magari si manifestano solo in piccole zone del tessuto ma sono biologicamente importantissime. E se volessimo un approccio che sia flessibile, che non dipenda per forza da etichette predefinite, che funzioni anche con pochi campioni e, soprattutto, che sia spiegabile?
Ecco Kasumi: Trovare le “Firme” Persistenti
È qui che entra in gioco il nostro approccio, che abbiamo chiamato Kasumi. L’idea di fondo è semplice ma potente: invece di concentrarci solo sulle cellule o sui loro vicini immediati, andiamo a caccia di pattern locali persistenti. Cosa significa? Cerchiamo “firme” di relazioni – sia all’interno delle cellule (intra-cellulari) sia tra cellule diverse (inter-cellulari) – che si ripetono in modo robusto attraverso diversi campioni di tessuto, magari provenienti da pazienti diversi o in condizioni diverse.
Immaginate di passare una lente d’ingrandimento (una “finestra scorrevole”) su tutta la mappa del tessuto. Per ogni posizione della lente, Kasumi analizza le relazioni tra le molecole presenti in quella piccola area, usando modelli di machine learning potenti ma interpretabili (basati sul framework MISTy, che abbiamo esteso). Non ci limitiamo a vedere *chi* c’è, ma *come* le diverse componenti si influenzano a vicenda in quel preciso contesto locale.

Poi facciamo un passo cruciale: confrontiamo le “firme” di relazioni trovate in tutte le finestre, anche tra campioni diversi. Quelle simili vengono raggruppate insieme (clustering). E qui arriva la “persistenza”: teniamo solo quei gruppi di firme (cluster) che compaiono abbastanza spesso, in un numero minimo di campioni o con una certa frequenza. Questo ci permette di filtrare il rumore e concentrarci sui pattern che sono davvero rappresentativi e robusti.
Il risultato finale? Una rappresentazione del tessuto molto più compatta, ma ricca di significato. Ogni campione viene descritto come una composizione di questi pattern locali persistenti. E la cosa fantastica è che ogni pattern è spiegabile: possiamo andare a vedere esattamente quali relazioni tra molecole o tipi di cellule lo caratterizzano.
Kasumi alla Prova dei Fatti: Stratificare Pazienti Oncologici
Bello sulla carta, ma funziona nella pratica? Per verificarlo, abbiamo messo alla prova Kasumi su dati reali provenienti da tre studi oncologici diversi, utilizzando tecnologie di proteomica spaziale differenti (MIBI, CODEX, IMC):
- Campioni di carcinoma duttale in situ (DCIS), per predire quali pazienti avrebbero sviluppato un cancro invasivo.
- Campioni di linfoma cutaneo a cellule T (CTCL), per predire la risposta a un trattamento di immunoterapia (inibizione di PD-1).
- Campioni di cancro al seno (BC), per predire la sensibilità alla terapia ormonale post-operatoria.
In tutti questi scenari, l’obiettivo era usare la rappresentazione generata da Kasumi per addestrare modelli semplici (regressione logistica) capaci di stratificare i pazienti in base all’outcome clinico osservato (progressione, risposta al trattamento).
Abbiamo confrontato le performance di Kasumi con diversi approcci: la semplice distribuzione dei tipi cellulari nel campione (senza informazione spaziale), il nostro framework MISTy applicato globalmente, altri metodi di analisi del vicinato (CSEA, CCN) e un approccio che abbiamo chiamato WCC (Window Composition Clustering), che raggruppa le finestre in base alla loro composizione cellulare (invece che alle relazioni).
I risultati sono stati entusiasmanti! Kasumi ha superato tutti gli altri metodi in tutti e tre i task, dimostrando che considerare i pattern di relazione *locali* e *persistenti* aggiunge un valore significativo rispetto alla semplice composizione cellulare o ai pattern globali. È interessante notare che anche la dimensione della “lente” (la finestra) conta: finestre troppo grandi fanno perdere la specificità locale, indicando che sono proprio le eterogeneità su piccola scala ad essere biologicamente rilevanti per queste previsioni.
Non Solo Predire, Ma Capire il Perché
La forza di Kasumi non sta solo nelle performance predittive, ma nella sua spiegabilità. Una volta addestrato il modello per predire l’outcome (es. responder vs non-responder), possiamo chiedere a Kasumi: “Quali pattern locali (cluster) sono stati più importanti per la tua decisione?”. Usiamo una metrica chiamata signed Model Reliance (sMR) che ci dice proprio questo: quanto il modello si è “fidato” di ciascun cluster e se quel cluster era associato a un esito positivo o negativo.
Prendiamo l’esempio del CTCL. Abbiamo identificato alcuni cluster chiave. Ad esempio, i cluster 23 e 16 erano fortemente associati ai pazienti che *non* rispondevano alla terapia, mentre i cluster 4 e 13 erano associati ai *responder*. Andando a vedere cosa caratterizzava questi cluster, abbiamo trovato differenze interessanti nelle interazioni tra cellule tumorali, cellule immunitarie (come i macrofagi M1 e M2) e lo stroma. Ad esempio, nel cluster 4 (associato alla risposta positiva) c’era una relazione positiva tra tumore e macrofagi, noti per avere un ruolo anti-tumorale in certi contesti. Al contrario, nei cluster associati alla non-risposta, si vedevano pattern di “evitamento” tra cellule tumorali e certi tipi di macrofagi. Questo tipo di analisi ci permette di formulare ipotesi biologiche concrete sui meccanismi alla base della risposta al trattamento.

Un’altra cosa interessante è la frequenza e la distribuzione di questi cluster. Alcuni, come il cluster 4 nel CTCL, erano molto comuni, presenti in quasi tutti i campioni (ma più frequenti nei responder). Altri, come il cluster 16 (associato ai non-responder), erano molto più rari, presenti solo in poche finestre. Questo suggerisce che sia i pattern diffusi sia eventi molto localizzati possono essere cruciali per determinare l’esito clinico. Inoltre, abbiamo visto che le finestre appartenenti allo stesso cluster tendono a stare vicine nello spazio (autocorrelazione spaziale), indicando che Kasumi cattura effettivamente regioni tissutali con caratteristiche funzionali specifiche.
Flessibilità: Analizzare Direttamente i Marcatori
Un altro grande vantaggio di Kasumi è la sua flessibilità. Non siamo obbligati a partire da etichette predefinite di “tipo cellulare”. Possiamo lavorare direttamente con i dati grezzi, cioè con l’abbondanza dei diversi marcatori misurati in ogni cellula o posizione spaziale. In questo scenario, Kasumi cerca pattern persistenti nelle relazioni tra i livelli dei marcatori, sia all’interno della stessa cellula (intraview) sia nel suo contesto più ampio (paraview, considerando i marcatori nelle cellule vicine pesati per la distanza).
Abbiamo ripetuto le analisi sui tre dataset oncologici usando questa volta i dati di abbondanza dei marcatori come input. Kasumi ha continuato a mostrare performance elevate, superando spesso altri metodi recenti progettati specificamente per lavorare con profili di marcatori (come BANKSY, CellCharter, UTAG) e anche il nostro baseline WCC basato sulla composizione locale dei marcatori. Anche se le performance erano leggermente inferiori rispetto all’analisi basata sui tipi cellulari (quando disponibili e ben definiti), i risultati rimangono ottimi e dimostrano che Kasumi può estrarre informazioni preziose anche senza una classificazione cellulare a priori.
L’analisi dei cluster basati sui marcatori nel caso del cancro al seno resistente alla terapia ormonale è stata particolarmente illuminante. Il cluster più predittivo della resistenza (Cluster 37) era raro e localizzato. Analizzandolo, abbiamo trovato pattern specifici di interazione tra marcatori immunitari (CD44, CD45, CD68), stromali (Fibronectina) e tumorali (GATA3). In particolare, un pattern di “esclusione” tra cellule immunitarie (CD45), stroma denso (Fibronectina) e cellule tumorali GATA3+ suggeriva la presenza di “deserti immunitari” locali, potenzialmente legati alla resistenza al trattamento ormonale. Questo tipo di insight, che combina informazioni su diversi compartimenti cellulari e la loro organizzazione spaziale, sarebbe difficile da ottenere con metodi basati solo sulla composizione.
Guardando al Futuro
Kasumi apre scenari eccitanti. La sua capacità di identificare pattern locali, persistenti e spiegabili nei dati di omica spaziale lo rende uno strumento prezioso per esplorare la biologia dei tessuti in salute e malattia. Può aiutare a formulare nuove ipotesi, a identificare potenziali biomarcatori e a comprendere meglio perché alcuni pazienti rispondono alle terapie e altri no.
Le potenziali applicazioni future sono molteplici. Potremmo applicare Kasumi a dati di trascrittomica spaziale ad alta risoluzione, magari trasformando prima i dati in attività di pathway o interazioni ligando-recettore per ottenere insight più meccanicistici. L’integrazione di diverse modalità omiche (multi-omica spaziale) o l’inclusione di caratteristiche derivate dalle immagini istologiche (patomica) potrebbero arricchire ulteriormente l’analisi. Man mano che i dataset diventeranno più grandi, potremo esplorare modelli ancora più complessi, magari costruendo vere e proprie “tassonomie” delle strutture tissutali basate sui pattern di relazione identificati da Kasumi.
In sintesi, Kasumi offre un modo nuovo e potente per guardare dentro i tessuti, andando oltre la semplice descrizione per catturare l’essenza delle interazioni locali che ne governano la funzione e ne determinano il destino. È un passo avanti verso una comprensione più profonda e personalizzata della biologia e della medicina.
Fonte: Springer
