M3S-GRPred: La Mia Nuova Arma Segreta AI per Scovare Antagonisti del Recettore dei Glucocorticoidi!
Ciao a tutti! Oggi voglio parlarvi di una sfida affascinante nel mondo della scoperta di nuovi farmaci e di come, insieme al mio team, abbiamo cercato di affrontarla usando un pizzico di intelligenza artificiale (AI) e una strategia un po’ fuori dagli schemi. Il nostro obiettivo? Trovare nuove molecole capaci di “spegnere” un bersaglio biologico molto importante: il recettore dei glucocorticoidi (GR).
Perché il Recettore dei Glucocorticoidi è Così Importante (e Complicato)?
Immaginate il recettore dei glucocorticoidi (GR) come un interruttore molecolare super potente nel nostro corpo. È coinvolto in una marea di processi: dal metabolismo degli zuccheri (gluconeogenesi) alla risposta infiammatoria e immunitaria, dalla salute delle ossa alla funzione cardiovascolare, fino allo sviluppo e al funzionamento del cervello. Insomma, è fondamentale per la nostra sopravvivenza. Il cortisolo, l’ormone naturale che lo attiva, è essenziale, ma quando ce n’è troppo… sono guai.
Un eccesso di attività del cortisolo porta a condizioni come la sindrome di Cushing, una malattia che causa sintomi pesanti: accumulo di grasso sul tronco, braccia e gambe sottili, viso arrotondato (“a luna piena”), diabete, ipertensione, problemi cutanei e disturbi psichiatrici. Non solo, aumenta anche il rischio di eventi cardiovascolari gravi.
Esistono farmaci per trattare la sindrome di Cushing, come il mifepristone, che è un antagonista del GR (cioè lo blocca). Funziona, ma ha i suoi limiti: non riduce la produzione di cortisolo e, essendo poco selettivo, interagisce anche con altri recettori (come quello del progesterone), causando effetti collaterali indesiderati. C’è quindi un bisogno disperato di trovare nuovi antagonisti del GR, magari più specifici e con caratteristiche diverse, utili anche per altre malattie legate a questo recettore.
La Sfida: Trovare Nuovi Farmaci è Lento e Costoso
Qui entra in gioco il problema classico della scoperta farmaceutica: è un processo lunghissimo e costosissimo. Identificare sperimentalmente nuove molecole attive richiede anni e investimenti enormi. Ecco perché negli ultimi anni ci siamo buttati a capofitto sugli approcci computazionali, in particolare sul machine learning (ML), per accelerare le cose.
Già esistono metodi computerizzati per studiare il GR: modelli QSAR (che correlano struttura chimica e attività), deep learning, docking molecolare (che simula come una molecola si lega al recettore), simulazioni di dinamica molecolare (che mostrano come si muovono nel tempo) e analisi di farmacoforo (che identificano le caratteristiche chimiche essenziali per l’attività). Ma noi volevamo qualcosa di diverso, qualcosa che fosse rapido, accurato e che non richiedesse necessariamente la complessa informazione 3D della struttura molecolare.
La Nostra Idea: M3S-GRPred, l’AI che “Legge” le Molecole in 1D
Ed eccoci al cuore del nostro lavoro: abbiamo sviluppato un nuovo approccio basato sull’ensemble learning (l’idea di combinare le previsioni di più modelli per ottenere un risultato migliore) che abbiamo chiamato M3S-GRPred. La “M3S” sta per “Multi-Step Stacking Strategy”, una strategia di “impilamento” a più passaggi che abbiamo ideato.
La vera novità? M3S-GRPred è, per quanto ne sappiamo, il primo predittore basato esclusivamente sulle stringhe SMILES per identificare gli antagonisti del GR. Cosa sono le SMILES? Immaginatele come un codice a barre testuale che descrive la struttura chimica di una molecola in modo semplice e lineare (1D), senza bisogno di coordinate 3D. Questo rende tutto molto più veloce e applicabile a librerie vastissime di composti.
Come Funziona M3S-GRPred (Senza Troppi Mal di Testa)?
Il processo dietro M3S-GRPred si può riassumere in alcuni passaggi chiave:
1. Affrontare lo Squilibrio dei Dati: Uno dei problemi comuni nei dataset biologici è lo squilibrio: avevamo molti più composti attivi (1314) che inattivi (275) sul GR nel nostro database iniziale (preso da ChEMBL). Per evitare che i modelli imparassero solo a riconoscere la classe più numerosa, abbiamo usato una tecnica chiamata under-sampling: abbiamo creato diversi sottoinsiemi di addestramento “bilanciati”, prendendo tutti i composti inattivi e campionando a rotazione diverse porzioni di quelli attivi.
2. Costruire un Esercito di “Classificatori Base”: Per ognuno di questi set bilanciati, abbiamo addestrato una batteria di modelli di machine learning “base”. Abbiamo usato algoritmi popolari (KNN, MLP, PLS, RF, SVM, XGB) e diversi tipi di “descrittori” molecolari derivati dalle SMILES (AP2DC, CDKExt, FP4C, MACCS, Pubchem) – in pratica, modi diversi per tradurre la stringa SMILES in numeri che l’algoritmo potesse capire. Alla fine, avevamo ben 150 modelli base ben addestrati!
3. “Impilare” le Predizioni (Stacking): Qui entra in gioco la strategia “stacking”. Invece di scegliere il modello base migliore, abbiamo preso le probabilità che ogni modello base assegnava a un composto di essere un antagonista del GR. Queste 150 probabilità sono diventate le nuove “caratteristiche” (features) per un modello finale, il “meta-classificatore”.
4. Ottimizzare il Tutto: Non tutte le previsioni dei modelli base sono ugualmente utili. Abbiamo quindi usato una tecnica di selezione delle caratteristiche in due passaggi per scegliere solo le probabilità più informative (alla fine ne abbiamo usate 140 su 150) per addestrare il nostro meta-classificatore finale (basato su SVM), creando così M3S-GRPred.
I Risultati? Decisamente Promettenti!
Abbiamo messo alla prova M3S-GRPred confrontandolo sia con i singoli classificatori base sia con modelli tradizionali addestrati direttamente sul dataset squilibrato originale. I risultati, valutati sia con validazione incrociata (cross-validation) sia su un set di dati indipendente (mai visto durante l’addestramento), sono stati chiari:
- M3S-GRPred ha surclassato i modelli tradizionali addestrati sul dataset squilibrato, dimostrando che la nostra strategia M3S gestisce efficacemente lo squilibrio dei dati.
- Ha ottenuto prestazioni superiori anche rispetto ai migliori classificatori base addestrati sui singoli set bilanciati. Sul test indipendente, ha raggiunto un’accuratezza bilanciata (BACC) di 0.891, un coefficiente di correlazione di Matthews (MCC) di 0.658 e un’area sotto la curva ROC (AUC) di 0.953 – valori decisamente buoni che indicano alta precisione e affidabilità.
- In pratica, M3S-GRPred è risultato più stabile e accurato nell’identificare gli antagonisti del GR.
Non Solo Numeri: Cosa Abbiamo Imparato sulle Molecole?
Un aspetto affascinante del machine learning è che a volte può aiutarci a capire quali caratteristiche chimiche sono più importanti per l’attività biologica. Abbiamo usato uno dei nostri modelli base (Random Forest) per analizzare l’importanza delle diverse “impronte digitali” molecolari (derivate dai descrittori Pubchem).
Sono emersi alcuni gruppi chimici interessanti come potenzialmente importanti per l’antagonismo del GR:
- Tioli alchilici (gruppi -SH legati a catene di carbonio): I tioli sono noti antiossidanti e hanno proprietà anti-infiammatorie, il che potrebbe essere utile visto il ruolo del GR nell’infiammazione.
- Propionitrile: Un composto che è precursore di molecole con effetti sul sistema nervoso e potenzialmente su altri recettori steroidei (come quello degli estrogeni beta, “parente” del GR).
- Ammine alifatiche primarie (come isopropilammina e tert-butilammina): Questi gruppi sono spesso usati in farmaci per modularne le proprietà e potrebbero interagire con il recettore GR tramite legami idrogeno o interazioni idrofobiche.
Queste scoperte, pur preliminari, ci danno indizi preziosi per progettare futuri farmaci.
Dalla Teoria alla Pratica: Possiamo “Riusare” Farmaci Esistenti?
Un’applicazione entusiasmante del nostro M3S-GRPred è stata quella di usarlo per fare uno screening virtuale su un database di farmaci già approvati dalla FDA (quindi sicuri per l’uomo) per vedere se qualcuno di essi potesse essere “riproposto” come antagonista del GR.
Abbiamo dato in pasto al modello le SMILES di circa 1700 farmaci approvati. Abbiamo preso i 30 candidati con il punteggio di probabilità più alto e li abbiamo analizzati con il docking molecolare, simulando al computer come si legherebbero alla struttura 3D del recettore GR.
Tra questi, abbiamo selezionato quattro composti promettenti (azelastina, metergolina, perampanel, pirenzepina) che non fossero già noti per interagire fortemente con recettori simili (come quello del progesterone). Per questi quattro, e per il mifepristone come riferimento, abbiamo fatto un passo ulteriore: le simulazioni di dinamica molecolare (MD).
Le simulazioni MD sono come dei “film” molecolari: ci mostrano come il farmaco e la proteina si muovono e interagiscono nel tempo in un ambiente acquoso simulato, simile a quello cellulare. Abbiamo simulato questi complessi per 100 nanosecondi (un tempo lunghissimo su scala molecolare!) e analizzato la stabilità del legame, i contatti tra atomi, i legami idrogeno e l’energia libera di legame (un indicatore di quanto forte sia l’interazione).
I risultati? Azelastina (AZE) e Perampanel (PER) sono emersi come i candidati più interessanti! Hanno mostrato un’energia di legame al GR paragonabile a quella del mifepristone (MF), anche se con modalità di interazione leggermente diverse. Mentre MF forma più legami idrogeno, AZE e PER compensano con un numero maggiore di contatti idrofobici (interazioni “simili scioglie simile” tra parti non polari delle molecole), suggerendo che potrebbero effettivamente agire come antagonisti del GR.
Conclusioni: Un Nuovo Strumento per Accelerare la Ricerca
In sintesi, con M3S-GRPred abbiamo sviluppato uno strumento nuovo e potente, basato su AI e una strategia multi-step, capace di identificare potenziali antagonisti del recettore dei glucocorticoidi in modo rapido, accurato ed economico, usando solo le semplici stringhe SMILES. Ha dimostrato di superare i modelli tradizionali, soprattutto in presenza di dati sbilanciati, e ci ha permesso di identificare candidati promettenti per il riposizionamento di farmaci, come azelastina e perampanel, per la sindrome di Cushing.
Siamo convinti che M3S-GRPred possa diventare uno strumento prezioso per i ricercatori, aiutando a setacciare enormi librerie di composti e ad accelerare la scoperta di nuove terapie per le malattie legate al GR. È un piccolo passo, ma speriamo significativo, nel lungo cammino verso farmaci migliori!
Fonte: Springer