Interfaccia utente di un'applicazione web statistica open source che mostra grafici complessi e analisi di dati per coorti virtuali, con un ricercatore che la utilizza su un laptop. Prime lens, 35mm, depth of field, illuminazione da studio.

Coorti Virtuali Sotto la Lente: La Nostra App Open Source per Trial In-Silico Più Smart!

Ciao a tutti! Oggi voglio parlarvi di qualcosa che, nel nostro campo, sta diventando un vero e proprio game-changer: i trial in-silico e le coorti virtuali. Se siete nel mondo della ricerca medica o dello sviluppo di dispositivi, sapete bene quanto i trial clinici tradizionali possano essere lunghi, costosi e, diciamocelo, a volte eticamente complessi. Ecco, immaginate di poter snellire tutto questo processo, rendendolo più efficiente e mirato. Sembra fantascienza? Non proprio!

La Sfida dei Trial Clinici e l’Alba dell’In-Silico

Partiamo dalle basi. Quando si sviluppa un nuovo farmaco o un dispositivo medico, il percorso è quasi sempre lo stesso: test pre-clinici, studi su animali e poi, finalmente, i trial clinici sugli esseri umani. Un iter necessario, certo, ma che porta con sé sfide non da poco. I trial in-silico, ovvero simulazioni computerizzate individualizzate, e le coorti virtuali (rappresentazioni anonimizzate di gruppi di pazienti reali) si propongono come una soluzione promettente. Pensateci: potremmo ridurre il numero di partecipanti ai trial reali, accorciare le tempistiche, affinare il design degli studi e persino, in alcuni casi, sostituire parzialmente i test su animali o quelli di laboratorio. La ricerca farmacologica, ad esempio, ha già abbracciato questa tecnologia con ottimi risultati, riuscendo a prevedere tossicità e sicurezza in modo più efficiente rispetto ai modelli animali. E i risparmi? Potenzialmente enormi, sia in termini di tempo che di denaro, accorciando il time-to-market di nuovi prodotti.

Nonostante questi progressi entusiasmanti, ci sono ancora degli ostacoli. Limiti tecnologici, la necessità di linee guida regolatorie più chiare e, a volte, una comunicazione non ottimale tra i vari attori coinvolti. Ma uno dei tasselli mancanti, e qui entriamo nel vivo, era la disponibilità di strumenti statistici open source e facili da usare, specifici per l’analisi delle coorti virtuali e dei trial in-silico.

La Nostra Creatura: Un’Applicazione Web per Fare la Differenza

Ed è qui che entra in gioco il nostro lavoro, frutto del progetto europeo SIMCor (finanziato da Horizon). Abbiamo rimboccato le maniche e sviluppato un’applicazione web che mette a disposizione un ambiente statistico basato su R, pensato appositamente per validare le coorti virtuali e per utilizzarle nei trial in-silico. L’idea era creare qualcosa di pratico, completamente aperto, generico, guidato da menu e con tutto l’aiuto necessario per l’utente. E sì, lo trovate su GitHub e Zenodo, perché la scienza aperta è il nostro mantra!

Come siamo arrivati a questo? Beh, non ci siamo svegliati una mattina con l’idea geniale. Abbiamo ascoltato le esigenze degli utenti, organizzato workshop con esperti del settore (bio-statistici, data manager, data scientist e rappresentanti di altri progetti in-silico come In-silico World, SimInSitu e SimCardioTest) per definire i requisiti. La scelta di R, R-Markdown e Shiny è stata quasi naturale: un ecosistema diffuso, user-friendly e perfetto per creare ambienti di ricerca replicabili. E tutto, ovviamente, sotto licenza GNU-2, per garantire la massima libertà di utilizzo e modifica.

Lo sviluppo è stato un processo agile, con storie utente che definivano le funzionalità e rilasci incrementali per raccogliere feedback continuo. Il cuore pulsante dell’app sono le tecniche analitiche, descritte in un documento “modello generale”, che coprono due aree principali: la validazione delle coorti virtuali rispetto a dati reali e l’applicazione di coorti validate nei trial in-silico.

Un team multidisciplinare di ricercatori e data scientist collabora attorno a un grande schermo interattivo che mostra complesse visualizzazioni di dati di coorti virtuali e reali, con grafici statistici e modelli 3D di organi. Prime lens, 35mm, depth of field, illuminazione da studio che crea un'atmosfera high-tech ma collaborativa.

Cosa Fa di Bello Questa App? Un Tuffo nelle Funzionalità

Entriamo un po’ più nel dettaglio. Per prima cosa, prima di qualsiasi analisi, bisogna definire il Contesto d’Uso (CoU) e la Domanda d’Interesse (QoI). Sembrano paroloni, ma sono fondamentali: il CoU descrive come il modello verrà usato nello studio di simulazione per rispondere alla QoI, che è la domanda specifica a cui vogliamo dare una risposta. Senza questi, è come navigare senza bussola!

Una volta chiariti CoU e QoI, si passa alla pratica. L’app ha due moduli principali:

  • Validazione delle Coorti Virtuali:
    • Si caricano i dataset (quello virtuale e quello reale, in formato CSV e con la stessa struttura di variabili).
    • Confronto Univariato: Si selezionano le variabili e l’app calcola statistiche descrittive (media, deviazione standard, min, max) per entrambi i dataset, presentandole sia in tabelle che con box plot. L’obiettivo è vedere se le distribuzioni dei singoli parametri sono simili.
    • Confronto Bivariato: Qui si calcolano le correlazioni tra le variabili, separatamente per la coorte reale e quella virtuale. I risultati sono visualizzati come heatmap, per capire se anche le relazioni tra i parametri sono ben riprodotte dalla coorte virtuale.
    • Confronto Multivariato: Per valutare la compatibilità complessiva, si usa un grafico Quantile-Quantile tra i dati sintetici e quelli reali, dopo una standardizzazione multivariata. Vengono mostrati anche gli istogrammi delle forme quadratiche risultanti.
    • Valutazione della Variabilità: Si confrontano le funzioni di densità non parametriche per una variabile d’interesse tra il modello (dataset virtuale) e gli esperimenti (dataset reale). L’incertezza nel modello viene valutata con una tecnica di bootstrap, generando intervalli di confidenza al 95%. Se i dati reali non rientrano in questi intervalli, significa che c’è una deviazione del modello.
  • Applicazione delle Coorti Validate:
    • Design a 1 Gruppo: Si importa il dataset della coorte validata (sempre CSV). Si seleziona la variabile d’interesse e il suo tipo (discreta, continua, tempo all’evento). L’app fornisce i dati grezzi, un grafico (frequenze e test chi-quadro per variabili discrete, boxplot per continue, curva di Kaplan-Meier per tempo all’evento).
    • Design a 2 Gruppi: Si importano due dataset (stessa struttura). Come prima, si sceglie la variabile d’interesse e il tipo. Oltre ai dati e ai grafici comparativi (frequenze, boxplot, curve di Kaplan-Meier affiancate), l’analisi include test statistici appropriati (chi-quadro, t-test, test di Kaplan-Meier) per confrontare i due gruppi.
    • Calcolo della Dimensione Campionaria: Attualmente limitato a confronti tra due gruppi con outcome continuo e deviazione standard comune. Si inseriscono le medie attese per i due gruppi, la deviazione standard, il livello di significatività, la potenza e il tipo di ipotesi. Si possono anche definire intervalli per la dimensione dell’effetto e specificare il numero di scenari. L’output include statistiche riassuntive sulla dimensione campionaria calcolata e probabilità di raggiungere una certa potenza.

E la ciliegina sulla torta? Per ogni analisi, l’ambiente R-statistico genera un report in formato PDF. Questo è cruciale per la documentazione e la replicabilità, un tema caldissimo nella ricerca computazionale per combattere la cosiddetta “crisi della replicazione”.

Schermata dell'applicazione web SIMCor che mostra un'interfaccia utente intuitiva con menu per la validazione di coorti virtuali. In primo piano, un grafico a heatmap che confronta le correlazioni bivariate tra variabili di un dataset reale e uno virtuale. Macro lens, 60mm, high detail, precise focusing sull'interfaccia.

Messa alla Prova: I Nostri Casi Studio e Perché R e Shiny

Ovviamente, non ci siamo limitati a sviluppare l’app: l’abbiamo testata e validata! Ad esempio, abbiamo usato un generatore di coorti virtuali che crea geometrie sintetiche di valvole aortiche stenotiche per trial TAVI (Impianto Transcatetere di Valvola Aortica) virtuali. La nostra app ha riprodotto i risultati originali e ha permesso ulteriori analisi. I dati di questo studio sono pubblici, quindi chiunque può dare un’occhiata! Abbiamo anche validato l’app con dati simulati per uno studio che confrontava due dispositivi (A e B) su outcome continui, discreti e tempo all’evento, confrontando i risultati con script R separati.

Qualcuno potrebbe chiedersi: perché proprio R e Shiny? E se avessimo usato Python? Beh, R è un linguaggio potentissimo per la statistica, con una comunità enorme e un mare di pacchetti validati (noi ci siamo concentrati su quelli presenti in CRAN, il Comprehensive R Archive Network). Python è altrettanto valido per la data science, e la buona notizia è che i due linguaggi possono dialogare tranquillamente grazie a pacchetti come `reticulate` (per usare Python da R) e `rpy2` (per usare R da Python). Quindi, la scelta di R non è affatto una limitazione.

Il nostro ambiente R-statistico è un passo avanti, ma è solo una parte del puzzle. L’ideale sarebbe accoppiarlo direttamente con i modelli computazionali che generano le coorti virtuali. Nel progetto SIMCor, abbiamo fatto proprio questo, integrando generatori di coorti virtuali con il nostro strumento statistico all’interno di un Ambiente di Ricerca Virtuale (VRE). Questo VRE, che include un repository di dati e strumenti per l’impianto virtuale di dispositivi TAVI, è ancora in evoluzione, ma rappresenta un passo necessario verso un ambiente computazionale aperto e potente.

Uno Sguardo al Futuro (e Qualche Limite Onesto)

Siamo onesti: la nostra app è un ottimo punto di partenza, ma c’è ancora da fare. Le tecniche statistiche disponibili, seppur utili, sono ancora limitate. Nei tre trial in-silico che abbiamo condotto nel progetto SIMCor (due sul TAVI, focalizzati su perdite paravalvolari e calcificazioni, e uno su sensori di pressione arteriosa polmonare – PAPS), è emerso che servirebbero tecniche più sofisticate, come i modelli lineari a effetti misti, che al momento non sono implementate. E potrei citare la regressione logistica multivariata o il calcolo della numerosità campionaria basato su odds ratio… insomma, la lista è lunga!

Il prossimo passo fondamentale è far conoscere e usare l’app al di fuori del nostro progetto e del dominio cardiovascolare. Vogliamo che altri ricercatori, in altri campi, la mettano alla prova. Il codice e tutta la documentazione sono su GitHub, quindi le barriere all’ingresso sono minime. Un obiettivo concreto è rendere il software disponibile su CRAN. Inoltre, l’intero VRE di SIMCor, inclusa la nostra app statistica, è stato inserito nel catalogo EDITH, un progetto che sta gettando le basi per l’infrastruttura europea del Gemello Umano Virtuale. Speriamo che il nostro strumento trovi spazio in questo framework.

Nel frattempo, pubblicheremo individualmente gli scenari applicativi che abbiamo sviluppato, mostrando nel dettaglio metodi e risultati di ciascun trial in-silico, e come la nostra app sia stata cruciale per il design e la valutazione.

In conclusione, abbiamo creato un’applicazione web open source, generica e guidata da menu, sviluppata in Shiny, per supportare la validazione e l’applicazione di coorti virtuali. Sebbene nata per casi d’uso specifici legati a dispositivi medici cardiologici, il suo potenziale va ben oltre. Speriamo che possa essere utile a molti nella comunità scientifica per sviluppare o valutare prodotti medicinali, dispositivi o interventi in modo più efficiente e innovativo. Dateci un’occhiata, sperimentate e, perché no, contribuite a farla crescere!

Fonte: Springer

Articoli correlati

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *