notizie dai soci

Exscalate4cov e le potenzialità del supercomputing nel drug design

Intervista a CINECA | Partner del progetto Exscalate4COV

Nel corso del 2020 sono stati numerosi i progetti intrapresi, a vari livelli, per la lotta al coronavirus. Fra quelli finanziati dalla Commissione Europea e finalizzati a individuare nuove strategie terapeutiche, vaccinali e nuove molecole, il progetto Exscalate4cov è stato avviato ad aprile, grazie ad un consorzio che aveva già avuto modo di lavorare in precedenza su una piattaforma di calcolo e che ha allargato la partecipazione ad altri importanti attori, come l’Istituto Nazionale per le Malattie Infettive Lazzaro Spallanzani.

Il consorzio di Exscalate4COV, coordinato da Dompé Farmaceutici, è composto infatti da 18 istituzioni di sette paesi europei, fra cui CINECA, Politecnico di Milano, Elettra Sincrotrone, Associazione Big Data e molti altri.

Associazione Big Data affianca CINECA nei WP tecnici e scientifici del progetto e ha presentato il progetto Exscalate4cov durante un webinar di presentazione delle progettualità dell’Associazione Big Data ai nostri soci.

Immagine di CINECA

Finanziato con 3 milioni di euro dalla Commissione Europea all’interno del quadro Horizon 2020 dedicato all’emergenza coronavirus, Exscalate4COV mira a sfruttare le risorse di supercalcolo dell’UE accoppiandole con alcuni dei migliori laboratori di ricerca di scienze della vita del continente per contrastare la pandemia in modo più rapido ed efficiente. Al centro del progetto c’è EXSCALATE (EXaSCale smArt pLatform Against paThogEns), attualmente la piattaforma di supercalcolo intelligente più potente (ed economica) al mondo, sviluppata da Dompé Farmaceutici SpA, che fa leva su una libreria chimica di 500 miliardi di molecole, grazie a una capacità di elaborazione di oltre 3 milioni di molecole al secondo.

CINECA all’interno del progetto coordina la produzione HPC e il tuning applicativo, con l’obiettivo di mettere a punto un adeguato ambiente di produzione CADD sia sui sistemi PRACE Tier-0 (Marconi, Mare Nostrum, Jureca) che sui sistemi pre-esascala EuroHPC (quando disponibile nel 2021). Cineca fornirà, inoltre, un supporto di alto livello sulla suite LiGen e un supporto più ampio sull’utilizzo del sistema stesso.

Abbiamo intervistato i referenti del progetto all’interno di Cineca, il Dott. Maurizio Ortali e il Dott. Andrew Emerson, per saperne di più. 

Obiettivo principale del progetto è trovare nuovi farmaci per coronavirus selezionando le molecole più promettenti per contrastare l’attuale epidemia e strutturare un modello operativo di intervento efficace ed efficiente a livello europeo per eventi analoghi.

“Questo obiettivo è perseguito attraverso due fasi di lavoro, la prima di drug repurposing, per ottenere risorse più velocemente tra le molecole già a disposizione, e una di drug design de novo, per scoprire potenziali nuovi farmaci. Nella fase I, prima dell’estate, abbiamo compiuto una selezione tramite High-throughput Virtual Screening (HTVS) su una libreria di 400.000 molecole considerate sicure, come farmaci già noti e in commercio e prodotti naturali”, racconta Emerson, chimico e addetto alla programmazione HPC che si occupa di queste attività.

Grazie alla piattaforma Exscalate, con uno spazio chimico tangibile di più di 500 miliardi di molecole, e al programma LiGen per le attività di docking, viene valutata l’affinità geometrica tra il ligando e il sito di legame della proteina virale su cui si vuole agire. Questo viene eseguito utilizzando strutture di proteine già note o eseguendo simulazioni di dinamica molecolare e valutandone le interazioni chimiche. Si tratta di simulazioni di 10 microsecondi, con cui si analizza il comportamento della proteina nel tempo e si ottiene la conformazione più fedele della proteina, che viene poi inserita nella libreria di virtual screening.

Immagine di Giorgia Frumenzio, Associazione Big Data

“Durante questo screening sono state circa 7000 le molecole identificate alle quali è stato assegnato dal processo un punteggio alto e che sono state inviate ai laboratori in Polonia e a Leuven per i test in vitro; di queste, sono state identificate 100 molecole con effetto di qualche tipo su virus, di cui 40 hanno inibito la replicazione”, continua Emerson.

Fra queste ultime è presente il raloxifene, una molecola già registrata e utilizzata per la cura dell’osteoporosi nelle donne dopo la menopausa. Il 27 Ottobre l’Agenzia italiana del farmaco (Aifa) ha dato il via libera per l’avvio dello studio clinico sui pazienti presso l’ IRCSS Lazzaro Spallanzani di Roma e IRCSS Humanitas a Milano, per valutare il raloxifene come potenziale trattamento per pazienti covid paucisintomatici in ospedale o a casa.

Le potenzialità tecnologiche

Siamo stati affiancati da Eni, che inizialmente non era nel consorzio, ma che avendo da qualche anno a disposizione la macchina più potente in Italia e grazie ad una collaborazione di lunga data tra CINECA ed ENI, all’inizio del progetto è stato possibile fare sinergia così da mettere a disposizione del progetto le due macchine HPC più potenti in italia”, dice Maurizio Ortali, fisico e project manager nel gruppo HPC, esperto nell’ambito della ricerca in ambito clinico e sanitario e referente per il Clust-ER Health.

Prima di questo progetto CINECA aveva lavorato sull’identificazione di molecole per il virus Zika nel progetto Antarex, con lo scopo di fornire un approccio rivoluzionario alle applicazioni di mappatura, gestione runtime e ottimizzazione automatica per i sistemi HPC fino a portarli ad un livello di esascala. L’applicazione per il virtual screening, LiGen, è stata ottimizzata al fine di poter analizzare un elevato numero di composti in tempi rapidi ed è stato eseguito uno screening  di 1,2 miliardi di composti.

Questo è stato il più ampio esperimento di screening virtuale mai eseguito in termini di thread di elaborazione (fino a un milione) e dimensioni del database di composti (un miliardo di molecole) e rappresenta anche il motivo per cui si è riusciti ad avviare così velocemente le attività sul progetto Exscalate4cov.

Ma non è il solo record. 

Di recente, infatti, per la fase di ricerca di farmaci de novo, è stato svolto uno screening di più di 70 miliardi di molecole su 15 siti di interazione attiva del virus per un totale di più di mille miliardi di interazioni valutate in sole 60 ore.

Questo è stato possibile proprio grazie alla simultanea disponibilità della potenza di calcolo (81 petaflop: milioni di miliardi di operazioni al secondo) dell’HPC5 di Eni, Marconi100 del CINECA e il software di screening virtuale creato dal Politecnico di Milano e Cineca, e dalla libreria Exscalate di Dompé.

Utilizzando questa tecnologia è stato possibile raggiungere l’ obiettivo di 5 milioni di molecole simulate per secondo, sfruttando al massimo l’infrastruttura di supercomputing. Basti pensare che questa simulazione è più di 300 volte più grande e 500 volte più veloce di quella realizzata negli USA nel giugno di quest’anno.

HPC e Prospettive future

“Ci saranno altri progetti di sviluppo, con step di implementazione ulteriore sulla piattaforma LiGen e un focus sull’ottimizzazione e industrializzazione per automatizzare alcuni processi di screening. L’ambito dell’urgent computing è nuovo e foriero di potenziali applicazioni in tanti campi per fare calcoli massicci in tempi molto brevi, dove non si parli più di mesi ma di giorni. Oggi un ricercatore che deve effettuare calcoli ha solitamente una trafila da seguire che può richiedere parecchio tempo; l’idea, con questo progetto, è di riorganizzare le risorse per velocizzare i tempi”, dicono Ortali ed Emerson.

Anche a livello regionale le prospettive di sviluppo sono molto promettenti. Il Tecnopolo di Bologna, infatti, sarà sede di Leonardo che, concepito e gestito dal Cineca, sarà uno dei cinque supercomputer più potenti nel mondo e avrà una potenza di calcolo 10 volte superiore rispetto a quella attuale. Ma sarà sede eletta anche del nuovo Data Center ECMWF, cosa che renderà la Regione Emilia Romagna l’area con la maggiore potenza di calcolo in tutta Italia.

“Vediamo sempre di più come deep learning e machine learning siano trasversali e come le potenzialità offerte investano quindi tutti gli ambiti. Questo fa sì che la tecnologia sia a beneficio di tutta la comunità sia pubblica che privata, coinvolgendo sempre di più anche le piccole medie imprese per fornire loro le opportunità di accedere a risorse che fino ad oggi sono state riservate ad una nicchia di utenti principalmente di natura accademica o a grandi imprese e per le quali fino ad oggi non era scontato l’accesso. Nella nostra regione, quindi possono potenzialmente beneficiare di questa opportunità tutte le aree, dal settore health all’agroalimentare”, conclude Ortali.

Una prospettiva che rende orgogliosi e che apre la strada a innumerevoli opportunità di potenziare l’innovazione dell’ecosistema regionale con un respiro che guarda decisamente alla scala internazionale.


Per maggiori informazioni:

Exscalate4cov

Attività di progetto | Comunicato Stampa 21.11.2020

I Clust-ER sono finanziati dai Fondi europei della Regione Emilia-Romagna - POR FESR 2014-2020