Focus

gCube: un Service-Oriented Application Framework su Grid

Il DLib group del Networked Multimedia Information Systems Laboratory (commessa: Digital Libraries) dell'ISTI-CNR, diretto da Donatella Castelli, ha realizzato un framework applicativo, gCube, fortemente innovativo per la creazione e gestione di infrastrutture (e-Infrastructures) che supportano una condivisione efficace ed efficiente di risorse computazionali, contenuti e servizi applicativi. Tali infrastrutture semplificano la realizzazione di Virtual Research Environments (VREs), ambienti per il supporto alla cooperazione attraverso i quali gruppi di esperti a studiosi coinvolti in attività di ricerca possono scambiare in modo efficace ed efficiente risultati e informazione al fine di produrne di nuovi.
Per porre in essere tale scenario gCube offre un triplice supporto all'implementazione di infrastrutture capaci di costruire e gestire VREs basandosi su tecnologie grid. gCube offre (i) dei framework per il design e il supporto a run-time di servizi progettati per essere gestiti da una infrastruttura grid di nuova generazione; (ii) un grid middleware di nuova generazione basato sul paradigma service-oriented che permette l'uso di risorse computazionali e di storage fornite da grid di prima generazione nonché l'allocazione e gestione dinamica di web services; (iii) un insieme di servizi applicativi per la gestione e il recupero di dati (semi-)strutturati in un contesto distribuito.
I gCube framework per il supporto a run-time sono dei processi che, per le caratteristiche del sistema, sono pre-definiti solo in parte. Includono servizi per il funzionamento dell'infrastruttura e servizi applicativi, dove i primi sono responsabili del coordinamento dei secondi basandosi su una loro descrizione semantica. I gCube design framework sono dei pattern di progettazione, delle librerie software e delle implementazioni parziali di soluzioni per applicazioni grid-oriented di nuova generazione che possono essere configurate, estese e istanziate nel realizzare le proprie applicazioni.
Il grid middleware di nuova generazione basato sul paradigma service-oriented offre le funzionalità necessarie alla gestione di infrastrutture grid per VREs. In particolare, tale middleware offre le funzionalità per il deployment a la gestione automatica dei servizi eliminando i costi di intervento umano, garantendo un'allocazione ottima e offrendo nuove opportunità per implementazioni di soluzioni innovative da dare in outsourcing all'infrastruttura. Infatti, il software che implementa i servizi è concepito per essere gestito interamente dall'infrastruttura piuttosto che interfacciarsi con essa e, grazie a questo, sarà l'infrastruttura a farsi carico del suo deployment sfruttando le risorse disponibili in modo da soddisfare i requisiti funzionali e garantire la qualità del servizio attesa. Inoltre, tale middleware, integrando il software gLite sviluppato nell'ambito del progetto EGEE, Enabling Grid for E-sciencE, per le funzionalità di batch processing e di gestione di dati non strutturati (ovvero singoli files), permette di usare le risorse computazionali e di storage offerte da infrastrutture basate su di esso tra cui l'infrastruttura EGEE stessa. Tale infrastruttura, ad oggi formata da oltre 250 siti locati in 48 paesi e capace di offrire accesso ad oltre 60'000 unità di calcolo e oltre 20 Petabyte di spazio disco , rappresenta la più grande infrastruttura grid di prima generazione costruita.
I servizi applicativi gCube offrono una piattaforma completa di funzionalità per la memorizzazione, gestione e recupero di informazione di varia natura. Inoltre costituiscono un framework con cui costruire servizi innovativi per l'indicizzazione, la selezione, l'integrazione, l'estrazione, la descrizione, l'annotazione, la trasformazione, e la presentazione di dati. In particolare, gCube offre servizi per la manipolazione di oggetti informativi di varia natura, per importare oggetti informativi da sorgenti pre-esistenti e gestirne i loro metadati in molteplici formati, per memorizzare in modo sicuro tali informazioni e per gestire in modo completamente trasparente all'utente la memorizzazione in molteplici copie degli oggetti nonché il loro partizionamento su tecnologie di storage grid.
Al fine di garantire l'interoperabilità, l'intero framework gCube è stato concepito e implementato basandosi su standard web services. Tra questi SOAP, BPEL, WSRF, WS-Notification, WS-Security, WS_Addressing, e JSR-168.
gCube è stato usato per realizzare l'infrastruttura DILIGENT, nell'ambito dell'omonimo progetto IST finanziato dalla EU. Tale infrastruttura permette la realizzazione di vari VREs per supportare l'attività dei membri di varie comunità tra cui Environmental Monitoring e Cultural Heritage. La comunità Environmental Monitoring, diretta dalla European Space Agency, è una comunità formata da vari esperti e istituzioni nel settore ambientale che hanno la missione di preparare rapporti periodici contenenti indicatori sullo stato del pianeta integrando e processando enormi quantità di dati. La comunità Cultural Heritage coinvolge esperti e studiosi che stanno lavorando alla definizione di una nuova disciplina altamente multidisciplinare per lo studio e la ricerca di relazioni tra immagini e testi. Inoltre, grazie alle sue caratteristiche di estendibilità e adattabilità, gCube è stato utilizzato per servire due comunità operanti in scenari completamente diversi dai precedenti quali quelli risultanti dai progetti Health-e-Child e SAPIR. In particolare, nell'ambito della collaborazione con il progetto SAPIR, grazie all'uso di gCube la comunità ha potuto processare circa 37 milioni di immagini in sole 16 settimane e produrre circa 112 milioni di oggetti informativi (testi e immagini per circa 5 Terabyte) annotati con oltre 150 milioni di caratteristiche descrittive.
gCube sarà utilizzato per la creazione e il funzionamento dell'infrastrutture D4Science, infrastruttura rilasciata dall'omonimo progetto finanziato dalla EU. Tale progetto ha l'obiettivo di realizzare una infrastruttura capace di servire i bisogni di due comunità, Environmental Monitoring, diretta dalla European Space Agency, e Fishery and Aquaculture Resources Management, diretta dalla FAO. Fornendo queste comunità di VREs capaci di offrire un accesso uniforme ad un enorme numero di sorgenti informative altamente eterogenee quali dati satellitari, dati sul clima, dati idrografici e dati sul commercio nonché ad un insieme di tool per la loro gestione e processing, D4Science pone le basi per approcci innovativi alla modellazione e studio di ecosistemi sociali, ovvero la principale attività di queste comunità.