Home |  English version |  Mappa |  Commenti |  Sondaggio |  Staff |  Contattaci Cerca nel sito  
Descrizione
commessa
Risorse e Tecnologie Linguistiche: standardizzazione, sviluppo, infrastrutture, strategie


Tematiche di ricerca:
Le tematiche di ricerca della Commessa sono sono in linea con gli obiettivi del VII PQ relative al settore di ICT e con gli orientamenti della unità della CE "Language Technologies and Machine Translation". Si articolano in: Modellazione e creazione di risorse lessicali, terminologie e ontologie, generiche e di dominio e corpora. Rappresentazione, annotazione e validazione di risorse linguistiche per il TAL. Definizione, promozione adattamento e valutazione di standard per la rappresentazione di informazione linguistica. Tecnologie per l'accesso, l'acquisizione, l'espansione, l'arricchimento e l'interoperabilità di risorse linguistiche. Studio e realizzazione di prototipi relativi a nuove modalità di creazione e gestione di RL; Uso e adattamento di RL in applicazioni e in domini diversi. Valutazione di tecnologie per l'integrazione di strumenti e risorse e creazione di una di piattaforma integrata. Studio di nuovi metodi di sviluppo collaborativo e di condivisione di strumenti e risorse. Studio, definizione e implementazione di una infrastruttura per la condivisione e l'uso di strumenti e risorse.
Obiettivi:
Gli obiettivi principali della commessa comprendono più aspetti: da una parte, l'accento è sul ciclo vitale delle risorse linguistiche, dai modelli e tecnologie per la creazione, rappresentazione, estensione e mantenimento di risorse linguistiche, allo sviluppo di sistemi e nuove modalità per la loro acquisizione ed annotazione, fino all'uso, testing e valutazione in contesti applicativi di eHealth, Environment, etc; dall'altra, si indagano aspetti infrastrutturali, al fine di stabilire un nuovo paradigma di R&S nel TAL attraverso la creazione di un'infrastruttura linguistica distribuita e condivisa in rete, che permetta la collaborazione controllata e effettiva di molti centri su un compito comune, strategia vincente in discipline più mature quali biologia e fisica.
Stato dell'Arte:
Risorse, Tecnologie Linguistiche e Standard sono temi prioritari riconosciuti dalla comunità internazionale, come testimoniato dal fiorire di attività, iniziative, progetti e eventi relativi al settore. Le tecniche di TAL sono sufficientemente mature per poter concordare standard internazionali per le RL. Le tecnologie linguistiche sono inoltre sempre più robuste, tanto da poter essere integrate in applicazioni che danno luogo a prodotti e servizi. Si prevede in futuro un'espansione del settore dovuta al riconoscimento dell'utilità di usare tecnologie linguistiche in diversi ambiti applicativi, ovunque si debba trattare con grandi basi documentali. Vari progetti nazionali ed internazionali hanno posto le basi per lo sviluppo di un'architettura che permette di condividere risorse e strumenti linguistici. La creazione di una tale infrastruttura è in linea con le raccomandazioni del network FLARENET per promuovere il settore, favorire sinergie fra diversi attori, individuare aree di sviluppo a alto impatto tecnologico, con marcate ricadute economiche, sociali, e culturali.
Potenziale Impiego:
per processi produttivi:
Le Risorse Linguistiche, componente essenziale di ogni tecnologia linguistica, sia per sviluppo che per validazione di sistemi e applicazioni, rivestono un ruolo importante in molti processi produttivi e hanno ricadute industriali in quanto usate in qualsiasi sistema applicativo. E' basilare rendere possibile a gruppi di ricerca e industriali il perseguimento di specifici sviluppi applicativi su un insieme robusto e modulare di tecnologie 'di base', fruibili in rete, che possono essere adattate e integrate in diversi sistemi. L'adozione di modelli armonizzati e standard internazionali nelle Risorse Linguistiche massimizza gli sforzi e promuove lo sviluppo di tecnologie interoperabili più innovative e competitive, favorendo il loro utilizzo in applicazioni, con risultati immediati e prodotti migliori. Gli standard garantiscono l'interoperabilità di risorse, rendono i servizi in ambiente web efficienti, e consentono la personalizzazione in base alle necessità degli utenti. Un'infrastruttura condivisa di risorse e strumenti deve essere una tecnologia abilitante per applicazioni con ampie ricadute sociali, in chiave multilingue e multiculturale.
per risposte a bisogni individuali e collettivi:
Gli standard e le risorse linguistiche forniscono risposte a obiettivi sociali e culturali, rispondendo al crescente bisogno verso l'interoperabilità e l'integrazione di componenti diversi. Essi, inoltre: - consentono un accesso migliore del cittadino e dell'esperto al contenuto linguistico di basi documentali in diversi servizi e applicazioni; - favoriscono lo sviluppo della comunicazione in un contesto multilingue; - contribuiscono alla promozione e allo studio della lingua e cultura italiana in rete; - garantiscono fruizione di conoscenza e informazione di alta qualità da parte di varie tipologie di utenti, - contribuiscono ad accrescere le opportunità in campo educativo e lavorativo. Le risorse linguistiche, d'altro canto, si prestano ad utilizzi specifici, come la realizzazione di strumenti didattici e riabilitativi, la creazione di dizionari, lo sviluppo di sistemi di ricerca documentale.
Competenze, strumentazione, tecniche di indagine e tecnologie :
Competenze (conoscenze possedute dai partecipanti alla commessa rilevanti ai fini del suo svolgimento):
Fra le principali competenze necessarie allo svolgimento delle attività della commessa citiamo: semantica, rappresentazione della conoscenza e ontologie; lessicologia e lessicografia computazionali; metodi e protocolli per la creazione di risorse lessicali tramite integrazione di risorse esistenti; accesso a risorse lessicali computazionali generiche e di dominio; metodi di annotazione dell'informazione linguistica; tecniche simboliche e statistiche per l'estrazione d'informazione lessicale da testi; metodi e linguaggi di rappresentazione del contenuto linguistico, in particolare linguaggi orientati al Semantic Web; metodologie, procedure e protocolli di standardizzazione; tecnologie XML (DTD, RelaxNG, W3C schema; RDF/OWL); tecnologie web (Java Servlet, JSP, JSF2, Icefaces2); webservices; competenze informatiche di linguaggi di programmazione, software Open Source, database relazionali.
Strumentazione (dispositivi, apparecchiature o impianti utilizzati per lo svolgimento delle attività):
Tecniche d'indagine (metodologie per la comprensione di fenomeni o strutture attraverso l'impiego combinato di competenze e strumentazione):
Metodologie, procedure e protocolli di standardizzazione; tecniche di lessicografia e lessicologia computazionali; metodi e linguaggi di rappresentazione del contenuto linguistico; metodi di annotazione dell'informazione linguistica; tecniche simboliche e statistiche per l'estrazione d'informazione lessicale da testi; tecnologie linguistiche, Grid e web services.
Tecnologie (Metodologie di modellazione o di intervento su oggetti e sistemi):
La commessa fa uso delle seguenti tecnologie: - tecnologie di modellazione oggetti (UML, RelaxNG); - linguaggi di rappresentazione e markup dati (DTD, XML, RDF Schema, RDF/OWL); - database relazionali; - tecnologie per la gestione di workflow documentali, - linguaggi e strumenti di rappresentazione ontologica; - linguaggi informatici di programmazione (Java, C, C++, C# e Perl ...) - tecnologie Web (Java Servlet, JSP, JSF2, Icefaces2) - web services e tecnologie per la sicurezza nei web services Axis2 e Axis1 (WSS4J e Rampart) - tecnologie open source per analisi dati - tagger, parser e annotatori da combinarsi in una piattaforma integrata
 
Torna indietro Richiedi modifiche Invia per email Stampa
Home Il CNR  |  I servizi News |   Eventi | Istituti |  Focus