Home |  English version |  Mappa |  Commenti |  Sondaggio |  Staff |  Contattaci Cerca nel sito  
Previsione Attività
Commessa
Risorse e Tecnologie Linguistiche: standardizzazione, sviluppo, infrastrutture, strategie


  anni:  2006   2007   2008   2009   2010   2011   2012   2013   2014   2015 

Previsione attività anno 2015

Attività da svolgere:
- Modellazione e creazione di corpora e di risorse lessicali, terminologie e ontologie, generiche e di dominio. Creazione e adattamento di risorse lessicali in applicazioni di accesso intelligente al contenuto semantico nel dominio dell'ambiente e della protezione civile per il monitoraggio di eventi di grande impatto ambientale. Testing e adattamento di una ontologia multimediale dell'Azione e modellazione di primitivi azionali. Creazione di risorse lessicali a supporto di sentiment analysis e named entity recognition per il latino. Sviluppo di risorse e strumenti a supporto dell'elaborazione del linguaggio naturale in compiti di interazione uomo-macchina, opinion mining, e per l'analisi del linguaggio dei social media. Mapping di ontologie con risorse lessicali e reti concettuali in Italiano e Inglese. Creazione di strumenti di disambiguazione semantica per il riconoscimento del tipo azionale dei verbi in contesto Incremento e validazione dei corpora e lessici esistenti. Creazione di lessici computazionali a supporto dello studio delle lingue classiche, in collaborazione con CoPhiLab e il modulo "Metodi, risorse e strumenti per lo studio della storia della tradizione e per la critica del testo". - Definizione, promozione, adattamento e valutazione di standard per la rappresentazione di informazione linguistica. Definizione di modelli per la rappresentazione delle risorse lessicali come linked data in formato RDF. Integrazione delle risorse linguistiche pubblicate in linked data con altre risorse esistenti (lessici/ontologie). Formalizzazione di un modello RDF OWL per WordNet di lingue classiche e per la rappresentazione di informazioni diacroniche. - Definizione di metadati per la descrizione armonizzata di risorse. Studio e definizione di metadati per la descrizione di risorse linguistiche relative a lingue regionali e minoritarie in conformità con gli standard internazionali allo stato dell'arte. Mantenimento e promozione della piattaforma per la catalogazione e condivisione di risorse linguistiche Metashare e suo linking ad altre risorse (LRE map). - Acquisizione, espansione, arricchimento di risorse linguistiche. Creazione di pipeline per l'acquisizione di lessico specifico da testi specialistici. Implementazione e valutazione di un modulo di analisi degli "indicatori quantitativi" del sentimento sui social media da integrare con i moduli di analisi linguistica. - Sviluppo di tecniche per garantire l'interoperabilità e l'integrazione delle risorse. Creazione di convertitori da e verso i formati ISO al fine di rendere possibile l'interazione dei vari tool, preservando l'informazione linguistica proveniente da fonti diverse. - Mantenimento e adattamento di servizi web per l'accesso alle risorse e l'utilizzo di strumenti linguistici per l'analisi linguistica e l'estrazione lessicale. - Uso e adattamento di risorse in applicazioni e in domini diversi. Adattamento delle risorse linguistiche e lessicali esistenti a vari domini. Adattamento delle tecnologie semantiche per l'analisi di contenuti digitali ricavati da Internet o da altre fonti al fine dell'estrazione di informazione opinionata. - Studio di nuovi metodi di sviluppo collaborativo e di condivisione di strumenti e risorse. Ampliamento del sistema di censimento dell'uso delle risorse della LRE map ad altre conferenze, journals e progetti; linking del tool al catalogo Metashare e ad altri cataloghi per il censimento delle risorse linguistiche. - Licenze d'uso e risorse linguistiche Identificazione di modelli di licenze d'uso di risorse sulla base dei requisiti di fornitori e utenti ed in linea con le strategie della infrastruttura Meta-Share. - Strategie e politiche di sviluppo del settore del TAL e delle RL Verrà continuata l'attività di promozione del settore nei consessi scientifici e istituzionali appropriati, anche attraverso attività editoriale. - Attività di divulgazione Sarà continuata l'attività di divulgazione verso scuole, cittadinanza e pubblica amministrazione relativamente al ruolo del TAL e delle risorse linguistiche. - Infrastrutture di ricerca: le attività da svolgere sono primariamente connesse alle attività di ricerca e sviluppo relative al progetto premiale SM@RTINFRA coordinato dal DSU e di cui l'ILC fa parte: mantenimento dell'infrastruttura hardware/software già sviluppata per i progetti EU PANACEA e T4ME e realizzazione di componenti e/o web services per la costruzione di un nodo CLARIN come preparazione all'inclusione dell'Italia all'interno dell'infrastruttura di ricerca CLARIN ERIC. A questo proposito, le principali attività saranno relative alla preparazione e adattamento alla situazione nazionale del disegno di infrastruttura europea, al coinvolgimento dei diversi gruppi nazionali interessati e all'acquisizione o potenziamento dei componenti hardware e software necessari alla messa in opera dell'infrastruttura italiana nel quadro del progetto citato.
Punti critici e azioni da svolgere:
Il punto critico continua ad essere l'organico. Le iniziative e i progetti (europei, internazionali, con industrie) comportano un carico notevole sempre maggiore di responsabilità e di attività sia scientifiche sia gestionali. Ciò richiede la disponibilità di ricercatori con competenze specifiche, la possibilità di formare su questi temi alcuni giovani, oltre ad aggiornare le competenze di ricercatori già coinvolti. Si stanno da tempo formando, con finanziamenti esterni, giovani con competenze specifiche ed è necessario inquadrarne alcuni come personale strutturato, anche per garantire continuità alle attività di ricerca e sviluppo. Attualmente 3 assegnisti di ricerca ed un borsita-dottorando affiancano gli strutturati nella conduzione delle attività afferenti alla commessa. Si considerano essenziali almeno 1 ricercatore e 1 tecnologo con profilo organizzativo-gestionale per segreteria scientifica ed assistenza al coordinamento di progetti internazionali e nazionali. Tali figure, che svolgono attività imprescindibili per il funzionamento del modulo e dei progetti, sono da anni pagate su fondi esterni di ricerca di questo modulo. Per quanto concerne le attività scientifiche, la sfida maggiore è rappresentata dalla necessità di realizzare funzionalità del tutto nuove di accesso e elaborazione delle risorse linguistiche. Lo sviluppo del Semantic Web in chiave multilingue richiede il coinvolgimento di altri gruppi, anche industriali, al fine di identificare e studiare le connessioni fra conoscenze distribuite in rete e le ontologie generali e di dominio che ne formeranno la base.
Risultati attesi nell'anno:
I risultati attesi all'interno della commessa coincidono prevalentemente con obiettivi e risultati dei vari progetti nazionali e internazionali. - Modellazione e creazione di corpora e di risorse lessicali, terminologie e ontologie, generiche e di dominio. Risorse lessicali in applicazioni di accesso intelligente al contenuto semantico nel dominio dell'ambiente e della protezione civile per il monitoraggio di eventi di grande impatto ambientale. Adattamento ed utilizzo dell'ontologia multimediale dell'Azione e sviluppo di modelli di primitivi azionali da utilizzarsi in robotica. Realizzazione di una piattaforma per la costruzione di risorse lessicali per le lingue classiche a partire da approcci diversi. - Risorse e strumenti a supporto dell'elaborazione del linguaggio naturale in vari ambiti e domini: in compiti di interazione uomo-macchina, opinion mining, e per l'analisi del linguaggio dei social media. Strumenti di disambiguazione semantica per il riconoscimento del tipo azionale dei verbi in contesto. Tecniche e sistemi di opinion mining al fine di catturare le opinioni degli utenti sui siti sociali. - Definizione, promozione, adattamento e valutazione di standard per la rappresentazione di informazione linguistica. Modelli di rappresentazione delle risorse lessicali come linked data in formato RDF. - Definizione di metadati per la descrizione armonizzata di risorse. Mantenimento e promozione della piattaforma MetaShare per la catalogazione e condivisione di risorse linguistiche. - Pipelines integrate per l'acquisizione, l'espansione, l'arricchimento di risorse linguistiche. Sviluppo di pipeline per l'acquisizione di lessico specifico da testi di dominio ambientale marino e di gestione delle emergenze. - Convertitori e mappers per garantire l'interoperabilità e l'integrazione delle risorse. Convertitori da e verso il formato standard ISO. - Adattamento di risorse in applicazioni e in domini diversi. Adattamento delle tecnologie semantiche per l'analisi di contenuti digitali ricavati da Internet o da altre fonti (social media, quotidiani online) al fine di estrarre informazione opinionata. Costruzione di basi di conoscenza in settori specifici. - Studio di nuovi metodi di sviluppo collaborativo e di condivisione di strumenti e risorse. Ampliamento della LRE map ad altre conferenze, journals e progetti; linking del tool al catalogo Metashare e ad altri cataloghi per il censimento delle risorse linguistiche. - Strategie e politiche di sviluppo del settore del TAL e delle Risorse linguistiche. Convegni, workshop e tavole rotonde dedicate al tema delle Risorse linguistiche. Edizione di nuovi numeri della rivista LRE. In attesa della partecipazione formale dell'Italia al CLARIN ERIC, si continueranno in seno a SM@ARTINFRA le attività relative alla mobilitazione di istituti e gruppi operanti su tematiche affini e la raccolta di risorse e/o strumenti con cui continuare a popolare il portale italiano. A tal fine, risultati correlati sono: - aggiornamento e attualizzazione di metadati - localizzazione di componenti per la lingua italiana - costruzione componenti e/o web service - conversione dei formati proprietari delle risorse agli standard di rappresentazione di riferimento - integrazione delle risorse all'interno del portale. Nell'anno in oggetto, quindi, si inizieranno quelle attività rivolte - a lungo termine - agli obiettivi di una migliore razionalizzazione delle risorse disponibili nel settore delle scienze umane e sociali, di un restringimento del gap esistente tra esperti, e del complessivo rafforzamento del ruolo dell'Italia come leader europeo del settore.
Iniziative per l'acquisizione di ulteriori entrate:
Si intende partecipare ad una o più call previste per l'anno 2015 o per il biennio 2015-2017 dal programma quadro europeo per la ricerca e l'innovazione Horizon 2020 ed Erasmus+. L'attenzione è concentrata sui seguenti temi: 1) "superamento delle barriere linguistiche" 2) "eredità culturale e identità europee", riguardante la trasmissione del sapere dall'antichità al mondo moderno e contemporaneo; 3) "l'Europa come attore globale", incentrato sulle relazioni diplomatiche con paesi terzi, per le quali sono necessari strumenti collaborativi e localizzazione di risorse linguistiche; 4) "nuove forme di innovazione", sul versante infrastrutturale e tecnologico. In particolare, per il punto 2), è stata presentata una proposta relativa ad un "virtual research environment" specializzato per lo studio delle lingue classiche. E' stata inoltre presentata una ulteriore proposta a supporto e per il rilancio del settore delle Digital Humantities relativa ad una piattaforma per l'integrazione virtuale di strumenti e risorse documentali ad uso degli studiosi del settore. Saranno mantenuti i contatti con Fondazioni, Consorzi e Enti Pubblici toscani, interessati alla condivisione delle risorse informative di comunicazione sul territorio. Saranno incrementati i contatti con gruppi di ricerca afferenti ad altri Dipartimenti CNR al fine di favorire le sinergie e con industrie da cui possono scaturire nuove collaborazioni, e.g. con IBM, Synthema, Liberologico, META, Enterprise Digital Architect, Expert System, Genesi e Sister.
 
Torna indietro Richiedi modifiche Invia per email Stampa
Home Il CNR  |  I servizi News |   Eventi | Istituti |  Focus