Descrizione del modulo "ICT for Open Government (ICT.P08.009.004)"

Type
Label
  • Descrizione del modulo "ICT for Open Government (ICT.P08.009.004)" (literal)
Potenziale impiego per bisogni individuali e collettivi
  • L'attribuzione di metadati semantici strutturati alle fonti giuridiche e la loro interconnessione consente nuove modalità di accesso e fruizione dei dati giuridici all'interno di banche dati, siti web, servizi di egoverment, alimentati da dati di dominio arricchiti e strutturati. L'interconnessione multilingua fra schemi di annotazione di paesi diversi consente l'ulteirore espansione dello spazio di ricerca agli ordinamenti giuridici e alla produzione giurisprudenziale di altri paesi ed entità sovranazionali. (literal)
Tematiche di ricerca
  • analisi e sviluppo di strumenti per l'annotazione automatica di testi giuridici supportati da terminologie di dominio struttuate e caratteristiche di dominio extralinguisitiche (es. riferimenti). Sviluppo e specializzazione algoritmi di tagging automatico a dataset di atti normativi e documenti giurisprudenziali, in Italiano. Estensioni multilingua studio dello stato dell'arte dei formati di dati e metadati, degli standard di identificazione di fonti giuridiche e dei vocabolari controllati di dominio finalizzati all'l'interconnessione semantica delle fonti secondo il paradigma Linked Open Data analisi e sviluppo di strumenti a supporto dell'editing collaborativo di terminologie multilingua strutturate basate su schemi concettuali di annotazione di documenti giuridici. Sviluppo di una piattaforma per l'editing collaborativo, da parte di comunità di esperti, di Thesauri in formato standard SKOS e delle loro mappature semantiche. analisi e sviluppo di strumenti a supporto del drafting di documenti giuridici conformi agli standard tecnologici per la pubblicazione in formato aperto degli atti, della loro interoperabilità, e dell'uso di terminologia controllata nella redazione. (literal)
Competenze
  • Le competenze richieste per lo svolgimento delle attività previste riguardano prevalentemente gli aspetti tecnologici di: - linguaggi di marcatura di documenti (XML) e metadati (RDF) - modellazione di risorse semantiche per il web (OWL) - modellazione di lessici e risorse linguistiche computazionali (SKOS, Wordnet) - natural language processing - algoritmi di categorizzazione automatica dei testi (machine learning) - sviluppo di applicazioni per il web Competenze di documentazione giuridica per la specializzazione dei modelli, l'integrazione negli algoritmi della conoscenza di dominio e la validazione degli strumenti automatici applicati a fonti giuridiche (literal)
Potenziale impiego per processi produttivi
  • L'applicazione di tecnologie di estrazione automatica di feature semantiche di dominio da corpora giuridici e di integrazione e connessioni fra le fonti ha un rilevante impatto potenziale in tutti i processi di pubblicazione di documenti giuridici sia in contesti pubblici (cataloghi normativi, database giurisprudenziali, sistemi di cancelleria, sistemi di gestione del workflow parlamentare) che privati (database dottrinali, editoria specialistica giuridica) (literal)
Tecnologie
  • XML, RDF, OWL, SKOS Java triple stores / database RDF / OWL API componenti NLP Strumenti indicizzazione (Lucene, Solr) (literal)
Obiettivi
  • Trasparenza, accessibilità, quindi effettiva conoscibilità dell'ordinamento da parte del cittadino. Promuovere la effettiva accessibilità e riusabilità delle informazioni pubbliche, in particolare giuridiche. Definizione applicazione e supporto di standard finalizzati alla creazione di una infrastruttura informativa di dati interconnessi e riusabili su cui rendere possibile per attori pubblici e terze parti l'implementazione di servizi informativi secondo il modello Data As A Service. Divulgazione e multilinguismo: l'annotazione dei testi rispetto dizionari multilingua permetterà anche l'accesso a informazioni espresse in lingue diverse o ad ordinamenti esteri. (literal)
Stato dell'arte
  • La standardizzazione dei formati per l'annotazione formale e per l'identificazione univoca di documenti normativi e giurisprudenziali, è ormai una realtà consolidata ma la loro implementazione su larga scala e I conseguenti benefici in termini di pubblicazione e di fruizione del dato giuridico sono tuttora obiettivi da raggiungere. Analogamente schemi di annotazione di risorse giuridiche e l'uso di vocabolari controllati di dominio per l'annotazione dei documenti non hanno ancora trovato una reale applicazione su larga scala. Il recente fenomeno dei Linked Open Data e la spinta verso la pubblicazione di dati pubblici in formato aperto offre l'occasione per l'integrazione delle diverse risorse semantiche e documentali in una base di conoscenza di dominio interconnessa e distribuita. L'applicazione di strumenti di analisi automatica dei testi specializzati al dominio giuridico consentono un ulteriore arricchimento semantico dei dati. (literal)
Tecniche di indagine
  • Analisi linguistica di corpus omogenei di documenti giuridici (corpus normativi statali, corpus normativi regionali, giurisprudenza civile di merito, giurisprudenza civile di legittimità, giurisprudenza costituzionale) Estrazione automatica di lessici di dominio da corpus giurisprudenziali aggregati per materia; valutazione e validazione manuale da esperti del dominio. Tecniche di analisi e annotazione formale dei testi in forma strutturata. Tecniche di estrazione di feature giuridiche rilevanti (es. riferimenti legisativi, riferimenti giurisprudenziali) Analisi e rappresentazione formale standardizzata di schemi di classificazione e theauri di dominio. Tecniche di rappresentazione, raffinamento e pubblicazione di dataset strutturati in modalità linked data. Trasferimento dei risultati allo stato dell'arte in - natural language processing - rappresentazione della conoscenza a livello concettuale e terminologico - knowledge mining al trattamento di fonti giuridiche e informazioni del settore pubblico (literal)
Descrizione di

Incoming links:


Descrizione
data.CNR.it