Istituto di linguistica computazionale "Antonio Zampolli" (ILC)

Attività di ricerca

Fin dalle origini, l'ILC ha ripartito le sue attività in più linee di ricerca. Inizialmente, la ricerca era focalizzata su quelle che costituiscono le "anime" storiche della linguistica computazionale: da un lato lo Humanistic Text Processing (HTP), rappresentato dal ricorso a metodi e tecniche computazionali a supporto delle ricerche umanistiche su testi con particolare attenzione alla filologia, e dall'altro il Natural Language Processing (NLP), volto all'analisi delle strutture linguistiche soggiacenti al testo.
Nel corso degli anni, a partire dalla fine degli anni '80, sono state sviluppate importanti sinergie tra le due linee di attività, che hanno dato origine a una linea di ricerca strategica, dedicata alla progettazione e costruzione di risorse e infrastrutture linguistiche e alla definizione di standard di rappresentazione condivisi dalla comunità scientifica.
Più recentemente, seguendo gli sviluppi correnti nel settore della linguistica computazionale, a queste linee di attività "storiche" si è affiancato un innovativo filone di ricerca, che potremmo definire di frontiera, focalizzato sullo studio dei modelli bio-computazionali del linguaggio e della cognizione.
Le linee di ricerca sopra delineate continuano a rappresentare settori di attività strategica che costituiscono la ricchezza e l'unicità dell'ILC.

LINEE DI RICERCA


  • Digital Humanities
    Le acquisizioni e conoscenze delle scienze informatiche sono coniugate con gli approcci metodologici e i modelli teorici dell'analisi e della filologia del testo, contribuendo così alla trasformazione delle modalità di conservazione, fruizione, studio e pubblicazione dei documenti letterari, archivistici e bibliotecari. Le soluzioni tecnologiche sviluppate offrono nuove prospettive di indagine e condivisione e si integrano in un sistema "multi-modulare" a componenti indipendenti, ma interconnessi, da cui le diverse metodologie di accesso, gestione, studio e revisione del testo possono trarre vantaggio e opportunità di interazione/integrazione.

  • Trattamento Automatico del Linguaggio ed Estrazione di Conoscenza
    Le tecniche sviluppate consentono di accedere in modo automatico al contenuto di un testo e di rispondere a una vasta gamma di bisogni informativi dei parlanti: dall'accesso su base semantica al contenuto testuale, fino alla valutazione della struttura del testo come indicatore della sua accessibilità ed efficacia comunicativa. Le soluzioni tecnologiche proposte rispondono alle necessità di ricerca e gestione "intelligente" dell'informazione contenuta all'interno di grandi basi documentali e possono essere utilizzate in numerose applicazioni commerciali per rispondere ai bisogni della società.

  • Risorse Linguistiche, Standard e Infrastrutture
    La ricerca nel settore dell'ingegneria delle lingue e il ciclo di produzione delle risorse linguistiche sono ottimizzati tramite l'adozione di standard, lo scambio di buone pratiche per l'interoperabilità, il riciclo e il riutilizzo dei risultati disponibili in termini di dati e strumenti. Obiettivo di questa linea strategica è la definizione di modelli per la creazione, rappresentazione, estensione e mantenimento di lessici computazionali, repertori terminologici e ontologici, corpora e tecnologie linguistiche. Le soluzioni tecnologiche messe a punto in questo ambito sono rivolte allo sviluppo di un'infrastruttura di ricerca distribuita e cooperativa, volta a stabilire nuove funzionalità di accesso, interoperabilità e condivisione di risorse e strumenti linguistici.

  • Modelli (bio-)computazionali dell'uso linguistico
    Sono analizzati i fattori che governano i processi di comprensione, produzione, apprendimento e variazione di una lingua, e le interazioni dinamiche tra di essi. In particolare, i modelli teorici dell'uso linguistico e la loro verifica empirica sono sviluppati tramite: metodi probabilistici per lo studio di corpora, lessici e basi di dati; simulazioni computazionali; studio di evidenza linguistica di natura sperimentale, clinica e acquisizionale. Le metodologie di rappresentazione formale e modellazione simbolica sono coniugate con i metodi, i dati e gli strumenti di indagine di settori disciplinari più orientati all'analisi dell'uso linguistico in contesti finalizzati e controllati, quali la psico- e neuro-linguistica, la sociolinguistica e la glottodidattica.