Istituto di linguistica computazionale "Antonio Zampolli" (ILC)

Attività di ricerca

Fin dalle origini, l'ILC ha ripartito le sue attività in più linee di ricerca. Inizialmente, la ricerca era focalizzata su quelle che costituiscono le "anime" storiche della linguistica computazionale: da un lato lo Humanistic Text Processing (HTP), rappresentato dal ricorso a metodi e tecniche computazionali a supporto delle ricerche umanistiche su testi con particolare attenzione alla filologia, e dall'altro il Natural Language Processing (NLP), volto all'analisi delle strutture linguistiche soggiacenti al testo.
Nel corso degli anni, a partire dalla fine degli anni '80, sono state sviluppate importanti sinergie tra le due linee di attività, che hanno dato origine a una linea di ricerca strategica, dedicata alla progettazione e costruzione di risorse e infrastrutture linguistiche e alla definizione di standard di rappresentazione condivisi dalla comunità scientifica.
Più recentemente, seguendo gli sviluppi correnti nel settore della linguistica computazionale, a queste linee di attività "storiche" si è affiancato un innovativo filone di ricerca, che potremmo definire di frontiera, focalizzato sullo studio dei modelli bio-computazionali del linguaggio e della cognizione.
Le linee di ricerca sopra delineate continuano a rappresentare settori di attività strategica che costituiscono la ricchezza e l'unicità dell'ILC.

LINEE DI RICERCA


  • Informatica umanistica
    Sviluppo di modelli, metodi e tecniche per la conservazione, la fruizione intelligente, lo studio linguistico (diacronico, sincronico, comparativo) e lo studio filologico (ecdotico e interpretativo) di testi di interesse per le scienze umane e sociali, con particolare attenzione a testi storici e letterari.
    Le acquisizioni e conoscenze delle scienze informatiche sono coniugate con gli approcci metodologici e i modelli teorici dell'analisi e della filologia del testo, contribuendo così alla trasformazione delle modalità di conservazione, fruizione, studio e pubblicazione dei documenti letterari, archivistici e bibliotecari.

  • Trattamento automatico della Lingua e Gestione della Conoscenza
    Sviluppo di metodi, modelli e tecniche basati su algoritmi simbolici, probabilistici e reti neurali per compiti di trattamento automatico della lingua nelle sue diverse varietà d'uso e con particolare attenzione alla lingua italiana, e per l'estrazione e la rappresentazione della conoscenza codificata all'interno di testi.
    Le soluzioni tecnologiche proposte rispondono alle necessità di ricerca e gestione "intelligente" dell'informazione contenuta all'interno di grandi basi documentali in continua evoluzione e possono essere utilizzate in numerose applicazioni per rispondere ai bisogni della società.

  • Risorse Linguistiche, Standard e Infrastrutture
    Sviluppo e gestione di risorse linguistiche (lessici computazionali, repertori terminologici e ontologici, corpora), con particolare attenzione alla rappresentazione dei dati secondo standard internazionali che ne garantiscono la condivisione, l'interoperabilità e la conservazione a lungo termine in linea con i principi della Scienza Aperta.
    Le soluzioni tecnologiche messe a punto in questo ambito sono rivolte allo sviluppo di un'infrastruttura di ricerca distribuita e cooperativa per stabilire nuove funzionalità di accesso, interoperabilità e condivisione di risorse e strumenti linguistici.

  • Modelli (bio-)computazionali dell'uso linguistico
    Analisi dei fattori che governano i processi di comprensione, produzione, apprendimento e variazione di una lingua, e le interazioni dinamiche tra di essi. In particolare, i modelli teorici dell'uso linguistico e la loro verifica empirica sono sviluppati tramite: metodi probabilistici per lo studio di corpora, lessici e basi di dati; simulazioni computazionali; studio di evidenza linguistica di natura sperimentale, clinica e acquisizionale.
    Le metodologie di rappresentazione formale e modellazione simbolica sono coniugate con i metodi, i dati e gli strumenti d'indagine di settori disciplinari più orientati all'analisi dell'uso linguistico in contesti finalizzati e controllati, quali la psico- e la neuro-linguistica, la sociolinguistica e la glottodidattica.