Focus

Filologia Computazionale

Il crescente sviluppo di documenti digitali che vengono messi a disposizione da parte di biblioteche ed archivi pubblici e privati apre interessanti prospettive per il settore degli studi umanistici noto col nome di "filologia del testo" o, più tecnicamente, "critica testuale". Le facilitazioni nella lettura di documenti antichi, trasformati in immagini digitali, semplifica il lavoro di interpretazione dei testi e rende attuale la possibilità, spesso solo ipotizzata, di vedere collaborare allo studio di una stessa opera un gruppo di ricercatori coordinati in una struttura di rete. Questo scenario si sta realmente concretizzando proprio grazie all'attività di una specifica linea di ricerca attiva da alcuni anni presso l'ILC; essa ha potuto raggiungere risultati molto lusinghieri sulla base di importanti collaborazioni internazionali, che hanno consentito di ottenere cospicui finanziamenti Europei, e nazionali. Per quanto riguarda questo secondo settore, è opportuno citare i progetti patrocinati dal CNR, nell'ambito del Progetto Finalizzato Beni Culturali, dal MIUR, nel quadro del Programma Parnaso e dal MBAC, nell'ambito della Legge Biscardi per gli Istituti Culturali. L'innovazione tecnologica non si limita, tuttavia, alla produzione di strumenti critico-editoriali che hanno lo scopo di produrre edizioni scientifiche di testi sul web, ma prende in considerazione anche la progettazione e realizzazione di tool di analisi linguistica orientata, per le caratteristiche dei testi sui quali è stata eseguita la sperimentazione e sui quali, di conseguenza, si è acquisita maggiore esperienza, all'interrogazione più fine dei dati. In questo senso la ricerca di filologia computazionale presso l'ILC ha affinato programmi di analisi morfologica e morfo-sintattica che hanno prodotto risultati particolarmente significativi su documenti antichi in lingua latina. Il più noto di essi è rappresentato da CHLT-LEMLAT, uno strumento per l'analisi morfologica e la lemmatizzazione del latino, usato nei centri dove maggiori sono gli archivi testuali relativi a questa lingua: il Perseus Project, della Tufts University di Boston e il Newton Project, presso l'Imperial College di Londra. Anche se, ad una valutazione superficiale, potrebbe sembrare evidente che questa attività sia aliena da ricadute tecnologiche nel settore industriale, in effetti abbiamo verificato che la progettazione ha seguito criteri architetturali dei sistemi software tali da risultare utilizzabile anche in domini molto diversi da quelli per i quali essa è stata realizzata. Per esempio, il sistema di analisi morfologica del latino ha potuto essere integrato in una rete neurale artificiale di riconoscimento dei caratteri su libri a stampa antichi (che è brevetto CNR), affinché contrubuisse alla correzione automatica degli errori e alla proposta di forme linguistiche corrette. Lo stesso sistema si filologia computazionale per i documenti digitali, mettendo in rapporto immagini e testi, ha mostrato di essere suscettibile di importanti sviluppi nella radiodiagnostica digitale in ambiente clinico, o nella gestione e recupero dell'informazione di archivi di spartiti musicali.

Vedi anche: