Progetto di ricerca

MATRICES - Semantic Annotation over Heterogeneous Historical Documents (DUS.AD012.130)

Area tematica

Scienze umane e sociali, patrimonio culturale

Area progettuale

Popolazione, società, scienza, cultura e globalizzazione (DUS.AD012)

Struttura responsabile del progetto di ricerca

Istituto di ricerche sulla popolazione e le politiche sociali (IRPPS)

Responsabile di progetto

FERNANDO FERRI
Telefono: 06 492724 216
E-mail: fernando.ferri@irpps.cnr.it

Abstract

MATRICES è un progetto interdisciplinare al quale partecipano due dipartimenti dell'Università Roma Tre e un istituto del CNR. Il Dipartimento di Ingegneria dell'Università Roma Tre contribuisce al progetto con le proprie competenze di ingegneria informatica, in particolare intelligenza artificiale e gestione dei dati; il Dipartimento di Studi Umanistici con le proprie competenze in paleografia, archivistica e storia urbana. L'Istituto di Ricerche sulla Popolazione e le Politiche Sociali del CNR contribuisce con competenze relative alla facilitazione dell'accesso all'informazione. Il progetto si avvale anche della collaborazione dell'Archivio di Stato di Roma, che fornirà il materiale archivistico su cui verrà definito lo studio di caso per la valutazione sperimentale delle soluzioni sviluppate nel progetto.

Obiettivi

Il progetto MATRICES ha l'obiettivo specifico di sviluppare un workflow innovativo per la trascrizione e l'annotazione semantica di fonti archivistiche storiche digitalizzate, al fine di facilitare la consultazione su larga scala. Per trascrizione si intende il processo di estrazione del testo dalle immagini digitalizzate, in modo ad esempio, che risulti ricercabile e accessibile. Per annotazione semantica si intende l'identificazione automatica nel testo e nelle immagini di elementi semantici di interesse dell'utente, sotto forma principalmente di entità (come località, vie, edifici, istituzioni e persone) e specifiche relazioni (ad esempio il luogo di nascita di una persona). Trascrizione e annotazione semantica sono infatti alla base del processo di trasformazione e conservazione digitale di un archivio cartaceo e rappresentano il naturale passo successivo alla sua digitalizzazione.

Data inizio attività

15/04/2021

Parole chiave

Annotazione Semantica, Digitalizzazione, Machine Learning

Ultimo aggiornamento: 08/06/2025