La banca dati del Tesoro della Lingua Italiana delle Origini (TLIO) è nata in funzione del Vocabolario ma, fin dal suo impianto, si è dimostrata uno strumento di ricerca autonomo e insostituibile per gli studi linguistici, letterari e filologici sulle varietà dall'antico italiano.
La sua ricchezza, il rigore della sua impostazione, la sua facile accessibilità, la rendono un imprescindibile punto di riferimento, e questo è confermato dal crescente numero di studiosi che se ne avvalgono (cfr. il link Citazioni alla pagina web dell'OVI [http://www.ovi.cnr.it]).
La banca dati del TLIO raccoglie la quasi totalità delle edizioni relative a testi scritti entro la fine del XIV secolo in qualsiasi varietà dell'antico sistema linguistico italiano. Questo significa che all'interno del corpus coesistono e si fondono (a discrezione dell'utente che può sempre impostare propri filtri di selezione del materiale) testi di ogni tipo, dimensione e provenienza.
È infatti possibile leggere e consultare insieme o separatamente testi letterari illustri, come la Divina Commedia e il Decameron, e documenti di ignoti privati quali Contratti, Note di spesa, Testamenti, Ricordi, ecc.; antiche iscrizioni di dimensioni ridottissime, come l'antichissima Iscrizione della catacomba di Commodilla di appena 6 parole, e dotti volgarizzamenti di testi letterari classici come i volgarizzamenti trecenteschi dell'"Ars amandi" e dei "Remedia amoris", o di testi pubblici come il Costituto del Comune di Siena; e ancora, numerosissimi testi toscani e veneti ma anche le più rare testimonianze di aree linguistiche periferiche e meno studiate.
La banca dati è però sempre in continua evoluzione quantitativa e qualitativa, e ogni sei mesi circa viene aggiornata e arricchita coi più recenti dati bibliografici e testuali forniti dagli studi più recenti.
Nuove datazioni, nuove attribuzioni, nuove e più affidabili edizioni, nuovi testi trovano tutti un'adeguata collocazione nell'archivio bibliografico collegato alla banca dati (vd. Bibliografia dei Testi Volgari accessibile dal nostro sito Internet), e nella banca dati stessa.
Nella sua versione più recente (2006) la banca dati del TLIO contiene 1960 testi, pari a 21.779.245 occorrenze (di cui 3.576.383 lemmatizzate in 116.597 lemmi), ed è consultabile sia in locale in GATTO (cfr. Focus su Gatto), sia online per sole forme grafiche in Philologic (nell'ambito della collaborazione Italnet), sia, sempre online, in GattoWEB anche per lemmi; in entrambe le versioni con accesso libero e gratuito (con registrazione per Italnet). Nella versione in GattoWEB è oggi interrogabile anche un corpus aggiuntivo di testi non ancora lemmatizzati, che contiene 122 testi per 269.880 occorrenze.
Focus