CoLFIS
Istituto
Istituto di scienze e tecnologie della cognizione (ISTC)
Referente
Cristina Burani
E-mail: cristina.burani@istc.cnr.it
Descrizione
CoLFIS è un nuovo repertorio lessicale, che consta delle seguenti parti: Il corpus, estratto da quotidiani, periodici e libri, consta di 3.150.075 ricorrenze lessicali. E' stato concepito con l'intento di approssimare il più esattamente possibile il quadro delle letture preferite degli Italiani, secondo i dati statistici ufficiali. Il lessico di frequenza include due sottoparti: formario e lemmario. Quest'ultimo disambigua le forme identiche (es., porti) riportandole ai diversi lemmi di provenienza (es., porti come forma plurale del sostantivo porto, oppure seconda persona singolare dell'indicativo del verbo portare) ed inoltre tratta come singole entrate lessicali le parole sintagmatiche (es., gamba del tavolo). Le liste lessicali sono attualmente disponibili per il download gratuito. Le liste sono organizzate secondo varie possibilità di ricerca: rango di frequenza, ordine alfabetico inverso, con / senza la distinzione tra caratteri minuscoli e maiuscoli, etc. Il corpus non è ancora disponibile, ma ci si propone di metterlo in linea appena possibile, compatibilmente con l'ottenimento delle autorizzazioni. Quest'opera è stata realizzata col finanziamento del CNR. Gli autori contano sulla collaborazione degli utenti per allargare e migliorare il servizio offerto.
Indirizzo internet
Url: http://www.istc.cnr.it/grouppage/colfis
Modalità di accesso
free
Tipologia di dati
Corpus, Formario e Lemmario di frequenza
Tipo database
Database lessicale disponibile in diversi formati
Note
Pier Marco Bertinetto, Cristina Burani, Alessandro Laudanna, Lucia Marconi, Daniela Ratti, Claudia Rolando, & Anna Maria Thornton. (2005). Corpus e Lessico di frequenza dell'italiano scritto (CoLFIS). [lexical database].