Banca dati
Corpus Paisà
Istituto
Istituto di linguistica computazionale "Antonio Zampolli" (ILC)
Referente
Vito Pirrelli
E-mail: vito.pirrelli@ilc.cnr.it
Descrizione
A large (250 million tokens) corpus of authentic Italian contemporary texts from the web, freely available and freely distributable, fully annotated in CoNNL format, and openly accessible and searchable through an advanced, learner-oriented interface (ILC-CNR carried out the linguistic annotation of texts).
Indirizzo internet
Url: http://www.corpusitaliano.it/preview/en/index.html
Modalità di accesso
On-line
Tipologia di dati
Textual corpus
Tipo database
Corpus