Banca dati

Corpus Paisà

Istituto

Istituto di linguistica computazionale "Antonio Zampolli" (ILC)

Referente

Vito Pirrelli
E-mail: vito.pirrelli@ilc.cnr.it

Descrizione

A large (250 million tokens) corpus of authentic Italian contemporary texts from the web, freely available and freely distributable, fully annotated in CoNNL format, and openly accessible and searchable through an advanced, learner-oriented interface (ILC-CNR carried out the linguistic annotation of texts).

Indirizzo internet

Url: http://www.corpusitaliano.it/preview/en/index.html

Modalità di accesso

On-line

Tipologia di dati

Textual corpus

Tipo database

Corpus