Consiglio Nazionale delle Ricerche

Tipo di prodottoContributo in atti di convegno
TitoloThe PAISÀ Corpus of Italian Web Texts
Anno di pubblicazione2014
FormatoElettronico
Autore/iVerena Lyding, Egon Stemle, Claudia Borghetti, Marco Brunello, Sara Castagnoli, Felice Dell'Orletta, Henrik Dittmann, Alessandro Lenci, Vito Pirrelli
Affiliazioni autoriEURAC Research Bolzano, EURAC Research Bolzano, Università di Bologna, University of Leeds, Università di Bologna, ILC-CNR Pisa, Institut Jules Bordet, Università di Pisa, ILC-CNR Pisa
Autori CNR e affiliazioni
  • VITO PIRRELLI
  • FELICE DELL'ORLETTA
Lingua/e
  • inglese
AbstractPAIS`A is a Creative Commons licensed, large web corpus of contemporary Italian. We describe the design, harvesting, and processing steps involved in its creation.
Lingua abstractinglese
Altro abstract-
Lingua altro abstract-
Pagine da36
Pagine a43
Pagine totali8
Rivista-
Numero volume della rivista-
Serie/Collana-
Titolo del volumeProceedings of the 9th Web as Corpus Workshop (WaC-9)
Numero volume della serie/collana-
Curatore/i del volumeFelix Bildhauer, Roland Schäfer
ISBN-
DOI-
Editore
  • Association for Computational Linguistics, Stroudsburg (Stati Uniti d'America)
Verificato da refereeSì: Internazionale
Stato della pubblicazione-
Indicizzazione (in banche dati controllate)
  • ACL Anthology (Codice:W14-04)
Parole chiave-
Link (URL, URI)http://aclweb.org/anthology/W14-04
Titolo convegno/congressoCorpus annotation, Tree-bank, Corpus design, Corpus harvesting
Luogo convegno/congressoGothenburg. Sweden
Data/e convegno/congressoApril 26, 2014
RilevanzaInternazionale
RelazioneContributo
Titolo parallelo-
Note/Altre informazioni-
Strutture CNR
  • ILC — Istituto di linguistica computazionale "Antonio Zampolli"
Moduli CNR
    Progetti Europei-
    Allegati
    • The PAISÀ Corpus of Italian Web Texts
      Descrizione: versione pdf di contributo a convegno internazionale