Consiglio Nazionale delle Ricerche

Tipo di prodottoContributo in atti di convegno
TitoloA MWE Acquisition and Lexicon Builder Web Service
Anno di pubblicazione2012
FormatoElettronico
Autore/iQuochi, Valeria; Frontini, Francesca; Rubino, Francesco
Affiliazioni autoriCNR-ILC, Pisa
Autori CNR e affiliazioni
  • FRANCESCA FRONTINI
  • FRANCESCO RUBINO
  • VALERIA QUOCHI
Lingua/e
  • inglese
AbstractThis paper describes the development of a web-service tool for the automatic extraction of Multi-word expressions lexicons, which has been integrated in a distributed platform for the automatic creation of linguistic resources. The main purpose of the work described is thus to provide a (computationally "light") tool that produces a full lexical resource: multi-word terms/items with relevant and useful attached information that can be used for more complex processing tasks and applications (e.g. parsing, MT, IE, query expansion, etc.). The output of our tool is a MW lexicon formatted and encoded in XML according to the Lexical Mark-up Framework. The tool is already functional and available as a service. Evaluation experiments show that the tool precision is of about 80%.
Lingua abstractinglese
Altro abstract-
Lingua altro abstract-
Pagine da2291
Pagine a2306
Pagine totali16
Rivista-
Numero volume della rivista-
Serie/Collana-
Titolo del volumeProceedings of COLING 2012: Technical Papers
Numero volume della serie/collana-
Curatore/i del volumeMartin Kay and Christian Boitet
ISBN9781627483896
DOI-
Editore
  • Curran Associates, Red Hook, NY 12571 (Stati Uniti d'America)
Verificato da refereeSì: Internazionale
Stato della pubblicazionePublished version
Indicizzazione (in banche dati controllate)-
Parole chiaveMultiword extraction, lexical resources, LMF, web services.
Link (URL, URI)http://aclweb.org/anthology/C/C12/C12-1140.pdf
Titolo convegno/congressoInternational Conference on Computational Linguistics (COLING)
Luogo convegno/congressoMumbai, India
Data/e convegno/congressoDecember 2012
RilevanzaInternazionale
RelazioneContributo
Titolo parallelo-
Note/Altre informazioniID_PUMA: /cnr.ilc/2012-A3-007
Strutture CNR
  • ILC — Istituto di linguistica computazionale "Antonio Zampolli"
Moduli/Attività/Sottoprogetti CNR
  • IC.P02.005.001 : Risorse e Tecnologie Linguistiche: modelli, metodi di sviluppo, applicazioni, disegno di strategie internazionali
Progetti Europei
Allegati
A MWE Acquisition and Lexicon Builder Web Service (documento privato )
Tipo documento: application/pdf