Consiglio Nazionale delle Ricerche

Tipo di prodottoContributo in atti di convegno
TitoloUnsupervised Acquisition of Verb Subcategorization Frames from Shallow-Parsed Corpora
Anno di pubblicazione2008
Formato-
Autore/iLenci A.; McGillivray B.; Pirrelli V.; Montemagni S.
Affiliazioni autoriLenci Alessandro: Università di Pisa.
Autori CNR e affiliazioni
  • BARBARA MCGILLIVRAY
  • VITO PIRRELLI
  • SIMONETTA MONTEMAGNI
Lingua/e-
Abstract-
Lingua abstract-
Altro abstract-
Lingua altro abstract-
Pagine da-
Pagine a-
Pagine totali-
Rivista-
Numero volume della rivista-
Serie/Collana-
Titolo del volume-
Numero volume della serie/collana-
Curatore/i del volume-
ISBN-
DOI-
Editore-
Verificato da refereeSì: Internazionale
Stato della pubblicazione-
Indicizzazione (in banche dati controllate)-
Parole chiaveAcquisition, Machine Learning, Corpus (creation, annotation, etc.), Lexicon, Lexical database
Link (URL, URI)-
Titolo convegno/congressoLREC 2008, Sixth International Conference on Language Resources and Evaluation
Luogo convegno/congressoMarrakech, Marocco
Data/e convegno/congresso-
RilevanzaInternazionale
RelazioneContributo
Titolo parallelo-
Note/Altre informazioni-
Strutture CNR
  • ILC — Istituto di linguistica computazionale "Antonio Zampolli"
Moduli CNR
    Progetti Europei-
    Allegati

      Dati storici
      I dati storici non sono modificabili, sono stati ereditati da altri sistemi (es. Gestione Istituti, PUMA, ...) e hanno solo valore storico.
      Area disciplinareLanguage & Linguistics
      Area valutazione CIVRScienze dell'Antichità, filologico-letterarie e storico-artistiche
      NoteIn: LREC - LREC 2008, Sixth International Conference on Language Resources and Evaluation (Palais des Congrès Mansour Eddahbi, Marrakech, Maroc, 26 May - 1 June 2008). Proceedings, pp. 3000 - 3006. Nicoletta Calzolari (Conference Chair), Khalid Choukri, Bente Maegaard, Joseph Mariani, Jan Odjik, Stelios Piperidis, Daniel Tapias (eds.). European Language Resources Association (ELRA), 2008.
      Descrizione sintetica del prodottoABSTRACT: In this paper, we reported experiments of unsupervised automatic acquisition of Italian and English verb subcategorization frames (SCFs) from general and domain corpora. The proposed technique operates on syntactically shallow-parsed corpora on the basis of a limited number of search heuristics not relying on any previous lexico-syntactic knowledge about SCFs. Although preliminary, reported results are in line with state-of-the-art lexical acquisition systems. The issue of whether verbs sharing similar SCFs distributions happen to share similar semantic properties as well was also explored by clustering verbs that share frames with the same distribution using the Minimum Description Length Principle (MDL). First experiments in this direction were carried out on Italian verbs with encouraging results.