Consiglio Nazionale delle Ricerche

Tipo di prodottoContributo in atti di convegno
TitoloAutomatic Incremental Term Acquisition from Domain Corpora
Anno di pubblicazione2005
FormatoCartaceo
Autore/iBartolini R., Giorgetti D., Lenci A., Montemagni S., Pirrelli V.
Affiliazioni autoriLenci A. (Università di Pisa).
Autori CNR e affiliazioni
  • VITO PIRRELLI
  • SIMONETTA MONTEMAGNI
  • ROBERTO BARTOLINI
Lingua/e
  • inglese
AbstractWe describe a technique for the acquisition of terms from Italian domain text corpora, which relies both on sophisticated linguistic analysis and on statistical measures applied to linguistically processed text rather than to raw text as it is usually the case. The main advantage of this technique is that minimal a priori knowledge of term structure is required, thus allowing to explore and discover terms in a given domain without imposing a strict pattern matching structure on them, and also to easily extend it to different domains. The approach we present in this paper is incremental as it may be iterated to discover terms of increasing complexity built on top of terms discovered in the previous iteration. The reason why it is convenient to adopt such an incremental approach is that it allows to "clean" data from noise in the first step, elicitating the constituent terms, and then to refine term acquisition on "skimmed" term data.
Lingua abstractinglese
Altro abstract-
Lingua altro abstract-
Pagine da293
Pagine a300
Pagine totali-
Rivista-
Numero volume della rivista-
Serie/Collana-
Titolo del volumeProceedings of TKE 2005 - 7th International Conference on Terminology and Knowledge Engineering
Numero volume della serie/collana-
Curatore/i del volume-
ISBN-
DOI-
Editore-
Verificato da refereeSì: Internazionale
Stato della pubblicazione-
Indicizzazione (in banche dati controllate)-
Parole chiave-
Link (URL, URI)-
Titolo convegno/congresso7th International conference on Terminology and Knowledge Engineering (TKE2005)
Luogo convegno/congressoCopenhagen
Data/e convegno/congresso-
RilevanzaInternazionale
RelazioneContributo
Titolo parallelo-
Note/Altre informazioni-
Strutture CNR
  • ILC — Istituto di linguistica computazionale "Antonio Zampolli"
Moduli CNR
    Progetti Europei-
    Allegati

      Dati storici
      I dati storici non sono modificabili, sono stati ereditati da altri sistemi (es. Gestione Istituti, PUMA, ...) e hanno solo valore storico.
      Area disciplinareLanguage & Linguistics
      NoteIn Proceedings della 7th International conference on Terminology and Knowledge Engineering (TKE2005), Copenhagen Business School, 17-18 August 2005, Copenhagen, Denmark.