Consiglio Nazionale delle Ricerche

Tipo di prodottoArticolo in rivista
TitoloLexical-Semantic Tagging of an Italian Corpus
Anno di pubblicazione2001
Formato-
Autore/iCalzolari N., Corazzari O., Zampolli A.
Affiliazioni autoriCorazzari O. (CPR-Pisa) Zampolli A. (Università di Pisa e Direttore dell'ILC fino a Agosto 2003).
Autori CNR e affiliazioni
  • NICOLETTA ZAMORANI
Lingua/e-
AbstractSemantically tagged corpora are becoming an urgent need for training and evaluation within many applications. They are also the natural accompaniment of semantic lexicons, for which they constitute both a useful testbed to evaluate their adequacy and a repository of corpus examples for the attested senses. It is essential that sound criteria are defined for their construction and a specific methodology is set up for the treatment of various semantic phenomena. We present some observations and results concerning the lexical-semantic tagging of an Italian corpus within the framework of two projects: the ELSNET feasibility study, part of a preparatory phase started with Senseval/Romanseval, and an Italian National Project (TAL), where one of the components is the lexical-semantic annotation of larger quantities of texts for an Italian syntactic-semantic Treebank. The results of the ELSNET experiment have been of utmost importance for the definition of the technical guidelines for the lexical-semantic level of annotation of the Treebank.
Lingua abstract-
Altro abstract-
Lingua altro abstract-
Pagine da291
Pagine a304
Pagine totali-
RivistaLecture notes in computer science
Attiva dal 1973
Editore: Springer - Berlin
Paese di pubblicazione: Germania
Lingua: multilingue
ISSN: 0302-9743
Titolo chiave: Lecture notes in computer science
Titolo proprio: Lecture notes in computer science.
Titolo abbreviato: Lect. notes comput. sci.
Titoli alternativi:
  • Lecture notes in computer science. Lecture notes in artificial intelligence
  • Lecture notes in artificial intelligence
  • LNCS. Lecture notes in computer science (Print)
  • Lecture notes in computer science (Print)
  • Lecture notes in computer science. LNAI. Lecture notes in artificial intelligence
  • Lecture notes in computer science. Lecture notes in bioinformatics (Print)
  • Lecture notes in computer science. Journal subline
Numero volume della rivista2004
Fascicolo della rivista-
DOI-
Verificato da referee-
Stato della pubblicazione-
Indicizzazione (in banche dati controllate)-
Parole chiaveAnnotazione semantic, Corpus annotato, Treebank, Lessico semantico, Semantica
Link (URL, URI)-
Titolo parallelo-
Data di accettazione-
Note/Altre informazioniL’articolo è pubblicato in una rivista ISI, a grande diffusione internazionale e forte selettività. Gli esperimenti condotti costituiscono ricerca innovativa nel settore dell’annotazione semantica per l’approccio teorico relativo al lessico semantico sottostante e per i contributi originali su aspetti quali rappresentazione del senso, discriminazione fra sensi e loro granularità, utilizzo delle informazioni di tipo collocazionale, valutazione del grado di interdipendenza fra lessico e corpus. L’annotazione semantica è uno dei settori strategici del 6° Programma Quadro Europeo, essendo un requisito fondamentale per la gestione della ‘conoscenza’. Il lavoro presenta metodologie, criteri per l’annotazione che sono stati rilevanti per la definizione di standard di annotazione semantica, a livello nazionale e internazionale, usati poi per la creazione della ‘TreeBank’ dell’Italiano, con una annotazione multi-livello con caratteri di originalità rispetto ad altre treebank esistenti.
Strutture CNR
  • ILC — Istituto di linguistica computazionale "Antonio Zampolli"
Moduli/Attività/Sottoprogetti CNR
  • IC.P02.005.001 : Risorse e Tecnologie Linguistiche: modelli, metodi di sviluppo, applicazioni, disegno di strategie internazionali
Progetti Europei-
Allegati

Dati storici
I dati storici non sono modificabili, sono stati ereditati da altri sistemi (es. Gestione Istituti, PUMA, ...) e hanno solo valore storico.
Area disciplinareLanguage & Linguistics
Area valutazione CIVRScienze dell'Antichità, filologico-letterarie e storico-artistiche
Rivista ISILECTURE NOTES IN COMPUTER SCIENCE [00538S0]
NoteIn A. Gelbukh (ed.), Computational Linguistics and Intelligent Text Processing. Springer, Berlin. LNCS 2004. ISSN 0302-9743.
Descrizione sintetica del prodottoL’articolo presenta osservazioni teoriche, metodologie e risultati relativi all’annotazione semantica di un corpus Italiano, sviluppata nell’ambito di progetti Europei (ELSNET), internazionali (SENSEVAL), nazionali (TAL). L’annotazione si focalizza sulla parte predicato-argomenti della frase, la più critica per l’interpretazione semantica (aspetti applicativi) e per l’analisi della struttura semantica del verbo e delle relazioni fra livelli sintattico e semantico (aspetti teorici). Si esaminano aspetti problematici quali ‘multiwords’, nomi propri, usi metaforici. L’analisi della evidenza testuale fa identificare nuove possibilità nella rappresentazione dei sensi in un lessico computazionale (uno degli aspetti più critici per la lessicologia computazionale odierna). Si evidenzia un tema centrale di ricerca, di cui siamo stati promotori a livello internazionale, cioè la complementarietà fra lessico e corpus, due oggetti linguistici non separabili, fra i quali è necessaria una integrazione che dia vita a un nuovo tipo di risorsa che condivide aspetti dell’uno e dell’altro. Corpora annotati semanticamente sono un complemento naturale dei lessici semantici (quali ItalWordNet e SIMPLE, creati in progetti europei da noi coordinati), fornendo un testbed per la valutazione della loro adeguatezza, un deposito di informazioni sui sensi, e un componente essenziale per il ‘training’ e la valutazione di sistemi applicativi.