CORISTagger è un programma per l’annotazione automatica di testi in lingua italiana rispetto alle categorie lessicali. E’ in grado di associare ad ogni termine contenuto nel testo la sua parte del discorso risolvendo le ambiguità con un livello di precisione estremamente elevato, anche grazie all’incorporazione di un analizzatore morfologico altamente sofisticato basato su un lemmario composto da circa 120.000 lemmi. L’annotatore ha ottenuto risultati eccellenti nella recente campagna di valutazione EVALITA2007 classificandosi tra i migliori sistemi per la lingua italiana e raggiungendo prestazioni allo stato dell'arte nel settore. Questo annotatore è stato utilizzato con successo per annotare il corpus CORIS/CODIS, corpus di riferimento per l'italiano contemporaneo. CORISTagger è il risultato di uno studio condotto dall'autore negli ultimi anni. I risultati sono già stati presentati a convegni e su rivista: * Tamburini F. (2000). Annotazione grammaticale e lemmatizzazione di corpora in italiano, Linguistica e informatica: multimedialita', corpora e percorsi di apprendimento, Rossini Favretti R. (a cura di), Bulzoni, Roma, 57-73. * Tamburini F. (2007). CORISTagger: a high-performance PoS tagger for Italian. Intelligenza Artificiale, IV(2), 14-15.

Tamburini F. (2008). CORISTagger (versione 1.0).

CORISTagger (versione 1.0)

TAMBURINI, FABIO
2008

Abstract

CORISTagger è un programma per l’annotazione automatica di testi in lingua italiana rispetto alle categorie lessicali. E’ in grado di associare ad ogni termine contenuto nel testo la sua parte del discorso risolvendo le ambiguità con un livello di precisione estremamente elevato, anche grazie all’incorporazione di un analizzatore morfologico altamente sofisticato basato su un lemmario composto da circa 120.000 lemmi. L’annotatore ha ottenuto risultati eccellenti nella recente campagna di valutazione EVALITA2007 classificandosi tra i migliori sistemi per la lingua italiana e raggiungendo prestazioni allo stato dell'arte nel settore. Questo annotatore è stato utilizzato con successo per annotare il corpus CORIS/CODIS, corpus di riferimento per l'italiano contemporaneo. CORISTagger è il risultato di uno studio condotto dall'autore negli ultimi anni. I risultati sono già stati presentati a convegni e su rivista: * Tamburini F. (2000). Annotazione grammaticale e lemmatizzazione di corpora in italiano, Linguistica e informatica: multimedialita', corpora e percorsi di apprendimento, Rossini Favretti R. (a cura di), Bulzoni, Roma, 57-73. * Tamburini F. (2007). CORISTagger: a high-performance PoS tagger for Italian. Intelligenza Artificiale, IV(2), 14-15.
2008
Tamburini F. (2008). CORISTagger (versione 1.0).
Tamburini F.
File in questo prodotto:
Eventuali allegati, non sono esposti

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11585/63030
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact