CRIS Current Research Information System

In this paper we discuss our participation to the 2013 Semeval Semantic Textual Similarity task. Our core features include (i) a set of metrics borrowed from automatic machine translation, originally intended to evaluate automatic against reference translations and (ii) an instance of explicit semantic analysis, built upon opening paragraphs of Wikipedia 2010 articles. Our similarity estimator relies on a support vector regressor with RBF kernel. Our best approach required 13 machine translation metrics + explicit semantic analysis and ranked 65 in the competition. Our post-competition analysis shows that the features have a good expression level, but overfitting and —mainly— normalization issues caused our correlation values to decrease.

Barron-Cedeno, A., Marquez, L., Fuentes, M., Rodriguez, H., Turmo, J. (2013). UPC-CORE: What Can Machine Translation Evaluation Metrics and Wikipedia Do for Estimating Semantic Textual Similarity?. Association for Computational Linguistics (ACL).

UPC-CORE: What Can Machine Translation Evaluation Metrics and Wikipedia Do for Estimating Semantic Textual Similarity?

Barron-Cedeno A.;Marquez L.;Fuentes M.;Rodriguez H.;Turmo J.

2013

Abstract

In this paper we discuss our participation to the 2013 Semeval Semantic Textual Similarity task. Our core features include (i) a set of metrics borrowed from automatic machine translation, originally intended to evaluate automatic against reference translations and (ii) an instance of explicit semantic analysis, built upon opening paragraphs of Wikipedia 2010 articles. Our similarity estimator relies on a support vector regressor with RBF kernel. Our best approach required 13 machine translation metrics + explicit semantic analysis and ranked 65 in the competition. Our post-competition analysis shows that the features have a good expression level, but overfitting and —mainly— normalization issues caused our correlation values to decrease.

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno
	
				2013
			
	Titolo del volume
	
				*SEM 2013 - 2nd Joint Conference on Lexical and Computational Semantics
			
	Pagina iniziale
	
				143
			
	Pagina finale
	
				147
			
	Citazione
	
				Barron-Cedeno, A., Marquez, L., Fuentes, M., Rodriguez, H., Turmo, J. (2013). UPC-CORE: What Can Machine Translation Evaluation Metrics and Wikipedia Do for Estimating Semantic Textual Similarity?. Association for Computational Linguistics (ACL).
			
	Tutti gli autori
	
						Barron-Cedeno, A.; Marquez, L.; Fuentes, M.; Rodriguez, H.; Turmo, J.
					
	Appare nelle tipologie:
	
				4.01 Contributo in Atti di convegno

File in questo prodotto:

Eventuali allegati, non sono esposti

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11585/709322

Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni

ND

5

ND

social impact