Multiword expressions we live by: a validated usage-based dataset from corpora of written Italian

Masini, Francesca; Silvia Micheli, M.; Zaninello, Andrea; Castagnoli, Sara; Nissim, Malvina

The paper describes the creation of a manually validated dataset of Italian multiword expressions, building on candidates automatically extracted from corpora of written Italian. The main features of the resource, such as POS-pattern and lemma distribution, are also discussed, together with possible applications.

Francesca Masini, M.S.M. (2020). Multiword expressions we live by: a validated usage-based dataset from corpora of written Italian. Aachen : CEUR Workshop Proceedings.

Multiword expressions we live by: a validated usage-based dataset from corpora of written Italian

Francesca Masini;M. Silvia Micheli;Andrea Zaninello;Sara Castagnoli;Malvina Nissim

2020

Abstract

The paper describes the creation of a manually validated dataset of Italian multiword expressions, building on candidates automatically extracted from corpora of written Italian. The main features of the resource, such as POS-pattern and lemma distribution, are also discussed, together with possible applications.

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno
	
				2020
			
	Titolo del volume
	
				Proceedings of the Seventh Italian Conference on Computational Linguistics
			
	Pagina iniziale
	
				1
			
	Pagina finale
	
				5
			
	Collana/Serie
	
				CEUR WORKSHOP PROCEEDINGS
			
	Citazione
	
				Francesca Masini, M.S.M. (2020). Multiword expressions we live by: a validated usage-based dataset from corpora of written Italian. Aachen : CEUR Workshop Proceedings.
			
	Tutti gli autori
	
						Francesca Masini, M. Silvia Micheli, Andrea Zaninello, Sara Castagnoli, Malvina Nissim
					
	Appare nelle tipologie:
	
				4.01 Contributo in Atti di convegno

File in questo prodotto:

File	Dimensione	Formato
Masini_et_al_2020_MWEs_we_live_by_CLIC.pdf accesso aperto Descrizione: Articolo completo Tipo: Versione (PDF) editoriale / Version Of Record Licenza: Creative commons Dimensione 235.42 kB Formato Adobe PDF Visualizza/Apri	235.42 kB	Adobe PDF	Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11585/802257

Citazioni

ND

0

ND

ND

CRIS Current Research Information System

Multiword expressions we live by: a validated usage-based dataset from corpora of written Italian

Francesca Masini;M. Silvia Micheli;Andrea Zaninello;Sara Castagnoli;Malvina Nissim

2020

Abstract

Scheda breve

Scheda completa

Scheda completa (DC)

Citazioni

social impact

CRIS Current Research Information System

Multiword expressions we live by: a validated usage-based dataset from corpora of written Italian

Francesca Masini;M. Silvia Micheli;Andrea Zaninello;Sara Castagnoli;Malvina Nissim

2020

Abstract

Scheda breve Scheda completa Scheda completa (DC)

Informazioni

Citazioni

social impact

Conferma cancellazione

Scheda breve

Scheda completa

Scheda completa (DC)