Multiword expressions we live by: a validated usage-based dataset from corpora of written Italian

Masini, Francesca; Silvia Micheli, M.; Zaninello, Andrea; Castagnoli, Sara; Nissim, Malvina

The paper describes the creation of a manually validated dataset of Italian multiword expressions, building on candidates automatically extracted from corpora of written Italian. The main features of the resource, such as POS-pattern and lemma distribution, are also discussed, together with possible applications.

Multiword expressions we live by: a validated usage-based dataset from corpora of written Italian

Francesca Masini;M. Silvia Micheli;Andrea Zaninello;Sara Castagnoli;Malvina Nissim

2020

Abstract

The paper describes the creation of a manually validated dataset of Italian multiword expressions, building on candidates automatically extracted from corpora of written Italian. The main features of the resource, such as POS-pattern and lemma distribution, are also discussed, together with possible applications.

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno
	
			2020
		
	Titolo del volume
	
			Proceedings of the Seventh Italian Conference on Computational Linguistics
		
	Pagina iniziale
	
			1
		
	Pagina finale
	
			5
		
	Collana/Serie
	
			CEUR WORKSHOP PROCEEDINGS
		
	Tutti gli autori
	
			Francesca Masini, M. Silvia Micheli, Andrea Zaninello, Sara Castagnoli, Malvina Nissim
		
	Appare nelle tipologie:
	
			4.01 Contributo in Atti di convegno

File in questo prodotto:

File	Dimensione	Formato
Masini_et_al_2020_MWEs_we_live_by_CLIC.pdf accesso aperto Descrizione: Articolo completo Tipo: Versione (PDF) editoriale Licenza: Creative commons Dimensione 235.42 kB Formato Adobe PDF Visualizza/Apri	235.42 kB	Adobe PDF	Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11585/802257

Citazioni

ND

0

ND

CRIS Current Research Information System

Multiword expressions we live by: a validated usage-based dataset from corpora of written Italian

Francesca Masini;M. Silvia Micheli;Andrea Zaninello;Sara Castagnoli;Malvina Nissim

2020

Abstract

Scheda breve

Scheda completa

Scheda completa (DC)

Citazioni

social impact

CRIS Current Research Information System

Multiword expressions we live by: a validated usage-based dataset from corpora of written Italian

Francesca Masini;M. Silvia Micheli;Andrea Zaninello;Sara Castagnoli;Malvina Nissim

2020

Abstract

Scheda breve Scheda completa Scheda completa (DC)

Informazioni

Citazioni

social impact

Conferma cancellazione

Scheda breve

Scheda completa

Scheda completa (DC)