Questo articolo descrive la costruzione di una nuova risorsa per lo studio dell’italiano parlato, il corpus KIParla, che consiste in circa 70 ore di registrazione. Dopo una dettagliata discussione sui corpora esistenti e sui limiti che presentano, si offre una panoramica del corpus KIParla, evidenziandone gli elementi di novità e le potenzialità di sviluppo. L’attenzione ai metadati relativi ai parlanti e ai tipi di situazione comunicativa, la possibilità di effettuare ricerche sulla base di questi metadati, e l’allineamento della trascrizione con l’audio, rendono questo corpus uno strumento innovativo e funzionale a ricerche di vario tipo, incluse ricerche prosodiche e sociolinguistiche. La raccolta dati è estata effettuata nelle Università di Bologna e Torino, pertanto il corpus rappresenta essenzialmente l’italiano dei parlanti colti, limitando il più possibile la variazione diastratica. Sono invece ben rappresentate nel corpus la variazione diatopica e la variazione diafasica. La gamma di interazioni registrate include infatti scambi simmetrici e asimmetrici, formali e informali, con e senza mediatore, a tema libero e a tema vincolato. Inoltre, pur essendo solo due i punti di raccolta (Bologna e Torino), sono molte di più le varietà diatopiche presenti nel corpus, poiché le persone che ruotano intorno all’università provengono da tutta Italia, ed è stato possibile monitorare la provenienza geografica di tutti parlanti del corpus. Infine, la struttura trasparente e modulare del corpus si presta agilmente a un arricchimento incrementale, che includa vecchie e nuove raccolte di dati anche lungo gli assi di variazione ad oggi meno rappresentati.

Il corpus Kiparla. Una nuova risorsa per lo studio dell'italiano parlato

Caterina Mauri
;
Eugenio Goria
2018

Abstract

Questo articolo descrive la costruzione di una nuova risorsa per lo studio dell’italiano parlato, il corpus KIParla, che consiste in circa 70 ore di registrazione. Dopo una dettagliata discussione sui corpora esistenti e sui limiti che presentano, si offre una panoramica del corpus KIParla, evidenziandone gli elementi di novità e le potenzialità di sviluppo. L’attenzione ai metadati relativi ai parlanti e ai tipi di situazione comunicativa, la possibilità di effettuare ricerche sulla base di questi metadati, e l’allineamento della trascrizione con l’audio, rendono questo corpus uno strumento innovativo e funzionale a ricerche di vario tipo, incluse ricerche prosodiche e sociolinguistiche. La raccolta dati è estata effettuata nelle Università di Bologna e Torino, pertanto il corpus rappresenta essenzialmente l’italiano dei parlanti colti, limitando il più possibile la variazione diastratica. Sono invece ben rappresentate nel corpus la variazione diatopica e la variazione diafasica. La gamma di interazioni registrate include infatti scambi simmetrici e asimmetrici, formali e informali, con e senza mediatore, a tema libero e a tema vincolato. Inoltre, pur essendo solo due i punti di raccolta (Bologna e Torino), sono molte di più le varietà diatopiche presenti nel corpus, poiché le persone che ruotano intorno all’università provengono da tutta Italia, ed è stato possibile monitorare la provenienza geografica di tutti parlanti del corpus. Infine, la struttura trasparente e modulare del corpus si presta agilmente a un arricchimento incrementale, che includa vecchie e nuove raccolte di dati anche lungo gli assi di variazione ad oggi meno rappresentati.
2018
CLUB Working Papers in Linguistics VOL. 2
76
95
Caterina Mauri; Eugenio Goria
File in questo prodotto:
Eventuali allegati, non sono esposti

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11585/672102
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact