Le tematiche relative all'analisi della lingua parlata in una situazione comunicativa autentica costituiscono un punto cruciale sia nell'ambito dell'analisi linguistica sia nell'ambito di quelle discipline che si occupano della progettazione e della costruzione di strumenti tecnologici che trattano tali informazioni. L'integrazione di questi differenti aspetti d'indagine ha ricevuto un interesse preminente negli ultimi anni e sembra essere un punto di vista privilegiato per l'analisi dei fenomeni che coinvolgono i vari aspetti della lingua parlata. Lo studio del parlato ha storicamente intessuto rapporti molto stretti con le tecnologie, da un punto di vista sia metodologico sia applicativo, per la natura stessa delle analisi compiute sugli oggetti dello studio e per la complessità dei fenomeni che sono coinvolti in analisi linguistiche di questo tipo. Il presente contributo si inserisce in questa prospettiva di indagine, sia linguistica che modellistico-tecnologica, e presenterà uno studio che si inserisce nel filone delle indagini nell'ambito dei fenomeni prosodici e della loro identificazione con metodi automatici, proponendosi di esplorare le complesse relazioni che intercorrono, a diversi livelli, tra il fenomeno percettivo della prominenza prosodica e i fenomeni di tipo acustico che possono essere desunti dalla componente fonetico/acustica degli enunciati. La prominenza risulta essere uno dei fenomeni prosodici maggiormente interessanti e anche uno di quelli più studiati, proprio per l'importanza che riveste nell'ambito dei processi comunicativi umani. Nonostante la notevole quantità di studi nel settore, il problema di un’accurata identificazione del fenomeno con metodi automatici risulta ancora di notevole interesse a causa della complessità dei fenomeni coinvolti e della mancanza di adeguati strumenti di indagine che consentano un'elaborazione il più possibile automatica di queste informazioni. Nonostante i grandi sviluppi tecnologici ai quali abbiamo assistito in questi anni restano ancora numerosi problemi da affrontare di rilevanza cruciale, sia scientifica che tecnologica, per gestire correttamente i fatti prosodici della lingua parlata. Questo lavoro, fortemente basato su informazioni di tipo fonetico/acustico, tenta di costruire, visti anche i lavori sviluppati finora in questa direzione, un modello che consenta l'identificazione della prominenza, permettendo la creazione di sistemi automatici di etichettatura del fenomeno. Si è ritenuto opportuno che tale indagine utilizzasse come uniche informazioni i parametri derivabili direttamente, anche se in modo estremamente articolato, dall'espressione sonora dell'enunciato. Il modello proposto e l'algoritmo che implementerà il riconoscimento della prominenza non si basano quindi su fonti di informazioni alternative, quali trascrizioni degli enunciati, sia ortografiche che fonetiche, risorse linguistiche etichettate dal punto di vista fonetico, fonologico, prosodico, e nemmeno risorse che contengono informazioni di tipo segmentale sugli enunciati. L'unica informazione fornita all'algoritmo di annotazione è la digitalizzazione dell'enunciato (waveform). Numerosi studi indicano che il fenomeno percettivo della prominenza frasale è supportato, dal punto di vista prosodico, da due fenomeni: il pitch accent e lo stress. Dal punto di vista fonetico/acustico i pitch accent risultano essere connessi con movimenti nel profilo della frequenza fondamentale (F0) e con l’energia globale all’interno del nucleo sillabico, mentre lo stress, inteso come l’indebolimento o il rinforzo degli stress lessicali a livello di frase, presenta una forte correlazione con la durata temporale del nucleo sillabico e la quantità di energia in specifiche bande di frequenza (spectral emphasis). Con questo lavoro intendiamo mostrare come con un’attenta misurazione di questi parametri e l’identificazione di opportune relazioni tra essi e i fenomeni p...
Tamburini F. (2009). Prominenza frasale e tipologia prosodica: un approccio acustico. ROMA : Bulzoni.
Prominenza frasale e tipologia prosodica: un approccio acustico
TAMBURINI, FABIO
2009
Abstract
Le tematiche relative all'analisi della lingua parlata in una situazione comunicativa autentica costituiscono un punto cruciale sia nell'ambito dell'analisi linguistica sia nell'ambito di quelle discipline che si occupano della progettazione e della costruzione di strumenti tecnologici che trattano tali informazioni. L'integrazione di questi differenti aspetti d'indagine ha ricevuto un interesse preminente negli ultimi anni e sembra essere un punto di vista privilegiato per l'analisi dei fenomeni che coinvolgono i vari aspetti della lingua parlata. Lo studio del parlato ha storicamente intessuto rapporti molto stretti con le tecnologie, da un punto di vista sia metodologico sia applicativo, per la natura stessa delle analisi compiute sugli oggetti dello studio e per la complessità dei fenomeni che sono coinvolti in analisi linguistiche di questo tipo. Il presente contributo si inserisce in questa prospettiva di indagine, sia linguistica che modellistico-tecnologica, e presenterà uno studio che si inserisce nel filone delle indagini nell'ambito dei fenomeni prosodici e della loro identificazione con metodi automatici, proponendosi di esplorare le complesse relazioni che intercorrono, a diversi livelli, tra il fenomeno percettivo della prominenza prosodica e i fenomeni di tipo acustico che possono essere desunti dalla componente fonetico/acustica degli enunciati. La prominenza risulta essere uno dei fenomeni prosodici maggiormente interessanti e anche uno di quelli più studiati, proprio per l'importanza che riveste nell'ambito dei processi comunicativi umani. Nonostante la notevole quantità di studi nel settore, il problema di un’accurata identificazione del fenomeno con metodi automatici risulta ancora di notevole interesse a causa della complessità dei fenomeni coinvolti e della mancanza di adeguati strumenti di indagine che consentano un'elaborazione il più possibile automatica di queste informazioni. Nonostante i grandi sviluppi tecnologici ai quali abbiamo assistito in questi anni restano ancora numerosi problemi da affrontare di rilevanza cruciale, sia scientifica che tecnologica, per gestire correttamente i fatti prosodici della lingua parlata. Questo lavoro, fortemente basato su informazioni di tipo fonetico/acustico, tenta di costruire, visti anche i lavori sviluppati finora in questa direzione, un modello che consenta l'identificazione della prominenza, permettendo la creazione di sistemi automatici di etichettatura del fenomeno. Si è ritenuto opportuno che tale indagine utilizzasse come uniche informazioni i parametri derivabili direttamente, anche se in modo estremamente articolato, dall'espressione sonora dell'enunciato. Il modello proposto e l'algoritmo che implementerà il riconoscimento della prominenza non si basano quindi su fonti di informazioni alternative, quali trascrizioni degli enunciati, sia ortografiche che fonetiche, risorse linguistiche etichettate dal punto di vista fonetico, fonologico, prosodico, e nemmeno risorse che contengono informazioni di tipo segmentale sugli enunciati. L'unica informazione fornita all'algoritmo di annotazione è la digitalizzazione dell'enunciato (waveform). Numerosi studi indicano che il fenomeno percettivo della prominenza frasale è supportato, dal punto di vista prosodico, da due fenomeni: il pitch accent e lo stress. Dal punto di vista fonetico/acustico i pitch accent risultano essere connessi con movimenti nel profilo della frequenza fondamentale (F0) e con l’energia globale all’interno del nucleo sillabico, mentre lo stress, inteso come l’indebolimento o il rinforzo degli stress lessicali a livello di frase, presenta una forte correlazione con la durata temporale del nucleo sillabico e la quantità di energia in specifiche bande di frequenza (spectral emphasis). Con questo lavoro intendiamo mostrare come con un’attenta misurazione di questi parametri e l’identificazione di opportune relazioni tra essi e i fenomeni p...I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.