Gli ultimi due decenni sono stati caratterizzati da un aumento esponenziale nelle interazioni web, che avvengono soprattutto attraverso l’utilizzo dei social media (SM), rendendo queste piattaforme fonti di dati quantitativamente e qualitativamente interessanti per ricerche linguistiche. Parallelamente, lo sviluppo di tecnologie e algoritmi per il processamento automatico del linguaggio naturale ha facilitato e velocizzato il processo di raccolta e analisi di dati linguistici dal web. Accanto alle piattaforme più diffuse e analizzate, quali Facebook, Instagram e Twitter, di recente l’attenzione è stata rivolta anche a TikTok, un social di video sharing di origine cinese che sta avendo ampio successo soprattutto tra i giovani (< 35 anni). Trattandosi di un social di nuova diffusione, tuttavia, a livello metodologico non esiste ancora una pipeline predefinita per estrarre i dati. Inoltre, la multimodalità dei contenuti che combinano testo, audio e video pone problemi per il processamento automatico, soprattutto in fase di trascrizione. L’obiettivo di questo lavoro è quello di presentare i principali elementi di criticità relativi all’estrazione di dati linguistici da TikTok, riscontrati nel corso di uno studio volto a raccogliere e analizzare contenuti associati ai disturbi del comportamento alimentare (DCA), che coinvolgono principalmente adolescenti e giovani, ossia la fascia di popolazione maggiormente attiva su questo social.

Donati, M., Vernillo, P. (2024). La linguistica dei corpora nell’era dei social media: Le nuove sfide poste da TikTok. Bologna : ASM Acta.

La linguistica dei corpora nell’era dei social media: Le nuove sfide poste da TikTok

Melissa Donati
Primo
;
Paola Vernillo
Secondo
2024

Abstract

Gli ultimi due decenni sono stati caratterizzati da un aumento esponenziale nelle interazioni web, che avvengono soprattutto attraverso l’utilizzo dei social media (SM), rendendo queste piattaforme fonti di dati quantitativamente e qualitativamente interessanti per ricerche linguistiche. Parallelamente, lo sviluppo di tecnologie e algoritmi per il processamento automatico del linguaggio naturale ha facilitato e velocizzato il processo di raccolta e analisi di dati linguistici dal web. Accanto alle piattaforme più diffuse e analizzate, quali Facebook, Instagram e Twitter, di recente l’attenzione è stata rivolta anche a TikTok, un social di video sharing di origine cinese che sta avendo ampio successo soprattutto tra i giovani (< 35 anni). Trattandosi di un social di nuova diffusione, tuttavia, a livello metodologico non esiste ancora una pipeline predefinita per estrarre i dati. Inoltre, la multimodalità dei contenuti che combinano testo, audio e video pone problemi per il processamento automatico, soprattutto in fase di trascrizione. L’obiettivo di questo lavoro è quello di presentare i principali elementi di criticità relativi all’estrazione di dati linguistici da TikTok, riscontrati nel corso di uno studio volto a raccogliere e analizzare contenuti associati ai disturbi del comportamento alimentare (DCA), che coinvolgono principalmente adolescenti e giovani, ossia la fascia di popolazione maggiormente attiva su questo social.
2024
CLUB WORKING PAPERS IN LINGUISTICS, Volume 8, 2024
73
86
Donati, M., Vernillo, P. (2024). La linguistica dei corpora nell’era dei social media: Le nuove sfide poste da TikTok. Bologna : ASM Acta.
Donati, Melissa; Vernillo, Paola
File in questo prodotto:
Eventuali allegati, non sono esposti

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11585/1012893
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact