Alla SSLMIT sono in fase di elaborazione avanzata il POS-Tagging e la categorizzazione tematica del corpus de “la Repubblica”, ampio insieme di testi attualmente (1985-1992) di circa 130 milioni di parole ma che una volta completato (1993-2000) arriverà a 400 milioni di parole. La ricerca presentata nella comunicazione al XXII ICOS - Congresso Internazionale di Scienze Onomastiche (che sarà presa in considerazione per la pubblicazione negli Atti e di cui qui si segnala il Riassunto presentato per il Call for Papers e distribuito in volume all'inizio del Congresso) ha l'articolazione descritta di séguito: Sul corpus intenderemmo cercare i toponimi stranieri per verificarne la distribuzione quantitativa e – almeno parzialmente – qualitativa: oltre ad individuare il rapporto fra le occorrenze rispetto alle diverse aree geografiche, controllando anche eventuali mutamenti nel corso degli anni, vorremmo verificare se la strategia utilizzata per ‘trasferire’ il toponimo in italiano è di carattere totalmente (Magonza vs Mainz) o parzialmente (Nuova York vs New York) “acclimatante” oppure no (Bruxelles). Fra le possibili categorie vorremmo tener presente la dimensione cronologica, la dimensione tematica e/o il genere dell’articolo, e la sua strutturazione interna (distinguendo ad es. fra il titolo e l’apparato sottotitolo-occhiello da una parte ed il testo dall’altra, e nel testo fra l’inizio ed il testo vero e proprio). La ricerca si struttura in due parti: da un lato, ci poniamo il problema informatico di come si possano identificare semi-automaticamente i toponimi in un corpus; dall’altro, l’analisi dei dati estratti dovrebbe poter fornire indicazioni sulle recenti tendenze della lingua italiana.

I toponimi stranieri nella stampa italiana: una ricerca sul corpus della “Repubblica”

M. Mazzoleni;
2005

Abstract

Alla SSLMIT sono in fase di elaborazione avanzata il POS-Tagging e la categorizzazione tematica del corpus de “la Repubblica”, ampio insieme di testi attualmente (1985-1992) di circa 130 milioni di parole ma che una volta completato (1993-2000) arriverà a 400 milioni di parole. La ricerca presentata nella comunicazione al XXII ICOS - Congresso Internazionale di Scienze Onomastiche (che sarà presa in considerazione per la pubblicazione negli Atti e di cui qui si segnala il Riassunto presentato per il Call for Papers e distribuito in volume all'inizio del Congresso) ha l'articolazione descritta di séguito: Sul corpus intenderemmo cercare i toponimi stranieri per verificarne la distribuzione quantitativa e – almeno parzialmente – qualitativa: oltre ad individuare il rapporto fra le occorrenze rispetto alle diverse aree geografiche, controllando anche eventuali mutamenti nel corso degli anni, vorremmo verificare se la strategia utilizzata per ‘trasferire’ il toponimo in italiano è di carattere totalmente (Magonza vs Mainz) o parzialmente (Nuova York vs New York) “acclimatante” oppure no (Bruxelles). Fra le possibili categorie vorremmo tener presente la dimensione cronologica, la dimensione tematica e/o il genere dell’articolo, e la sua strutturazione interna (distinguendo ad es. fra il titolo e l’apparato sottotitolo-occhiello da una parte ed il testo dall’altra, e nel testo fra l’inizio ed il testo vero e proprio). La ricerca si struttura in due parti: da un lato, ci poniamo il problema informatico di come si possano identificare semi-automaticamente i toponimi in un corpus; dall’altro, l’analisi dei dati estratti dovrebbe poter fornire indicazioni sulle recenti tendenze della lingua italiana.
2005
Riassunti/Abstracts/Zusammenfssungen/Résumés del XXII Congresso Internazionale di Scienze Onomastiche (Pisa, 28 agosto - 4 settembre 2005)
11
11
Mazzoleni, M.; Baroni, M.
File in questo prodotto:
Eventuali allegati, non sono esposti

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11585/6735
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact