Un corpus di italiano scritto - CORIS/CODIS - è stato realizzato presso l'Università di Bologna ed è disponibile online da alcuni anni. Il progetto, elaborato e coordinato da R. Rossini Favretti, ha la finalità di costruire un corpus generale di riferimento dell'italiano scritto, ben dimensionato e rappresentativo, accessibile e di facile fruizione. Il CORIS contiene ad oggi (2008) 120 milioni di parole e viene aggiornato tramite un corpus di monitoraggio inglobato con cadenza triennale. E' costituito da una raccolta di testi, autentici e ricorrenti nell'uso, in formato elettronico, selezionati come rappresentativi dell'italiano attuale. Il progetto, al momento attuale, è il risultato di una ricerca svolta nell'ambito del'Università di Bologna. Ciò è stato reso possibile dallo sviluppo tecnologico, dal possibile riferimento ad esperienze precedenti e dal lungo periodo di preparazione che ha preceduto la fase progettuale e costitutiva. Prevede come destinatari e fruitori un ampio numero di persone che si collocano dagli studiosi dell'italiano come L1 o L2, agli studenti italiani e stranieri impegnati in un'analisi linguistica basata su dati autentici e, in una prospettiva più ampia, a tutti coloro che sono interessati ad un'analisi intralinguistica e/o interlinguistica. CODIS rappresenta una nuova articolazione di CORIS e permette una rimodulazione dinamica dei componenti testuali costitutivi del corpus in modo da poterlo adattare ad ogni necessità di comparazione interlinguistica. Il corpus e' liberamente accessibile in rete per scopi di ricerca, e, ad oggi, circa 200 studiosi italiani e stranieri utilizzano CORIS/CODIS nelle loro ricerche come fonte primaria di dati empirici sulla lingua italiana. CORIS/CODIS è il risultato di uno studio condotto dagli autori negli ultimi anni. I risultati sono già stati presentati in: * R. Rossini Favretti (2000). "Progettazione e costruzione di un corpus di italiano scritto: CORIS/CODIS", in R. Rossini Favretti (a cura di), Linguistica e informatica. Multimedialità, corpora e percorsi di apprendimento, Bulzoni, Roma pp. 39-56. * Rossini Favretti R., Tamburini F., De Santis C. (2002). CORIS/CODIS: A corpus of written Italian based on a defined and a dynamic model. In A Rainbow of Corpora: Corpus Linguistics and the Languages of the World, Wilson, A., Rayson, P. and McEnery, T. (eds.), Lincom-Europa, Munich. (2002), 27-38. * Tamburini F. (2002). A dynamic model for reference corpora structure definition. In Proc. Third International Conference on Language Resources and Evaluation - LREC2002, Las Palmas, Canary Islands, Spain, 1847-1850.

Rossini R., Tamburini F. (2008). CORIS/CODIS (versione 1.4).

CORIS/CODIS (versione 1.4)

ROSSINI, REMA;TAMBURINI, FABIO
2008

Abstract

Un corpus di italiano scritto - CORIS/CODIS - è stato realizzato presso l'Università di Bologna ed è disponibile online da alcuni anni. Il progetto, elaborato e coordinato da R. Rossini Favretti, ha la finalità di costruire un corpus generale di riferimento dell'italiano scritto, ben dimensionato e rappresentativo, accessibile e di facile fruizione. Il CORIS contiene ad oggi (2008) 120 milioni di parole e viene aggiornato tramite un corpus di monitoraggio inglobato con cadenza triennale. E' costituito da una raccolta di testi, autentici e ricorrenti nell'uso, in formato elettronico, selezionati come rappresentativi dell'italiano attuale. Il progetto, al momento attuale, è il risultato di una ricerca svolta nell'ambito del'Università di Bologna. Ciò è stato reso possibile dallo sviluppo tecnologico, dal possibile riferimento ad esperienze precedenti e dal lungo periodo di preparazione che ha preceduto la fase progettuale e costitutiva. Prevede come destinatari e fruitori un ampio numero di persone che si collocano dagli studiosi dell'italiano come L1 o L2, agli studenti italiani e stranieri impegnati in un'analisi linguistica basata su dati autentici e, in una prospettiva più ampia, a tutti coloro che sono interessati ad un'analisi intralinguistica e/o interlinguistica. CODIS rappresenta una nuova articolazione di CORIS e permette una rimodulazione dinamica dei componenti testuali costitutivi del corpus in modo da poterlo adattare ad ogni necessità di comparazione interlinguistica. Il corpus e' liberamente accessibile in rete per scopi di ricerca, e, ad oggi, circa 200 studiosi italiani e stranieri utilizzano CORIS/CODIS nelle loro ricerche come fonte primaria di dati empirici sulla lingua italiana. CORIS/CODIS è il risultato di uno studio condotto dagli autori negli ultimi anni. I risultati sono già stati presentati in: * R. Rossini Favretti (2000). "Progettazione e costruzione di un corpus di italiano scritto: CORIS/CODIS", in R. Rossini Favretti (a cura di), Linguistica e informatica. Multimedialità, corpora e percorsi di apprendimento, Bulzoni, Roma pp. 39-56. * Rossini Favretti R., Tamburini F., De Santis C. (2002). CORIS/CODIS: A corpus of written Italian based on a defined and a dynamic model. In A Rainbow of Corpora: Corpus Linguistics and the Languages of the World, Wilson, A., Rayson, P. and McEnery, T. (eds.), Lincom-Europa, Munich. (2002), 27-38. * Tamburini F. (2002). A dynamic model for reference corpora structure definition. In Proc. Third International Conference on Language Resources and Evaluation - LREC2002, Las Palmas, Canary Islands, Spain, 1847-1850.
2008
Rossini R., Tamburini F. (2008). CORIS/CODIS (versione 1.4).
Rossini R.; Tamburini F.
File in questo prodotto:
Eventuali allegati, non sono esposti

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11585/69006
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact