L’obiettivo del progetto DiaCORIS, finanziato nell’ambito del’iniziativa ministeriale FIRB2001 e svolto in collaborazione con studiosi dell'Accademia della Crusca, ha riguardato la costruzione di un corpus diacronico e rappresentativo dell’italiano scritto più ampio rispetto a quelli esistenti, in grado di coprire un esteso arco temporale (dal 1861 al 1945) e concepito per essere fruibile anche in congiunzione al corpus sincronico CORIS/CODIS. La costruzione del corpus diacronico di italiano scritto ha richiesto: a) una fase di indagine storica per l’identificazione e la scelta dei materiali da inserire nel corpus; b) una fase di progettazione del corpus nel rispetto della rappresentatività delle varie tipologie testuali; c) una fase di raccolta, digitalizzazione e predisposizione dei documenti in formato elettronico. Sulla base del quadro d’articolazione del corpus (1861-1898 “Dopo l’unità”, 1899-1922 “L’età liberale”, 1923-1945 “Il fascismo”, ciascuno articolato nelle sezioni Stampa, Narrativa, Saggistica, Prosa giuridica, Miscellanea) l’intero corpus è stato completamente digitalizzato per un totale di 15 milioni di parole e sono stati inseriti i metadati necessari a una corretta caratterizzazione e individuazione dei documenti (autore, titolo, editore, genere, ecc.) in formato XML; il corpus è già da tempo accessibile in rete tramite l’utilizzazione di una complessa architettura di information retrieval. DiaCORIS è il risultato di uno studio condotto dagli autori negli ultimi anni. I risultati sono già stati presentati in: * Onelli C., Proietti D., Seidenari C., Tamburini F. (2006), “The DiaCORIS project: a diachronic corpus of written Italian”, 5th Conference on Language Resources and Evaluation – LREC2006, 24-26 maggio 2006, Genova. * Proietti, D. (2006), "Lunga durata e/o breve corso nella diacronia dei connettivi testuali", presentazione orale al convegno "Lessico, grammatica e testualità", 17-18 febbraio, Basilea, Svizzera.
Rossini R., Tamburini F., Sabatini F., Proietti D. (2009). DiaCORIS.
DiaCORIS
ROSSINI, REMA;TAMBURINI, FABIO;
2009
Abstract
L’obiettivo del progetto DiaCORIS, finanziato nell’ambito del’iniziativa ministeriale FIRB2001 e svolto in collaborazione con studiosi dell'Accademia della Crusca, ha riguardato la costruzione di un corpus diacronico e rappresentativo dell’italiano scritto più ampio rispetto a quelli esistenti, in grado di coprire un esteso arco temporale (dal 1861 al 1945) e concepito per essere fruibile anche in congiunzione al corpus sincronico CORIS/CODIS. La costruzione del corpus diacronico di italiano scritto ha richiesto: a) una fase di indagine storica per l’identificazione e la scelta dei materiali da inserire nel corpus; b) una fase di progettazione del corpus nel rispetto della rappresentatività delle varie tipologie testuali; c) una fase di raccolta, digitalizzazione e predisposizione dei documenti in formato elettronico. Sulla base del quadro d’articolazione del corpus (1861-1898 “Dopo l’unità”, 1899-1922 “L’età liberale”, 1923-1945 “Il fascismo”, ciascuno articolato nelle sezioni Stampa, Narrativa, Saggistica, Prosa giuridica, Miscellanea) l’intero corpus è stato completamente digitalizzato per un totale di 15 milioni di parole e sono stati inseriti i metadati necessari a una corretta caratterizzazione e individuazione dei documenti (autore, titolo, editore, genere, ecc.) in formato XML; il corpus è già da tempo accessibile in rete tramite l’utilizzazione di una complessa architettura di information retrieval. DiaCORIS è il risultato di uno studio condotto dagli autori negli ultimi anni. I risultati sono già stati presentati in: * Onelli C., Proietti D., Seidenari C., Tamburini F. (2006), “The DiaCORIS project: a diachronic corpus of written Italian”, 5th Conference on Language Resources and Evaluation – LREC2006, 24-26 maggio 2006, Genova. * Proietti, D. (2006), "Lunga durata e/o breve corso nella diacronia dei connettivi testuali", presentazione orale al convegno "Lessico, grammatica e testualità", 17-18 febbraio, Basilea, Svizzera.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.