Il corpus è costituito da un numero non elevato (773 testi) di tesi e tesine, tutte non corrette dai docenti, che equivalgono però a un considerevole numero di parole (5.484.429). Si tratta della tipologia testuale decisamente la più rappresentativa della scrittura di studenti e studentesse dell'università. È possibile consultare tale corpus sia in modalità non bilanciata sia, con alcune ovvie riduzioni, in modalità bilanciata (in questo caso sono stati utilizzati gli stessi parametri adottati per il campionamento dei testi raccolti nel corpus Univers-ITA, cfr. https://corpora.ficlit.unibo.it/CUSP/crystal/index.html#dashboard?corpname=UniverS-Ita). Nel corpus sono disponibili diversi metadati: genere, regione di nascita e corso di laurea dello scrivente, anno di redazione, collocazione geografica dell’ateneo.
GRANDI N., BALLARÈ S., CHIUSAROLI F., GALLINA F., PASCOLI M., PISTOLESI E. (2023). UniverS-Ita-ProUniv [10.60760/unibo/univers-ita-prouniv].
UniverS-Ita-ProUniv
GRANDI N.;BALLARÈ S.;PASCOLI M.;
2023
Abstract
Il corpus è costituito da un numero non elevato (773 testi) di tesi e tesine, tutte non corrette dai docenti, che equivalgono però a un considerevole numero di parole (5.484.429). Si tratta della tipologia testuale decisamente la più rappresentativa della scrittura di studenti e studentesse dell'università. È possibile consultare tale corpus sia in modalità non bilanciata sia, con alcune ovvie riduzioni, in modalità bilanciata (in questo caso sono stati utilizzati gli stessi parametri adottati per il campionamento dei testi raccolti nel corpus Univers-ITA, cfr. https://corpora.ficlit.unibo.it/CUSP/crystal/index.html#dashboard?corpname=UniverS-Ita). Nel corpus sono disponibili diversi metadati: genere, regione di nascita e corso di laurea dello scrivente, anno di redazione, collocazione geografica dell’ateneo.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.