Il progetto “Lessico e regole di formazione di parola: un approccio tipologico e computazionale” si propone di raccogliere e realizzare un database di parole morfologicamente complesse in alcune lingue romanze (inizialmente italiano, catalano e francese) a partire da repertori lessicali (dizionari di neologismi, etc.) e da corpora esistenti, di lingua scritta o di lingua parlata (es. il LIP o CORIS/CODIS per l’italiano, FranText o Lexique per il francese). Particolare attenzione sarà rivolta alle parole morfologicamente complesse non lessicalizzate o non incluse in dizionari generalisti. La seconda tappa del progetto consisterà ad elaborare strumenti automatici per la generazione di parole virtuali (ad esempio incrociando le basi e gli affissi ottenuti da un dizionario di neologismi), ed a verificare la loro attestazione sul Web. La collaborazione con linguisti computazionali, in particolare del laboratorio CLLE-ERSS (N. Hathout, B. Calderone) e dell’unità bolognese (F. Tamburini e M. Nissim), sarà in questo caso indispensabile. Si prevede, inoltre, una fase di messa a disposizione del data base in questione attraverso un sito Web. Per quanto attiene la dimensione tipologica e interlinguistica, il confronto tra italiano, francese e catalano, da una parte, e cinese, dall’altra, si concretizzerà essenzialmente nell’analisi comparativa dei processi formali posti in atto in lingue con componenti morfologici di diversa caratterizzazione per esprimere le medesime relazioni semantiche. Il progetto è preliminare alla realizzazione di una risorsa lessicografica (dizionario cartaceo o elettronico) sulla formazione delle parole, in particolare derivazione, nelle lingue romanze. A differenza dei dizionari tradizionali, l’opera in questione dovrebbe essere basata su solide premesse teoriche e sull’interattività con i corpora disponibili. Per la realizzazione del progetto si prevede l’organizzazione di due riunioni scientifiche, nella primavera e nell’autunno del 2010. La prima avrà luogo all’università di Bologna e la seconda a quella di Toulouse le Mirail. In aggiunta alle riunioni in questione, sono previste permanenze più lunghe (da una a due settimane) di studenti dei corsi specialistici e magistrali, dottorandi e post-dottorandi in entrambe le sedi, allo scopo a) di prendere dimestichezza con le risorse e le metodologie di raccolta e organizzazione dei dati esistenti a Bologna e Tolosa; b) completare la propria formazione e impostare un programma di ricerca che potrebbe essere inserito come parte del progetto più globale.
Grandi N. (2010). Lessico e regole di formazione di parola: un approccio tipologico e computazionale / Lexique et règles de formation de mots: une approche typologique et computationnelle.
Lessico e regole di formazione di parola: un approccio tipologico e computazionale / Lexique et règles de formation de mots: une approche typologique et computationnelle
GRANDI, NICOLA
2010
Abstract
Il progetto “Lessico e regole di formazione di parola: un approccio tipologico e computazionale” si propone di raccogliere e realizzare un database di parole morfologicamente complesse in alcune lingue romanze (inizialmente italiano, catalano e francese) a partire da repertori lessicali (dizionari di neologismi, etc.) e da corpora esistenti, di lingua scritta o di lingua parlata (es. il LIP o CORIS/CODIS per l’italiano, FranText o Lexique per il francese). Particolare attenzione sarà rivolta alle parole morfologicamente complesse non lessicalizzate o non incluse in dizionari generalisti. La seconda tappa del progetto consisterà ad elaborare strumenti automatici per la generazione di parole virtuali (ad esempio incrociando le basi e gli affissi ottenuti da un dizionario di neologismi), ed a verificare la loro attestazione sul Web. La collaborazione con linguisti computazionali, in particolare del laboratorio CLLE-ERSS (N. Hathout, B. Calderone) e dell’unità bolognese (F. Tamburini e M. Nissim), sarà in questo caso indispensabile. Si prevede, inoltre, una fase di messa a disposizione del data base in questione attraverso un sito Web. Per quanto attiene la dimensione tipologica e interlinguistica, il confronto tra italiano, francese e catalano, da una parte, e cinese, dall’altra, si concretizzerà essenzialmente nell’analisi comparativa dei processi formali posti in atto in lingue con componenti morfologici di diversa caratterizzazione per esprimere le medesime relazioni semantiche. Il progetto è preliminare alla realizzazione di una risorsa lessicografica (dizionario cartaceo o elettronico) sulla formazione delle parole, in particolare derivazione, nelle lingue romanze. A differenza dei dizionari tradizionali, l’opera in questione dovrebbe essere basata su solide premesse teoriche e sull’interattività con i corpora disponibili. Per la realizzazione del progetto si prevede l’organizzazione di due riunioni scientifiche, nella primavera e nell’autunno del 2010. La prima avrà luogo all’università di Bologna e la seconda a quella di Toulouse le Mirail. In aggiunta alle riunioni in questione, sono previste permanenze più lunghe (da una a due settimane) di studenti dei corsi specialistici e magistrali, dottorandi e post-dottorandi in entrambe le sedi, allo scopo a) di prendere dimestichezza con le risorse e le metodologie di raccolta e organizzazione dei dati esistenti a Bologna e Tolosa; b) completare la propria formazione e impostare un programma di ricerca che potrebbe essere inserito come parte del progetto più globale.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.