Nel presente contributo si illustra la sommarizzazione sperimentale delle sentenze tributarie condotta nell’ambito del progetto PRODIGIT. Dopo una breve introduzione sui concetti di sommarizzazione e massimazione, si presenta la metodologia adottata nel progetto, che include la sperimentazione e la valutazione comparativa di tecniche per la sommarizzazione estrattiva e astrattiva. Si descrivono quindi i risultati ottenuti con tali tecniche, soffermandosi sulla sommarizzazione astrattiva mediante modelli linguistici di ampie dimensioni (cd. “large language models”), la tecnica che ha dato i risultati migliori. Si presentano le diverse combinazioni di comandi sperimentate (prompt), e i relativi risultati. Dalla valutazione, da parte di esperti tributaristi, è emerso che i sommari più corretti e completi sono forniti dalla “sommarizzazione combinata”, che richiede la generazione autonoma dei diversi contenuti del sommario e la loro combinazione in un unico testo. Infine, si presenta l’uso dei sommari per funzioni di ricerca semantica.
Giuseppe Pisano, A.F. (2024). La sommarizzazione delle sentenze tributarie di merito nel progetto PRODIGIT. I-LEX, 17(1), 1-26.
La sommarizzazione delle sentenze tributarie di merito nel progetto PRODIGIT
Giuseppe Pisano;Alessia Fidelangeli;Federico Galli;Riccardo Rovatti;Piera Santin;Giovanni Sartor
2024
Abstract
Nel presente contributo si illustra la sommarizzazione sperimentale delle sentenze tributarie condotta nell’ambito del progetto PRODIGIT. Dopo una breve introduzione sui concetti di sommarizzazione e massimazione, si presenta la metodologia adottata nel progetto, che include la sperimentazione e la valutazione comparativa di tecniche per la sommarizzazione estrattiva e astrattiva. Si descrivono quindi i risultati ottenuti con tali tecniche, soffermandosi sulla sommarizzazione astrattiva mediante modelli linguistici di ampie dimensioni (cd. “large language models”), la tecnica che ha dato i risultati migliori. Si presentano le diverse combinazioni di comandi sperimentate (prompt), e i relativi risultati. Dalla valutazione, da parte di esperti tributaristi, è emerso che i sommari più corretti e completi sono forniti dalla “sommarizzazione combinata”, che richiede la generazione autonoma dei diversi contenuti del sommario e la loro combinazione in un unico testo. Infine, si presenta l’uso dei sommari per funzioni di ricerca semantica.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.