CRIS Current Research Information System

The persistent global STEM knowledge gap disproportionately affects the visually impaired, primarily due to inadequate or absent alt text. This study investigates whether Visual Language Models (VLMs) can bridge this accessibility divide by generating accurate alt text for complex STEM imagery. Using VLMs, we conducted a systematic evaluation against a curated dataset of 533 expert-annotated images from education ebooks. Our analysis reveals a clear dichotomy: VLMs perform well on straightforward visual content such as labeled chemistry diagrams but falter significantly with images requiring quantitative reasoning, including unlabeled charts and intricate 3D figures. These limitations highlight risks of misinformation when relying solely on automated descriptions for critical scientific visuals. These findings underscore the necessity of integrating human expertise with VLM efficiency to ensure accuracy and equity. This research proposes a hybrid intelligence approach combining rapid model output with expert validation as the only ethically sound solution to enhance STEM accessibility and foster inclusive knowledge dissemination.

Risi, M., Donati, N., Farneti, F., Occorso, M., Pio Volgarino, A., Romito, F. (2026). AI and Accessibility: Describing Graphs with Alternative Texts.

AI and Accessibility: Describing Graphs with Alternative Texts

Nicolò Donati^Co-primo;Francesco Farneti^Secondo;Manuel Occorso;Antonio Pio Volgarino;Francesco Romito

2026

Abstract

The persistent global STEM knowledge gap disproportionately affects the visually impaired, primarily due to inadequate or absent alt text. This study investigates whether Visual Language Models (VLMs) can bridge this accessibility divide by generating accurate alt text for complex STEM imagery. Using VLMs, we conducted a systematic evaluation against a curated dataset of 533 expert-annotated images from education ebooks. Our analysis reveals a clear dichotomy: VLMs perform well on straightforward visual content such as labeled chemistry diagrams but falter significantly with images requiring quantitative reasoning, including unlabeled charts and intricate 3D figures. These limitations highlight risks of misinformation when relying solely on automated descriptions for critical scientific visuals. These findings underscore the necessity of integrating human expertise with VLM efficiency to ensure accuracy and equity. This research proposes a hybrid intelligence approach combining rapid model output with expert validation as the only ethically sound solution to enhance STEM accessibility and foster inclusive knowledge dissemination.

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno
	
				2026
			
	Titolo del volume
	
				The Journal on Technology and Persons With Disabilities, Volume 14
			
	Pagina iniziale
	
				1
			
	Pagina finale
	
				48
			
	Rivista
	
				JOURNAL ON TECHNOLOGY AND PERSONS WITH DISABILITIES
			
	Citazione
	
				Risi, M., Donati, N., Farneti, F., Occorso, M., Pio Volgarino, A., Romito, F. (2026). AI and Accessibility: Describing Graphs with Alternative Texts.
			
	Tutti gli autori
	
						Risi, Milena; Donati, Nicolò; Farneti, Francesco; Occorso, Manuel; Pio Volgarino, Antonio; Romito, Francesco
					
	Appare nelle tipologie:
	
				4.01 Contributo in Atti di convegno

File in questo prodotto:

File	Dimensione	Formato
ID_25_AI_and_Accessibility_Describing_Graphs_with_Alternative_Texts_371-418.pdf accesso aperto Descrizione: Licenza https://creativecommons.org/licenses/by-nc-nd/4.0/ Tipo: Versione (PDF) editoriale / Version Of Record Licenza: Licenza per Accesso Aperto. Creative Commons Attribuzione - Non commerciale - Non opere derivate (CCBYNCND) Dimensione 2.87 MB Formato Adobe PDF Visualizza/Apri	2.87 MB	Adobe PDF	Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11585/1042103

Citazioni

ND

ND

ND

ND

social impact