Criteri di successo WCAG · Level A
WCAG 1.2.2: Sottotitoli (pre-registrati)
WCAG 1.2.2 richiede che tutti i contenuti audio preregistrati nei media sincronizzati (video con audio) includano sottotitoli accurati. Questo garantisce che le persone sorde e con problemi di udito possano accedere ai dialoghi parlati, agli effetti sonori e ad altre informazioni audio significative.
Cosa Significa Questa Regola
WCAG 1.2.2 — Didascalie (Pre-registrate) richiede che vengano fornite didascalie per tutti i contenuti audio preregistrati in media sincronizzati. I media sincronizzati sono definiti come contenuti audio o video sincronizzati con un altro formato e/o con componenti interattive basate sul tempo — in pratica, questo significa qualsiasi file video che contenga anche audio, come lezioni registrate, dimostrazioni di prodotto, clip di notizie, testimonianze o video di marketing.
Le didascalie sono un’alternativa testuale sincronizzata con la timeline del video. Devono trasmettere non solo il dialogo parlato ma anche qualsiasi altro audio significativo — inclusa l’identificazione del parlante, gli effetti sonori rilevanti (come [applausi], [porta che sbatte] o [musica]) e il tono o il modo di parlare quando influisce sulla comprensione. Questo distingue le didascalie dai sottotitoli, che in genere presentano solo le parole pronunciate e sono destinati a un pubblico che può sentire l’audio ma non comprende la lingua parlata.
Un superamento di questo criterio richiede tutti i seguenti elementi: esistono didascalie per tutti i media sincronizzati preregistrati, sono accuratamente sincronizzate con l’audio corrispondente, descrivono tutto l’audio significativo (dialogo, identità del parlante, effetti sonori rilevanti) e sono disponibili nello stesso punto in cui si trova il media stesso — non semplicemente collegate da una pagina separata.
Un fallimento si verifica quando: non vengono fornite affatto didascalie, le didascalie esistono ma sono inaccurate o incomplete (ad esempio, generate automaticamente senza correzione), le didascalie omettono audio significativo non verbale, le didascalie sono presenti ma non correttamente sincronizzate, oppure le didascalie sono fornite solo come trascrizione separata (una trascrizione da sola non soddisfa questo criterio).
L’unica eccezione ufficiale definita nelle WCAG riguarda i media che sono essi stessi un’alternativa multimediale al testo. Ad esempio, se una pagina web contiene un articolo scritto e un video che si limita a riproporre le stesse informazioni di quell’articolo, e il video è chiaramente etichettato come tale, allora non sono richieste didascalie per il video. Questa eccezione è ristretta e intenzionale — non dovrebbe essere usata come scappatoia per evitare di inserire didascalie in video che contengono contenuti sostanziali non disponibili altrimenti in forma testuale.
Le didascalie possono essere aperte (incorporate direttamente nel video e sempre visibili) o chiuse (fornite come traccia separata che gli utenti possono attivare o disattivare). Entrambe sono accettabili ai sensi di WCAG 1.2.2, sebbene le didascalie chiuse siano generalmente preferibili perché consentono agli utenti di personalizzarne l’aspetto e possono essere disattivate da chi non ne ha bisogno. In HTML, le didascalie chiuse sono in genere implementate usando l’elemento <track> con kind='captions' all’interno di un elemento <video>, che punta a un file di didascalie WebVTT o SRT.
Perché È Importante
Circa 466 milioni di persone nel mondo vivono con una perdita dell’udito disabilitante, secondo l’Organizzazione Mondiale della Sanità — una cifra che si prevede salirà a oltre 900 milioni entro il 2050. Oltre a coloro che hanno una sordità profonda, una popolazione molto più ampia sperimenta difficoltà uditive situazionali: persone in ambienti rumorosi come i trasporti pubblici, uffici open space o caffè affollati che non riescono a sentire l’audio anche con un udito funzionante, utenti che hanno temporaneamente perso l’accesso all’hardware audio e persone che guardano contenuti in contesti silenziosi in cui l’audio deve essere disattivato.
Per gli utenti sordi o con ipoacusia, le didascalie non sono una comodità — sono l’unico modo per accedere al contenuto parlato di un video. Senza didascalie, una persona sorda che visita un sito di e-commerce non può comprendere un video di dimostrazione del prodotto, una studentessa sorda non può seguire una lezione registrata e una paziente sorda non può assimilare le informazioni in un video informativo di un ospedale. Le informazioni sono completamente inaccessibili per loro, indipendentemente da quanto chiaramente il video sia girato o da quanto alta sia la qualità della produzione.
Le didascalie avvantaggiano anche persone con disabilità cognitive e dell’apprendimento, come chi ha disturbo da deficit di attenzione/iperattività o dislessia, che possono trovare più facile elaborare le informazioni quando sono presentate simultaneamente in forma audio e testuale. I non madrelingua ne beneficiano perché le didascalie rafforzano la comprensione di parlato con accento o a ritmo veloce. Anche gli utenti anziani con calo uditivo legato all’età — una condizione che colpisce circa un terzo delle persone oltre i 65 anni — fanno affidamento sulle didascalie.
Consideriamo uno scenario concreto: una banca turca pubblica un video sul proprio sito che spiega come aprire un conto digitale. Una potenziale cliente sorda visita il sito. Senza didascalie, non può comprendere nessuno dei passaggi spiegati a voce, non può seguire il processo ed è impossibilitata a completare l’operazione — creando sia un problema di accessibilità sia un’opportunità di business persa per la banca. Con didascalie accurate e sincronizzate, segue ogni passaggio, completa l’onboarding e diventa cliente.
Oltre all’accesso per le persone con disabilità, le didascalie comportano benefici misurabili in termini di SEO e usabilità. I file di didascalie in formato WebVTT o SRT sono leggibili dalle macchine, il che significa che i motori di ricerca possono indicizzare il testo completo del contenuto video, migliorandone la reperibilità. Studi hanno dimostrato che la maggioranza degli spettatori guarda i video sui social media senza audio, rendendo le didascalie di fatto una funzionalità di usabilità per il pubblico mainstream. Le didascalie rendono inoltre più facile per i motori di ricerca e gli strumenti di valutazione dell’accessibilità comprendere lo scopo e il contenuto dei video incorporati, contribuendo ai segnali complessivi di qualità della pagina.
Regole Axe-core Correlate
WCAG 1.2.2 richiede test manuali. Non esiste una regola axe-core automatizzata che rilevi in modo affidabile l’assenza o l’inesattezza delle didascalie per i media sincronizzati preregistrati. Le ragioni di ciò sono fondamentali per il modo in cui funziona il testing automatizzato:
- Test manuale richiesto — assenza di traccia di didascalie: Uno strumento automatizzato può rilevare che un elemento
<video>non ha un elemento<track kind='captions'>, e alcuni strumenti segnaleranno questo come potenziale problema. Tuttavia, lo strumento non può determinare se il video contiene effettivamente contenuti audio significativi (potrebbe essere un video muto), se sono presenti didascalie aperte (incorporate) nel video stesso o se il video rientra nell’eccezione di media-alternativa. È necessaria una revisione umana per prendere questa decisione. - Test manuale richiesto — accuratezza e completezza delle didascalie: Anche quando un file di traccia di didascalie è presente e collegato, uno strumento automatizzato non può valutare se le didascalie riflettono accuratamente ciò che viene detto, se includono effetti sonori rilevanti e identificazione del parlante o se sono correttamente sincronizzate con l’audio. Un file di didascalie contenente testo completamente errato, nonsense generato automaticamente o didascalie costantemente fuori sincrono di 10 secondi supererebbe il rilevamento automatizzato ma non soddisferebbe il criterio. Solo una persona che guarda il video leggendo le didascalie può valutarne l’accuratezza.
- Test manuale richiesto — didascalie aperte: Se le didascalie sono incorporate direttamente nel file video (didascalie aperte), gli strumenti automatizzati non hanno alcun modo di rilevarlo. Vedono solo un elemento
<video>senza traccia e non possono analizzare il contenuto visivo dei fotogrammi video per determinare se è presente del testo.
A causa di queste limitazioni, WCAG 1.2.2 deve sempre includere una fase di revisione umana come parte di qualsiasi audit completo. Le scansioni automatizzate fungono da primo passaggio utile per identificare elementi di traccia ovviamente mancanti, ma non possono sostituire la valutazione manuale della qualità, accuratezza e sincronizzazione delle didascalie.
Come Testare
- Inventariare tutti i media sincronizzati: Prima di eseguire qualsiasi strumento, esaminare manualmente la pagina per identificare ogni elemento video — tag
<video>incorporati, player incorporati tramite iframe (YouTube, Vimeo, terze parti) e qualsiasi player multimediale HTML5. Elencare ogni video e annotare se contiene audio significativo (dialogo, narrazione, effetti sonori importanti). I video senza traccia audio o con sola musica di sottofondo che non ha contenuto informativo possono essere trattati diversamente, ma documentare la motivazione. - Eseguire una scansione automatizzata con axe DevTools o Lighthouse: Aprire axe DevTools negli strumenti per sviluppatori del browser ed eseguire una scansione dell’intera pagina. Cercare eventuali violazioni o elementi incompleti relativi a elementi video o audio. Lighthouse (eseguito tramite Chrome DevTools nella categoria di audit Accessibilità) segnalerà in modo analogo i video privi di un elemento
<track>. Notare che un risultato automatico pulito non significa che il criterio sia soddisfatto — significa solo che non è stata rilevata alcuna traccia ovviamente mancante. Considerare i risultati automatizzati come punto di partenza, non come conclusione. - Ispezionare il sorgente HTML: Per ogni elemento
<video>sulla pagina, ispezionare il DOM per verificare se è presente un elemento<track kind='captions'>e se il suo attributosrcpunta a un file di didascalie valido e accessibile (WebVTT o SRT). Controllare che l’attributosrclangsia impostato sulla lingua appropriata. Confermare che il file venga caricato senza errori di rete aprendo direttamente l’URL nel browser. - Riprodurre il video e valutare manualmente le didascalie: Abilitare le didascalie nel player video (o confermare che compaiano automaticamente se si usano didascalie aperte). Guardare il video per intero — o un campione statisticamente rappresentativo tra inizio, metà e fine. Per ogni segmento, verificare: (a) il dialogo è trascritto accuratamente senza errori significativi, (b) i cambi di parlante sono identificati quando ciò aiuta la comprensione, (c) l’audio significativo non verbale è descritto tra parentesi (ad esempio, [telefono che squilla]) e (d) le didascalie compaiono e scompaiono in sincronia con l’audio — non significativamente in anticipo o in ritardo rispetto alle parole pronunciate.
- Testare con uno screen reader, ove pertinente: Utilizzando NVDA con Firefox, VoiceOver con Safari o JAWS con Chrome, navigare fino all’elemento video. Confermare che i controlli del player siano accessibili da tastiera e che l’attivazione e la disattivazione delle didascalie possano essere effettuate senza mouse. Questo testa l’usabilità della funzionalità di didascalie oltre alla sua esistenza.
- Testare i player incorporati di terze parti: Per gli iframe che incorporano player YouTube o Vimeo, aprire il video direttamente sulla piattaforma e verificare che le didascalie siano state caricate e siano abilitate per impostazione predefinita o facilmente attivabili. Le didascalie generate automaticamente su piattaforme come YouTube non soddisfano WCAG 1.2.2 a meno che non siano state revisionate e corrette per l’accuratezza.
- Documentare superamento/fallimento con prove: Per ogni video testato, registrare l’URL della pagina, il titolo o la descrizione del video, se le didascalie erano presenti e la valutazione della loro accuratezza. Screenshot o note con indicazione temporale della revisione fungono da prove di audit.
Come Correggere
Video HTML5 senza alcuna traccia di didascalie — Non corretto
<!-- Fails 1.2.2: video with audio has no caption track at all -->
<video controls width='800'>
<source src='product-demo.mp4' type='video/mp4'>
Your browser does not support the video element.
</video>
Video HTML5 senza alcuna traccia di didascalie — Corretto
<!-- Passes 1.2.2: a WebVTT caption track is linked with kind='captions' -->
<video controls width='800'>
<source src='product-demo.mp4' type='video/mp4'>
<!-- The track element links the WebVTT file; srclang and label aid player UI -->
<track
kind='captions'
src='product-demo-captions-en.vtt'
srclang='en'
label='English Captions'
default
>
Your browser does not support the video element.
</video>
Video multilingue con sola traccia di sottotitoli, senza didascalie — Non corretto
<!-- Fails 1.2.2: kind='subtitles' provides translated dialogue but omits -->
<!-- sound effect descriptions and speaker identification needed for deaf users -->
<video controls width='800'>
<source src='webinar.mp4' type='video/mp4'>
<track kind='subtitles' src='webinar-tr.vtt' srclang='tr' label='Turkish'>
</video>
Video multilingue con sola traccia di sottotitoli, senza didascalie — Corretto
<!-- Passes 1.2.2: a dedicated captions track is provided alongside subtitles. -->
<!-- The captions file includes [Speaker: Dr. Aydin], [applause], etc. -->
<video controls width='800'>
<source src='webinar.mp4' type='video/mp4'>
<track
kind='captions'
src='webinar-captions-tr.vtt'
srclang='tr'
label='Turkish Captions'
default
>
<track kind='subtitles' src='webinar-en.vtt' srclang='en' label='English'>
</video>
Embed YouTube che si affida a didascalie auto-generate non corrette — Non corretto
<!-- Fails 1.2.2: uncorrected auto-captions are not considered accurate captions -->
<iframe
width='800'
height='450'
src='https://www.youtube.com/embed/VIDEOID'
title='Company Introduction Video'
allowfullscreen
></iframe>
Embed YouTube con didascalie verificate e modificate da persone — Corretto
<!-- Passes 1.2.2 provided that captions have been uploaded or reviewed -->
<!-- in YouTube Studio and confirmed accurate by a human reviewer. -->
<!-- The &cc_load_policy=1 parameter enables captions by default. -->
<iframe
width='800'
height='450'
src='https://www.youtube.com/embed/VIDEOID?cc_load_policy=1&cc_lang_pref=tr'
title='Company Introduction Video'
allowfullscreen
></iframe>
<!-- Also ensure in YouTube Studio that the caption track is marked as -->
<!-- human-reviewed and that auto-captions have been corrected. -->
Errori Comuni
- Fornire una trascrizione testuale invece di didascalie sincronizzate: Una trascrizione che appare sotto o accanto a un video soddisfa WCAG 1.2.3 (Descrizione Audio o Alternativa Multimediale) in alcuni contesti, ma non soddisfa 1.2.2. Le didascalie devono essere sincronizzate con la timeline del video in modo che il testo compaia nel momento in cui si verifica l’audio corrispondente. Un blocco di testo statico non soddisfa questo requisito.
- Usare
kind='subtitles'invece dikind='captions': I sottotitoli sono progettati per spettatori che possono sentire l’audio ma non comprendono la lingua — in genere includono solo il dialogo parlato tradotto in un’altra lingua. Le didascalie sono progettate per spettatori che non possono sentire l’audio — devono includere l’identificazione del parlante, effetti sonori significativi e altre informazioni non verbali. Sostituire una traccia di sottotitoli dove è richiesta una traccia di didascalie è un errore comune e rilevante. - Fare affidamento su didascalie auto-generate non corrette da YouTube o piattaforme simili: Le didascalie generate automaticamente usano il riconoscimento vocale e producono frequentemente errori, soprattutto per terminologia tecnica, nomi propri, accenti o parlato veloce. WCAG richiede che le didascalie siano accurate. Le didascalie generate automaticamente che non sono state revisionate e corrette da una persona non soddisfano lo standard di accuratezza di 1.2.2.
- Includere un elemento
<track>ma puntare a un file VTT mancante o non funzionante: Se l’attributosrcdell’elemento track fa riferimento a un percorso file che restituisce un errore 404, le didascalie non verranno caricate, senza alcun avviso. L’HTML supera l’ispezione automatizzata, ma l’utente non riceve alcuna didascalia. Verificare sempre che l’URL del file di didascalie si risolva correttamente in produzione. - Omettere audio non verbale significativo dai file di didascalie: Un file di didascalie che trascrive solo le parole pronunciate ma ignora suoni importanti — come un allarme, un telefono che squilla, applausi o un tonfo centrale per la comprensione del video — non soddisfa il criterio. Le didascalie devono descrivere tutte le informazioni audio necessarie per comprendere il contenuto, non solo il dialogo.
- Didascalie significativamente fuori sincrono rispetto all’audio: Un file WebVTT con voci di timestamp errate può mostrare le didascalie secondi prima o dopo il parlato corrispondente. Questo compromette la comprensione e costituisce un fallimento, anche se il testo delle didascalie è accurato. Verificare sempre la sincronizzazione sull’intera durata del video, in particolare intorno ai cambi di scena e alle pause.
- Dare per scontato che l’eccezione di media-alternativa si applichi in modo ampio: Alcuni team presumono che, poiché hanno un articolo scritto che accompagna un video, il video rientri come alternativa multimediale e non necessiti di didascalie. L’eccezione si applica solo quando il video non aggiunge alcuna informazione oltre a quella già contenuta nel testo, la relazione è esplicita per gli utenti e il video è chiaramente etichettato come alternativa. Un video che aggiunge dimostrazioni, tono del parlante o informazioni visive non coperte nel testo non rientra nell’eccezione.
- Posizionare i controlli delle didascalie accessibili solo tramite mouse: Anche se le didascalie esistono, se il pulsante per attivarle in un player video personalizzato non è accessibile da tastiera — ad esempio, un
<div>stilizzato con un gestore onclick ma senzatabindex='0'o gestore di eventi da tastiera — gli utenti che si affidano alla navigazione da tastiera non possono attivare le didascalie. La funzionalità di didascalie deve essere azionabile tramite tastiera. - Non testare le didascalie in player incorporati o di terze parti: I team spesso testano il comportamento delle didascalie nel loro ambiente di sviluppo ma dimenticano che gli embed in produzione tramite player di terze parti (Vimeo, Wistia, JW Player) possono avere comportamenti diversi di caricamento delle didascalie, stati predefiniti o configurazioni API. Testare sempre l’esperienza delle didascalie nel contesto reale dell’embed in produzione.
- Fornire didascalie in una sola lingua quando il sito serve un pubblico multilingue: Sebbene WCAG non richieda strettamente didascalie in ogni lingua supportata da un sito, fornire didascalie solo in una lingua quando il sito e i contenuti video sono disponibili, ad esempio, in turco e inglese, significa che alcuni utenti ricevono contenuti accessibili mentre altri no. La prassi migliore è fornire tracce di didascalie corrispondenti a ciascuna versione linguistica del video.
Relazione con le Normative di Accessibilità della Turchia
La Circolare Presidenziale 2025/10 della Turchia, pubblicata nella Gazzetta Ufficiale n. 32933 il 21 giugno 2025, stabilisce obblighi vincolanti in materia di accessibilità web per un’ampia gamma di enti pubblici e privati che operano in Turchia. La circolare impone la conformità alle WCAG 2.2 al Livello A come base minima, con la conformità al Livello AA fortemente raccomandata. WCAG 1.2.2 — Didascalie (Pre-registrate) è un requisito di Livello A, il che significa che rientra tra gli obblighi più fondamentali previsti dalla circolare e la non conformità costituisce una violazione normativa diretta.
Gli enti coperti dalla circolare includono istituzioni pubbliche e organi di governo a tutti i livelli, piattaforme di e-commerce, banche e istituzioni finanziarie, ospedali e fornitori di servizi sanitari, operatori di telecomunicazioni con 200,000 o più abbonati, agenzie di viaggio autorizzate, società di trasporto private e scuole private autorizzate dal Ministero dell’Istruzione Nazionale (MoNE). Le istituzioni pubbliche sono tenute a raggiungere la conformità entro un anno dalla data di pubblicazione della circolare. I soggetti del settore privato rientranti nelle categorie coperte hanno una finestra di due anni per la conformità.
Per le organizzazioni in queste categorie, l’implicazione pratica di WCAG 1.2.2 è chiara: qualsiasi contenuto video pubblicato su un sito web o una piattaforma digitale che includa audio significativo deve essere corredato da didascalie accurate. Ciò è particolarmente rilevante per settori come quello bancario, in cui sono comuni video di spiegazione dei prodotti e di onboarding; quello sanitario, in cui i video di educazione del paziente sono frequentemente pubblicati online; e l’e-commerce, in cui i video dimostrativi dei prodotti sono centrali per l’esperienza di acquisto. Una banca che pubblichi un video tutorial senza didascalie su come usare il mobile banking, o un ospedale che pubblichi un video senza didascalie sulle istruzioni per la cura post-operatoria, sarebbe in violazione diretta dei requisiti di Livello A della circolare.
La circolare non stabilisce uno standard turco separato — fa riferimento direttamente ai criteri WCAG 2.2 riconosciuti a livello internazionale, il che significa che i team di conformità turchi dovrebbero seguire la specifica WCAG 1.2.2 così come definita dal W3C e descritta in questo articolo. Le organizzazioni dovrebbero documentare le proprie prassi relative alle didascalie, mantenere registri delle versioni dei file di didascalie insieme ai contenuti video e includere l’accuratezza delle didascalie come fase standard nel flusso di pubblicazione dei contenuti video. Gli audit di accessibilità condotti per finalità di conformità normativa devono includere una revisione manuale dell’accuratezza delle didascalie, poiché gli strumenti automatizzati da soli non sono sufficienti a dimostrare la conformità a questo criterio.
