WCAG-succescriteria · Level A

WCAG 1.2.3: Audiobeschrijving of media-alternatief (vooraf opgenomen)

WCAG 1.2.3 vereist dat vooraf opgenomen gesynchroniseerde media (video met audio) ofwel een audiobeschrijving van de visuele inhoud of een volledige tekstalternatief biedt, zodat gebruikers die blind zijn of een beperkt gezichtsvermogen hebben toegang hebben tot informatie die visueel wordt overgebracht.

Wat Deze Regel Betekent

WCAG Succescriterium 1.2.3 behandelt een van de meest fundamentele barrières voor blinde en slechtziende gebruikers bij het consumeren van videocontent: het verlies van visuele informatie die nooit hardop wordt uitgesproken. Het criterium stelt dat voor alle vooraf opgenomen gesynchroniseerde media — dat wil zeggen, videocontent gekoppeld aan audio — webauteurs ofwel een audiobeschrijving van de visuele track moeten bieden, of een volledig media-alternatief in tekstvorm.

Een audiobeschrijving is een extra vertelstem die wordt toegevoegd aan de audiotrack van een video en belangrijke visuele details beschrijft die niet uit de hoofd-audio alleen kunnen worden begrepen. Deze beschrijvingen worden meestal ingevoegd tijdens natuurlijke pauzes in de dialoog, of de video kan kort worden gepauzeerd om de verteller tijd te geven complexe visuele gebeurtenissen te beschrijven. Als bijvoorbeeld een trainingsvideo een presentator laat zien die een diagram op een whiteboard tekent zonder daar verbaal commentaar op te geven, zou een audiobeschrijving vertellen wat er wordt getekend en waarom dat belangrijk is.

Een volledig tekstalternatief voor media is een document dat alle informatie in de gesynchroniseerde media overbrengt — zowel de audiocontent (dialoog, vertelling, geluidseffecten) als de visuele content (handelingen, omgevingen, tekst op het scherm, identificatie van sprekers) — in tekstvorm. Dit is een uitgebreidere versie van een transcript; het moet visuele gebeurtenissen zo nauwkeurig beschrijven dat een gebruiker die de video niet kan zien of horen alle informatie kan begrijpen die de video communiceert.

Dit criterium is specifiek van toepassing op vooraf opgenomen gesynchroniseerde media. Live videostreams worden behandeld door andere criteria (1.2.4 voor ondertiteling), en alleen-audio content valt onder 1.2.1. Belangrijk is dat als de videotrack puur decoratief is — bijvoorbeeld een geanimeerde achtergrond die geen informatie overbrengt — het criterium niet van toepassing is. Evenzo, als de audiotrack van een video al alle betekenisvolle visuele informatie volledig beschrijft (een situatie die soms "equivalente audio" wordt genoemd), is geen aanvullende audiobeschrijving vereist.

Om aan 1.2.3 te voldoen, moet voor elk stuk vooraf opgenomen gesynchroniseerde media ten minste één van de volgende zaken waar zijn: er wordt een audiobeschrijving aangeboden, of er is een tekstalternatief dat alle audio- en visuele informatie overbrengt, gelinkt of direct naast de media geplaatst. Er is sprake van een fout wanneer videocontent betekenisvolle visuele elementen bevat — tekst op het scherm, grafische gegevens, gezichtsuitdrukkingen die een belangrijke emotie overbrengen, demonstratiestappen — die niet via audio of een tekstalternatief worden overgebracht.

Let op dat 1.2.3 een Level A-vereiste is, waardoor het de minimale verwachting vormt. Het robuustere Level AA-criterium 1.2.5 (Audiobeschrijving — vooraf opgenomen) vereist audiobeschrijvingen in alle gevallen waarin ze nodig zijn, terwijl 1.2.3 het tekstalternatief als vervanging toestaat op Level A.

Waarom Het Belangrijk Is

Ongeveer 2,2 miljard mensen wereldwijd hebben een vorm van visuele beperking, volgens de Wereldgezondheidsorganisatie. Voor gebruikers die blind zijn, is videocontent zonder audiobeschrijving of tekstalternatief volledig ontoegankelijk als bron van visuele informatie. Een schermlezer kan aankondigen dat er een video-element aanwezig is en kan eventuele bijbehorende ondertitels voorlezen, maar kan de visuele content van de videoframes zelf niet interpreteren. Zonder een audiobeschrijving of media-alternatief missen die gebruikers simpelweg alles wat de video laat zien maar niet zegt.

Beschouw een concreet scenario: een Turkse e-commerceplatform publiceert een productdemonstratievideo voor een smart home-apparaat. De video toont een presentator die het apparaat koppelt aan een smartphone-app, menu’s op beide schermen doorloopt en kabels in specifieke poorten steekt. De vertelling van de presentator richt zich op de voordelen van het apparaat, maar beschrijft niet welke knoppen worden ingedrukt of welke menu-items worden geselecteerd. Een blinde gebruiker die deze video met een schermlezer bekijkt, hoort alleen de vertelling — die ontvangt geen enkele procedurele visuele informatie die nodig is om de installatie thuis te kunnen herhalen. Met een audiobeschrijving of een gedetailleerd tekstalternatief krijgt die gebruiker volledige toegang tot dezelfde instructieve content.

Naast blinde gebruikers profiteren gebruikers met cognitieve beperkingen van gedetailleerde tekstalternatieven, omdat zij geschreven instructies mogelijk gemakkelijker verwerken dan een snel bewegende video. Ze zijn ook nuttig voor gebruikers in omgevingen met beperkte bandbreedte die geen video kunnen streamen, gebruikers op bedrijfsnetwerken waar video is geblokkeerd, en gebruikers van apparaten of browsers die bepaalde videoformaten niet ondersteunen. Zoekmachines indexeren ook tekstalternatieven, wat betekent dat het aanbieden ervan de SEO verbetert door videocontent vindbaar te maken via full-text search — een betekenisvol zakelijk voordeel naast de toegankelijkheidswaarde.

Voor motorisch beperkte gebruikers die de videobediening niet nauwkeurig kunnen bedienen, maakt een tekstalternatief het mogelijk de content in hun eigen tempo te consumeren zonder te hoeven worstelen met pauze-, terugspoel- of afspeelknoppen. Kortom, audiobeschrijvingen en media-alternatieven bedienen een brede populatie en verbeteren de algehele kwaliteit en reikwijdte van videocontent ver voorbij de gebruikers die ze strikt nodig hebben voor toegang.

Gerelateerde Axe-core Regels

WCAG 1.2.3 vereist handmatige tests. Er is geen axe-core regel die automatisch een schending van dit criterium markeert, en begrijpen waarom helpt verduidelijken waar testers handmatig op moeten letten.

  • Handmatige test vereist — analyse van visuele content: Geautomatiseerde tools kunnen de aanwezigheid van een <video>-element, een <track>-element of een gekoppelde transcriptlink detecteren, maar ze kunnen niet beoordelen of de inhoud van een audiobeschrijving of tekstalternatief voldoende is. Voldoendeheid hangt ervan af of alle betekenisvolle visuele informatie wordt overgebracht — een beoordeling die vereist dat een mens de video bekijkt, het alternatief leest en deze met elkaar vergelijkt. Een axe-scan kan bevestigen dat een <track kind='descriptions'>-element aanwezig is, maar kan niet verifiëren dat de beschrijvingen daadwerkelijk alle kritieke visuele gebeurtenissen in de video dekken.
  • Handmatige test vereist — beoordeling van equivalentie: Bepalen of de hoofd-audiotrack alle visuele informatie al beschrijft (waardoor een extra audiobeschrijving overbodig is) is per definitie een inhoudelijke beoordeling. Een menselijke beoordelaar moet de video bekijken en inschatten of een blinde gebruiker die alleen naar de audio luistert betekenisvolle informatie zou missen. Geen enkele geautomatiseerde regel kan deze beoordeling betrouwbaar maken.
  • Handmatige test vereist — volledigheid van tekstalternatief: Als een tekstalternatief (volledig media-alternatief) wordt aangeboden in plaats van een audiobeschrijving, moet een mens het tekstalternatief lezen en met de video vergelijken om te bevestigen dat alle visuele gebeurtenissen, tekst op het scherm en betekenisvolle handelingen zijn opgenomen. Geautomatiseerde tools kunnen controleren of er een link naar een transcript bestaat, maar kunnen niet beoordelen of dat transcript volledig en accuraat is.

Hoe te Testen

  1. Geautomatiseerde scan als basislijn: Voer axe DevTools of Google Lighthouse uit op de pagina met de video. Hoewel geen van beide tools direct een 1.2.3-schending zal markeren, kan de scan gerelateerde problemen aan het licht brengen, zoals ontbrekende <track>-elementen (gemarkeerd onder 1.2.2 voor ondertiteling) of ontbrekende tekstalternatieven voor op afbeeldingen gebaseerde media. Noteer alle video-elementen op de pagina zodat u weet welke handmatige beoordeling onder 1.2.3 vereisen.
  2. Gesynchroniseerde media identificeren: Lokaliseer elk <video>-element (of ingesloten externe speler zoals YouTube- of Vimeo-iframes) op de pagina. Bevestig of elke video vooraf opgenomen en gesynchroniseerd is (d.w.z. zowel audio- als videotracks heeft die betekenisvol zijn). Als een video alleen audio bevat of een decoratieve videotrack heeft, valt deze buiten de reikwijdte van 1.2.3.
  3. Bekijk de video met geluid aan: Bekijk de video normaal en let goed op alle informatie die visueel wordt overgebracht maar niet in de audio wordt beschreven. Veelvoorkomende voorbeelden zijn: tekstoverlays op het scherm, diagrammen of grafieken die worden getekend, stapsgewijze demonstraties van een fysiek proces, gezichtsuitdrukkingen of lichaamstaal met emotionele betekenis, en identificatie van sprekers wanneer meerdere personen in beeld zijn.
  4. Controleer op een audiobeschrijvingstrack: Inspecteer de markup van het video-element op een <track kind='descriptions'>-element. Als dit aanwezig is, schakel de beschrijvingen in de videospeler in (of gebruik een browser die deze zichtbaar maakt) en bekijk de video opnieuw. Verifieer dat elke betekenisvolle visuele gebeurtenis die in stap 3 is geïdentificeerd, op een passend moment wordt beschreven in de audiobeschrijvingstrack.
  5. Controleer op een volledig tekstalternatief: Als er geen audiobeschrijvingstrack aanwezig is, zoek dan naar een link naar een transcript of een volledig media-alternatief naast of direct na de video. Bevestig dat het gekoppelde document of de inline tekst alle audiocontent (dialoog, vertelling, relevante geluidseffecten) en alle visuele content (handelingen, tekst op het scherm, beschrijvingen van de omgeving, identificatie van sprekers) beschrijft.
  6. Verificatie met schermlezer (NVDA + Firefox): Open de pagina met NVDA actief. Navigeer naar het video-element en bevestig dat NVDA de aanwezigheid van de video en eventuele bijbehorende bedieningselementen aankondigt. Als een tekstalternatief inline of via een link wordt aangeboden, navigeer ernaartoe en bevestig dat NVDA de volledige inhoud zonder weglatingen voorleest. Let op: NVDA kan de visuele content van de videoframes niet lezen, wat onderstreept waarom de menselijke vergelijking in stap 3 essentieel is.
  7. Verificatie met schermlezer (VoiceOver + Safari op macOS): Activeer VoiceOver en navigeer naar de video. Gebruik de rotor van VoiceOver om het video-element en eventuele bijbehorende track- of linkelementen te vinden. Bevestig dat de beschrijvingstrack, indien aanwezig, toegankelijk is via de mediabediening van Safari.
  8. Externe spelers: Controleer bij YouTube-embeds of de video een versie met audiobeschrijving heeft (vaak een aparte video die in de beschrijving is gelinkt) of dat er een bijbehorend transcript beschikbaar is en op de insluitende pagina is gelinkt. Controleer bij Vimeo de toegankelijkheidsinstellingen van de video. Externe spelers voldoen niet automatisch aan 1.2.3 — de pagina-auteur is verantwoordelijk voor het zorgen dat een alternatief wordt aangeboden of gelinkt.

Hoe te Herstellen

Scenario 1: HTML5-video zonder audiobeschrijving — Onjuist

<!-- A product demo video with meaningful visual content but no audio description or text alternative -->
<video controls width='800'>
  <source src='product-demo.mp4' type='video/mp4'>
  <track kind='captions' src='captions-en.vtt' srclang='en' label='English' default>
</video>

Scenario 1: HTML5-video met audiobeschrijvingstrack — Juist

<!-- Audio description track added using kind='descriptions'.
     The VTT file contains timed narrations of visual events
     that are not conveyed through the main audio. -->
<video controls width='800'>
  <source src='product-demo.mp4' type='video/mp4'>
  <track kind='captions' src='captions-en.vtt' srclang='en' label='English' default>
  <track kind='descriptions' src='descriptions-en.vtt' srclang='en' label='Audio Descriptions'>
</video>

Scenario 2: HTML5-video zonder tekstalternatief — Onjuist

<!-- Tutorial video with on-screen steps and diagrams; no transcript provided -->
<section>
  <h2>How to Configure Your Router</h2>
  <video controls width='800'>
    <source src='router-setup.mp4' type='video/mp4'>
    <track kind='captions' src='captions-tr.vtt' srclang='tr' label='Turkish' default>
  </video>
</section>

Scenario 2: HTML5-video met een volledig media-alternatief — Juist

<!-- Full media alternative linked immediately after the video.
     The linked page contains both transcript text (all dialogue and narration)
     and descriptions of all visual steps shown in the video. -->
<section>
  <h2>How to Configure Your Router</h2>
  <video controls width='800'>
    <source src='router-setup.mp4' type='video/mp4'>
    <track kind='captions' src='captions-tr.vtt' srclang='tr' label='Turkish' default>
  </video>
  <p>
    <a href='router-setup-full-transcript.html'>
      Full text alternative for this video (includes all dialogue and visual descriptions)
    </a>
  </p>
</section>

Scenario 3: YouTube-embed zonder aanvullend alternatief — Onjuist

<!-- Embedded YouTube video; the video on YouTube has no audio description
     and no transcript is linked on this page -->
<iframe width='560' height='315'
  src='https://www.youtube.com/embed/XXXXXXXXXXX'
  title='Annual Report Highlights 2024'
  allowfullscreen>
</iframe>

Scenario 3: YouTube-embed met gelinkt tekstalternatief — Juist

<!-- Embedding page provides a link to a full text alternative.
     The linked document describes all visual content in the video
     (slides, charts, on-screen data) in addition to the spoken content. -->
<figure>
  <iframe width='560' height='315'
    src='https://www.youtube.com/embed/XXXXXXXXXXX'
    title='Annual Report Highlights 2024'
    allowfullscreen>
  </iframe>
  <figcaption>
    <a href='annual-report-2024-full-transcript.html'>
      Read the full text alternative for Annual Report Highlights 2024
    </a>
  </figcaption>
</figure>

Scenario 4: Video waarvan de audio alle visuele content al beschrijft (uitzondering) — Juist

<!-- This video features a narrator who explicitly describes every action
     being performed on screen: 'I am now clicking the blue Settings button
     in the top-right corner and selecting Account from the dropdown menu.'
     Because the audio fully conveys all visual information, no separate
     audio description is required under 1.2.3. -->
<video controls width='800'>
  <source src='fully-described-tutorial.mp4' type='video/mp4'>
  <track kind='captions' src='captions-en.vtt' srclang='en' label='English' default>
</video>
<!-- Document the rationale in an internal accessibility conformance note -->

Veelvoorkomende Fouten

  • Ondertitels aanbieden in plaats van een audiobeschrijving: Ondertitels zetten de gesproken audio om in tekst voor dove gebruikers; ze beschrijven geen visuele informatie voor blinde gebruikers. Het toevoegen van een <track kind='captions'>-element voldoet aan 1.2.2 maar niet aan 1.2.3. Dit zijn twee afzonderlijke vereisten die twee verschillende groepen mensen met een beperking bedienen.
  • Een transcript linken dat alleen de dialoog bevat: Een tekstalternatief voor 1.2.3 moet alle betekenisvolle visuele content beschrijven — tekst op het scherm, diagrammen, fysieke handelingen, identificatie van sprekers — niet alleen wat er wordt gezegd. Een transcript dat alleen het script bevat, voldoet doorgaans niet aan dit criterium als de video informatie bevat die uitsluitend visueel is.
  • De link naar het tekstalternatief ver van de video plaatsen: Als het volledige media-alternatief is weggestopt in een voetnoot of op een aparte pagina zonder duidelijke, nabije link, kunnen gebruikers het niet vinden. De link moet direct vóór of na het video-element verschijnen, zodat schermlezergebruikers deze in de natuurlijke leesvolgorde tegenkomen.
  • Aannemen dat de automatisch gegenereerde transcriptie van YouTube aan het criterium voldoet: Automatisch gegenereerde YouTube-transcripten dekken alleen de gesproken audio. Ze beschrijven geen visuele content en zijn vaak onnauwkeurig. Ze vormen geen voldoende volledig media-alternatief onder 1.2.3.
  • Een <track kind='descriptions'>-element gebruiken maar het VTT-bestand leeg of onvolledig laten: De aanwezigheid van het track-element is niet voldoende; het VTT-bestand moet nauwkeurige, tijdige beschrijvingen van alle betekenisvolle visuele gebeurtenissen bevatten. Een leeg of zeer summier VTT-bestand voldoet niet aan het criterium.
  • Verzuimen tekstoverlays op het scherm te beschrijven: Marketingvideo’s tonen vaak statistieken, productnamen of call-to-action-tekst als geanimeerde overlays. Als deze overlays niet door een verteller worden voorgelezen, moeten ze in de audiobeschrijving of het tekstalternatief voorkomen — auteurs vergeten dit vaak.
  • Audiobeschrijvingen schrijven die te vaag zijn: Beschrijvingen zoals "de presentator demonstreert het proces" zijn onvoldoende. Effectieve beschrijvingen benoemen specifieke handelingen, interface-elementen, kleuren waar relevant, en ruimtelijke relaties: "De presentator klikt op de rode knop Verwijderen aan de rechterkant van de werkbalk en bevestigt vervolgens door OK te selecteren in het dialoogvenster."
  • Geen alternatief bieden voor autoplay- of achtergrondvideo’s die informatie bevatten: Een video die automatisch wordt afgespeeld en belangrijke informatie toont (zoals een hero-sectie met productkenmerken en tekstoverlays) is nog steeds gesynchroniseerde media en moet voldoen als deze betekenisvolle content overbrengt.
  • Decoratieve video’s als vrijgesteld beschouwen zonder verificatie: Teams bestempelen een video soms als "decoratief" om de vereiste te omzeilen, zelfs wanneer deze in werkelijkheid productinformatie of instructieve content overbrengt. De decoratieve uitzondering geldt alleen wanneer de video werkelijk geen betekenisvolle informatie toevoegt aan wat al in aangrenzende tekst beschikbaar is.
  • Vergeten de audiobeschrijving of het tekstalternatief bij te werken wanneer de video wordt bijgewerkt: Als de videocontent verandert — bijvoorbeeld wanneer productstappen worden herzien of prijsgegevens worden bijgewerkt — moeten de audiobeschrijving en het tekstalternatief worden aangepast. Verouderde alternatieven vormen een conformiteitsfout, zelfs als de oorspronkelijke alternatieven ooit accuraat waren.

Relatie met de Toegankelijkheidsregelgeving van Turkije

De Turkse Presidentiële Circulaire 2025/10, gepubliceerd in Staatsblad nr. 32933 op 21 juni 2025, stelt verplichte webtoegankelijkheidsnormen vast voor een brede reeks publieke en private entiteiten die in Turkije actief zijn. De circulaire verwijst naar internationaal erkende toegankelijkheidsstandaarden, waarbij WCAG 2.2 Level A en Level AA dienen als technische basis voor conformiteit. Omdat WCAG 1.2.3 een Level A-vereiste is, behoort het tot de meest fundamentele verplichtingen onder de circulaire — er is geen lager conformiteitsniveau dat organisaties toestaat dit te negeren.

De circulaire heeft betrekking op een breed scala aan typen entiteiten. Publieke instellingen en overheidsorganen — waaronder ministeries, gemeenten, staatsuniversiteiten en andere publieke agentschappen — moeten binnen één jaar na de publicatiedatum van de circulaire conformiteit bereiken. Private sectorentiteiten die onder de circulaire vallen, omvatten e-commerceplatforms, banken en financiële instellingen, ziekenhuizen en particuliere zorgaanbieders, telecommunicatiebedrijven met 200,000 of meer abonnees, erkende reisbureaus, particuliere vervoersbedrijven en particuliere scholen die zijn gemachtigd door het Ministry of National Education (MoNE). Deze organisaties in de private sector hebben twee jaar vanaf de publicatiedatum om conformiteit te bereiken.

Voor elke betrokken entiteit die videocontent publiceert — wat tegenwoordig vrijwel elke grote Turkse instelling en onderneming omvat — creëert WCAG 1.2.3 een concrete, afdwingbare verplichting. Een bank die videotutorials publiceert waarin wordt uitgelegd hoe de mobiele app moet worden gebruikt, een openbaar ziekenhuis dat videogidsen voor patiëntenregistratie plaatst, een telecomaanbieder die promotievideo’s deelt met tariefvergelijkingen op het scherm, of een e-commerce site die productdemonstratievideo’s bevat, moeten er allemaal voor zorgen dat elk vooraf opgenomen gesynchroniseerd media-item wordt vergezeld door een audiobeschrijving of een volledig tekstalternatief.

Niet-naleving van de vereisten van de circulaire kan leiden tot toezicht door toezichthouders en reputatieschade, en naarmate de handhaving van digitale toegankelijkheid in Turkije zich ontwikkelt, tot juridische risico’s voor betrokken entiteiten. Organisaties moeten WCAG 1.2.3 niet zien als een optionele verbetering, maar als een minimale wettelijke verplichting. In de praktijk betekent dit het uitvoeren van een inventarisatie van alle videocontent, beoordelen welke video’s uitsluitend visuele informatie bevatten, en systematisch audiobeschrijvingen of volledige tekstalternatieven produceren voor al deze video’s. Nieuwe videoproductieworkflows moeten toegankelijkheidsdeliverables — beschrijvingsscripts en tekstalternatieven — opnemen als standaardoutput naast ondertitels en vertalingen.