WCAG framgångskriterier · Level AAA

WCAG 1.2.7: Utökad syntolkning (förinspelad)

WCAG 1.2.7 kräver att när pauser i förgrundsljudet inte räcker för att förmedla all visuell information, måste utökade ljudbeskrivningar – åstadkomna genom att pausa videon – tillhandahållas för förinspelade synkroniserade medier. Detta säkerställer att blinda och synsvaga användare fullt ut kan förstå komplext visuellt innehåll som vanliga ljudbeskrivningar inte kan täcka.

Vad den här regeln innebär

WCAG framgångskriterium 1.2.7 — Utökad syntolkning (förinspelad) ligger på nivå AAA och bygger direkt på kravet på nivå AA i SC 1.2.5 (Syntolkning för förinspelat). Där standardsyntolkning enbart använder naturliga pauser i en videos ljudspår för att berätta visuell information, går utökad syntolkning längre: när dessa pauser är för korta eller för sällsynta för att rymma all nödvändig beskrivning, pausas videon och syntolkningen spelas upp, varefter videon fortsätter.

Kriteriet gäller specifikt för förinspelade synkroniserade medier — det vill säga videoinnehåll som har ett ljudspår synkroniserat med sina visuella element, såsom instruktionsfilmer, företagsutbildningsvideor, dokumentärer, produktdemonstrationer och liknande innehåll. Det gäller inte för direktsända medier, för enbart ljudinnehåll eller för enbart video där det inte finns något ljudspår.

Ett godkänt resultat enligt detta kriterium kräver något av följande: (a) ett spår eller en version av mediet med utökad syntolkning tillhandahålls som pausar uppspelningen för att leverera beskrivningar av kritisk visuell information som inte får plats i naturliga pauser, eller (b) all visuell information förmedlas redan genom det befintliga ljudspåret utan behov av ytterligare beskrivning (ibland kallat en "likvärdigt beskriven" version). Ett underkänt resultat uppstår när en förinspelad synkroniserad video innehåller meningsfull visuell information — såsom text på skärmen, diagram, ansiktsuttryck som driver berättelsen eller demonstrationer — som inte förmedlas genom vare sig syntolkning i naturliga pauser eller utökade beskrivningar, och det befintliga ljudet ensamt lämnar en blind användare utan den informationen.

WCAG erkänner också ett viktigt undantag: om mediet i sig är ett mediealternativ till text — till exempel en videoversion av ett textdokument som tydligt är märkt som sådant — krävs ingen utökad syntolkning. Dessutom, om förgrundsljudet redan beskriver allt visuellt innehåll fullt ut, behövs ingen ytterligare beskrivning.

Det är värt att notera att tillhandahållande av utökad syntolkning ofta kräver att en helt separat version av videon produceras, eftersom de flesta mediaspelare inte har inbyggt stöd för paus-och-återuppta-mekanismen för att leverera beskrivningar. Vanliga tillvägagångssätt inkluderar en dedikerad "syntolkad version" som är tillgänglig via en separat URL eller en växlingsknapp i spelaren, eller användning av en mediaspelare som stöder TTML (Timed Text Markup Language) eller SMIL-baserade spår för utökad syntolkning.

Varför det är viktigt

Utökad syntolkning är avgörande för användare som är blinda eller har grav synnedsättning — en målgrupp som är större än många utvecklare antar. Enligt Världshälsoorganisationen har cirka 2,2 miljarder människor världen över någon form av synnedsättning, varav minst 1 miljard har tillstånd som hade kunnat förebyggas eller som fortfarande är obehandlade. För användare som helt förlitar sig på skärmläsare och ljudutmatning kan en video som bara beskriver det som dess naturliga pauser medger lämna enorma luckor i förståelsen.

Föreställ dig en medicinsk utbildningsvideo som demonstrerar en kirurgisk teknik. Berättarrösten kan säga: "Nu gör vi snittet här", medan kameran zoomar in på ett specifikt anatomiskt landmärke och kirurgens händer utför en exakt manöver. Den talade berättelsen förutsätter att tittaren kan se det visuella sammanhanget. En standardsyntolkning kanske kan infoga en kort notering under en kort paus, men om handlingen är kontinuerlig i två minuter med konstant tal får en blind läkarstudent nästan inga visuella detaljer som är centrala för att lära sig tekniken. Utökad syntolkning pausar videon och levererar en fullständig beskrivning: den synliga anatomin, det exakta verktyget som används, angreppsvinkeln, vävnadens reaktion. Studenten får då likvärdig tillgång till utbildningsmaterialet.

Utöver blindhet gynnar utökad syntolkning användare med kognitiva funktionsnedsättningar som bearbetar information långsammare och har nytta av det extra sammanhang som beskrivande berättarröst ger. Den hjälper också användare i enbart ljud-sammanhang — till exempel någon som lyssnar på en utbildningsvideo under pendling — som inte kan se skärmen oavsett synförmåga.

Ur ett affärs- och juridiskt perspektiv signalerar tillhandahållande av utökad syntolkning ett seriöst, mätbart åtagande för inkludering. För organisationer i reglerade sektorer — offentliga institutioner, banker, vårdgivare, utbildningsinstitutioner — kan det att visa upp nivå AAA-efterlevnad för komplext medieinnehåll påtagligt minska juridisk risk och skadlig publicitet. Det finns också en praktisk SEO-fördel: manusen som används för att producera utökad syntolkning fungerar ofta som rika transkriptioner, som sökmotorer indexerar som meningsfullt innehåll, vilket förbättrar upptäckbarheten för videobaserade resurser.

Relaterade Axe-core-regler

WCAG 1.2.7 kräver manuell testning eftersom automatiserade verktyg inte kan utvärdera det semantiska innehållet i en video, jämföra ljudspåret med bildspåret eller avgöra om visuell information är tillräckligt beskriven. Det finns ingen axe-core-regel som kan titta på en video, förstå vad som visas visuellt och bedöma om en utökad syntolkning finns, är korrekt och komplett. Detta är i grunden en mänsklig bedömningsuppgift.

  • Manuell utvärdering — jämförelse mellan visuellt innehåll och ljudinnehåll: En mänsklig testare måste titta på videon med öppna ögon och med slutna ögon (eller med en skärmläsare) och avgöra om ljudet ensamt — inklusive eventuell standardsyntolkning — förmedlar all meningsfull visuell information. Om det inte gör det måste testaren kontrollera om en version med utökad syntolkning tillhandahålls. Automatiserade verktyg kan inte utföra denna jämförelse eftersom de saknar förmåga att tolka videorutor som meningsfulla visuella händelser eller korrelera dem med semantisk betydelse i ljudet.
  • Manuell utvärdering — paus-och-återuppta-mekanism: Om en utökad syntolkning påstås finnas måste en testare verifiera att spelaren faktiskt pausar under leveransen av beskrivningen och återupptar korrekt efteråt. Detta beteende är en fråga om mediaspelare och timing som kräver aktiv uppspelningstestning av en människa, eftersom automatiska skannrar inte kör eller observerar medieuppspelningslägen.
  • Manuell utvärdering — beskrivningens korrekthet och fullständighet: Även där ett spår med utökad syntolkning finns måste dess innehåll vara korrekt och täcka all visuellt kritisk information. Ingen automatiserad regel kan bedöma om beskrivningstexten korrekt och fullständigt representerar det som visas på skärmen. En beskrivning som säger "presentatören pekar på tavlan" när tavlan innehåller ett kritiskt diagram med märkta datapunkter skulle underkännas enligt detta kriterium trots att den tekniskt sett finns.

Hur man testar

  1. Kör först en automatiserad tillgänglighetsskanning. Använd axe DevTools (webbläsartillägg) eller Lighthouse på sidan som innehåller videon. Även om inget av verktygen direkt kan verifiera efterlevnad av utökad syntolkning kan de flagga saknade eller trasiga medieelement, frånvarande track-element och andra strukturella problem. Notera alla varningar om medieinnehåll som utgångspunkt. Axe kan flagga avsaknaden av ett textningsspår eller syntolkningsspår på elementnivå, vilket snävar in omfattningen för din manuella granskning.
  2. Identifiera alla förinspelade synkroniserade medier på sidan. Lokalisera varje <video>-element eller inbäddad mediaspelare (YouTube-iframes, Vimeo-inbäddningar, anpassade spelare). Bekräfta att varje innehåller synkroniserat ljud och video. Rena ljudpoddar eller stumma videor ligger utanför detta kriteriums omfattning.
  3. Titta på videon med enbart ljud. Stäng ögonen eller använd en skärmläsare (NVDA med Firefox, VoiceOver med Safari eller JAWS med Chrome) och lyssna på hela videon inklusive eventuellt befintligt syntolkningsspår. Notera varje tillfälle där du saknar förståelse för vad som händer visuellt — handlingar, text på skärmen, diagram, scenövergångar, karaktärers uttryck som driver berättelsen.
  4. Jämför dina anteckningar med bildspåret. Titta nu på videon med ljudet avstängt och notera all visuell information som visas på skärmen. Korsreferera med det du hörde. Om meningsfullt visuellt innehåll inte förmedlades i ljudet kräver videon syntolkning. Om naturliga pauser i ljudet var för korta eller saknades för att rymma dessa beskrivningar krävs utökad syntolkning.
  5. Kontrollera om det finns en version med utökad syntolkning. Leta efter en tydligt märkt länk "Audio Described Version", en växel i videospelaren eller en syntolkad version på en alternativ URL. Om den finns, aktivera den och upprepa steg 3 och 4 med den syntolkade versionen spelandes, och verifiera att pauserna och beskrivningarna nu täcker den saknade visuella informationen.
  6. Testa paus-och-återuppta-beteendet med NVDA + Firefox. Med versionen med utökad syntolkning spelandes, bekräfta att videon pausas, att syntolkningen levereras tydligt och att videon återupptas från rätt punkt. Verifiera att skärmläsaren annonserar det beskrivna innehållet eller att det på annat sätt är hörbart för en icke-seende användare.
  7. Testa med VoiceOver + Safari på macOS/iOS. Upprepa uppspelningstestet. Säkerställ att den syntolkade versionen kan styras med tangentbordsnavigering (Tabb, Mellanslag, Enter) och att VoiceOver annonserar spelarkontroller korrekt, inklusive eventuell växel för syntolkning.
  8. Verifiera manus för beskrivningen för korrekthet. Skaffa manus eller transkription för den utökade syntolkningen om det finns. Granska det mot videon för att bekräfta att det är faktamässigt korrekt, täcker alla kritiska visuella händelser och inte utelämnar information som en seende tittare skulle använda för att förstå innehållet.

Hur man åtgärdar

Scenario 1: Video utan någon syntolkning alls — Felaktig

<!-- A training video with no audio description track and no described version link.
     Blind users receive only the foreground narration, missing all visual demonstrations. -->
<video controls width='800'>
  <source src='surgical-technique.mp4' type='video/mp4'>
  <track kind='captions' src='captions-en.vtt' srclang='en' label='English Captions' default>
</video>

Scenario 1: Video med version med utökad syntolkning — Korrekt

<!-- Provide a clearly labeled link to the extended described version.
     The described version pauses at critical moments to deliver full visual descriptions.
     This is the most reliable cross-browser approach. -->
<video controls width='800' id='main-video'>
  <source src='surgical-technique.mp4' type='video/mp4'>
  <track kind='captions' src='captions-en.vtt' srclang='en' label='English Captions' default>
  <track kind='descriptions' src='descriptions-en.vtt' srclang='en' label='Audio Descriptions'>
</video>
<p>
  <a href='surgical-technique-extended-described.mp4'>
    Watch extended audio described version of this video
  </a>
</p>

Scenario 2: Inbäddad YouTube-video med snabba visuella förlopp — Felaktig

<!-- An iframe embed of a product demo video. The YouTube auto-captions exist
     but there is no audio description, and the visual demonstrations are rapid
     with no natural pauses long enough for description. -->
<iframe
  width='560'
  height='315'
  src='https://www.youtube.com/embed/EXAMPLE_ID'
  title='Product demonstration video'
  allowfullscreen>
</iframe>

Scenario 2: Inbäddad video med växel för syntolkad version — Korrekt

<!-- Offer a button that swaps the src to the extended described version.
     The described version was produced as a separate MP4 with pauses built in.
     The button is keyboard-accessible and has a clear accessible name. -->
<div role='region' aria-label='Product demonstration video player'>
  <iframe
    id='demo-video-frame'
    width='560'
    height='315'
    src='https://www.youtube.com/embed/EXAMPLE_ID'
    title='Product demonstration video'
    allowfullscreen>
  </iframe>
  <p>
    <button
      type='button'
      aria-pressed='false'
      onclick='toggleDescribedVersion(this)'>
      Enable extended audio description
    </button>
  </p>
</div>
<!-- The toggleDescribedVersion() function swaps the iframe src
     to the described YouTube video ID and updates aria-pressed. -->

Scenario 3: HTML5-videospelare med ett beskrivningsspår som är för kort — Felaktig

<!-- A descriptions track exists but its cue text is truncated to fit within
     existing audio pauses. Key visual information (a data chart with five labeled
     columns) is summarized as 'a chart appears on screen' — insufficient. -->
<video controls width='800'>
  <source src='annual-report.mp4' type='video/mp4'>
  <track kind='captions' src='captions-en.vtt' srclang='en' label='English' default>
  <track kind='descriptions' src='brief-descriptions.vtt' srclang='en' label='Descriptions'>
</video>
<!-- brief-descriptions.vtt contains only: 'A chart appears on screen.' -->

Scenario 3: Separat version med utökad syntolkning och fullständig berättarröst — Korrekt

<!-- The extended described version pauses playback at the chart moment
     and delivers: 'A bar chart titled Annual Revenue by Region appears.
     Five bars are shown: Europe 2.1 million, Asia 3.4 million,
     North America 4.8 million, South America 1.2 million, Africa 0.9 million.
     North America leads all regions.' The video then resumes. -->
<video controls width='800'>
  <source src='annual-report.mp4' type='video/mp4'>
  <track kind='captions' src='captions-en.vtt' srclang='en' label='English' default>
</video>
<p>
  <strong>Extended audio described version:</strong>
  <a href='annual-report-extended-described.mp4'>
    Annual report video with extended audio descriptions
  </a>
</p>

Vanliga misstag

  • Att behandla ett textningsspår som en ersättning för syntolkning: Textning återger talad dialog och ljudeffekter som text för döva användare. De beskriver inte visuellt innehåll för blinda användare. En video med enbart textningsspår underkänns fortfarande enligt detta kriterium om visuell information inte beskrivs i ljudet.
  • Att tillhandahålla ett standardspår för syntolkning utan att kontrollera om pauserna är tillräckliga: Många team lägger till ett <track kind='descriptions'>-element och anser att arbetet är klart, utan att verifiera att varje betydelsefull visuell händelse har en paus som är tillräckligt lång för att beskrivningen ska få plats. Snabba demonstrationer, komplexa diagram och tät text på skärmen kräver vanligtvis utökade beskrivningar.
  • Att bara beskriva uppenbara visuella förändringar och utelämna textinnehåll på skärmen: Text på skärmen — bildrubriker, fältetiketter, diagramaxlar, knappetiketter som visas i en demo — måste läsas upp i sin helhet under syntolkningen. Att säga "en bild visas" istället för att läsa bildens rubrik och viktiga punktlistor lämnar kritisk information otillgänglig.
  • Att länka till en syntolkad version utan ett tydligt, programmässigt avgörbart tillgängligt namn: En länk som säger "klicka här" eller "syntolkad version" utan en etikett som identifierar vilken video den beskriver underkänns enligt WCAG 2.4.6 och skapar förvirring för skärmläsaranvändare som navigerar på en sida med flera videor.
  • Att använda växlingsknappen för syntolkad version utan att uppdatera aria-pressed eller ge återkoppling: Om en knapp växlar mellan standarduppspelning och syntolkad uppspelning måste den använda aria-pressed (true/false) eller en motsvarande live-region-annonsering så att skärmläsaranvändare vet aktuellt läge och att deras åtgärd fick effekt.
  • Att producera versionen med utökad syntolkning utan att testa att återupptagningen är korrekt: Efter beskrivningspausen måste videon återupptas exakt där den slutade — inte från en något tidigare eller senare ruta. Felaktiga återupptagningspunkter orsakar förlust av berättarkontext och ökar förvirringen för blinda användare.
  • Att anta att en videotranskription ensam uppfyller detta kriterium: En transkription är värdefull och stöder SC 1.2.8 (Mediealternativ), men den uppfyller inte 1.2.7. Utökad syntolkning är en tidsynkroniserad, ljudbaserad mekanism, inte ett separat dokument att läsa fristående.
  • Att inte beskriva visuell information som driver den emotionella eller narrativa betydelsen av en scen: Om en karaktärs ansiktsuttryck, kroppsspråk eller visuella reaktion är central för att förstå vad som händer — till exempel i en kundberättelsevideo — lämnar utelämnande av den beskrivningen blinda användare utan likvärdig förståelse även om den talade dialogen är intakt.
  • Att inte uppdatera den syntolkade versionen när huvudvideon uppdateras: Om källvideon redigeras om, uppdateras eller byts ut (vanligt med instruktionsinnehåll) måste spåret eller versionen med utökad syntolkning också uppdateras. Inaktuella beskrivningar kan aktivt vilseleda genom att beskriva scener som inte längre finns.
  • Att bädda in videor via tredjeparts-iframes (YouTube, Vimeo) och anta att plattformen hanterar syntolkning: Plattformstillhandahållna syntolkningar (där de finns) är sällan utökade syntolkningar. Innehållsägaren ansvarar för att säkerställa att en version med utökad syntolkning finns och är länkad eller tillgänglig från den sida där videon bäddas in.

Relation till Turkiets tillgänglighetsreglering

Turkiets presidentcirkulär 2025/10, publicerat i Officiella tidningen nr 32933 den 21 juni 2025, fastställer tillgänglighetskrav för en definierad grupp av digitala tjänsteleverantörer. Cirkuläret föreskriver efterlevnad av tillgänglighetsstandarder för digitala produkter och tjänster som erbjuds allmänheten, i stort sett i linje med WCAG 2.1 nivå AA som grundläggande efterlevnadskrav.

De enhetstyper som omfattas av cirkuläret inkluderar offentliga institutioner och myndigheter, e-handelsplattformar, banker och finansiella institutioner, sjukhus och vårdgivare, telekomoperatörer med 200,000 eller fler abonnenter, licensierade resebyråer, privata transportföretag och privatskolor auktoriserade av Ministeriet för nationell utbildning (MoNE). För dessa enheter är WCAG 2.1 nivå AA-efterlevnad den verkställbara miniminivån.

WCAG 1.2.7 (Utökad syntolkning) är ett kriterium på nivå AAA, vilket innebär att det inte direkt föreskrivs av cirkulärets grundläggande krav. Dess betydelse bör dock inte underskattas i den turkiska regleringskontexten av flera skäl. För det första har organisationer som producerar komplext medieinnehåll — såsom vårdgivare som publicerar kirurgiska utbildningsvideor, offentliga institutioner som släpper policyförklarande filmer eller privatskolor som distribuerar pedagogiskt videoinnehåll — starka etiska och praktiska skäl att implementera utökad syntolkning för sitt mest kritiska material, även utan ett strikt juridiskt krav.

För det andra, i takt med att turkisk digital tillgänglighetsreglering mognar och tillsynsmekanismer stärks, refereras kriterier på nivå AAA i allt högre grad som indikatorer på bästa praxis. Organisationer som visar frivillig AAA-efterlevnad — särskilt inom högriskområden som hälsa, utbildning och finans — står bättre rustade inför framtida regulatoriska uppdateringar och löper mindre risk för klagomål enligt bredare antidiskrimineringsramverk.

För det tredje, för public service-bolag och medieorganisationer — även om de inte direkt namnges i cirkulär 2025/10 — har Turkiets Radio- och TV-högsta råd (RTÜK) historiskt arbetat med tillgänglighetsbestämmelser för sändningsinnehåll. Utökad syntolkning ligger i linje med andan i dessa skyldigheter när den tillämpas på on demand- och webbdistribuerad video.

Organisationer som använder Accsible widget SDK bör vara medvetna om att även om overlay-widgeten kan exponera tillgänglighetsfunktioner och kontroller för slutanvändare, måste utökad syntolkning implementeras på innehållsproduktionsnivå — den kan inte eftermonteras automatiskt av ett klientbaserat verktyg. SDK:t kan däremot exponera en växel eller länk till den syntolkade versionen i tillgänglighetspanelen, vilket gör den alternativa versionen mer lätt att hitta för användare som behöver den.