WCAG framgångskriterier · Level A

WCAG 1.2.2: Textning (förinspelat)

WCAG 1.2.2 kräver att allt förinspelat ljudinnehåll i synkroniserade medier (video med ljud) innehåller korrekta undertexter. Detta säkerställer att döva och hörselskadade användare kan ta del av talad dialog, ljudeffekter och annan meningsfull ljudinformation.

Vad den här regeln innebär

WCAG 1.2.2 — Captions (Prerecorded) kräver att undertexter tillhandahålls för allt förinspelat ljudinnehåll i synkroniserade medier. Synkroniserade medier definieras som ljud- eller videoinnehåll som är synkroniserat med ett annat format och/eller med tidsbaserade interaktiva komponenter — i praktiken innebär detta alla videofiler som också innehåller ljud, såsom inspelade föreläsningar, produktdemonstrationer, nyhetsklipp, vittnesmål eller marknadsföringsvideor.

Undertexter är ett textalternativ som är synkroniserat med videons tidslinje. De måste förmedla inte bara den talade dialogen utan också allt annat meningsfullt ljud — inklusive identifiering av talare, relevanta ljudeffekter (såsom [applause], [door slams] eller [music plays]) samt tonfall eller sätt att tala när det påverkar förståelsen. Detta skiljer undertexter (captions) från subtitles, som vanligtvis endast återger talade ord och är avsedda för publik som kan höra ljudet men inte förstår det talade språket.

Ett godkänt resultat enligt detta kriterium kräver allt följande: undertexter finns för alla förinspelade synkroniserade medier, de är korrekt synkroniserade med motsvarande ljud, de beskriver allt meningsfullt ljud (dialog, talaridentitet, relevanta ljudeffekter) och de är tillgängliga på samma plats som själva mediet — inte enbart länkade från en separat sida.

Ett underkänt resultat uppstår när: inga undertexter tillhandahålls alls, undertexter finns men är felaktiga eller ofullständiga (t.ex. autogenererade utan korrigering), undertexter utelämnar meningsfullt icke-tal-ljud, undertexter finns men är inte korrekt synkroniserade, eller undertexter endast tillhandahålls som en separat transkription (enbart en transkription uppfyller inte detta kriterium).

Det enda officiella undantaget som definieras i WCAG är media som i sig är ett medialternativ till text. Om till exempel en webbsida innehåller en skriven artikel och en video som helt enkelt återger samma information som artikeln, och videon tydligt är märkt som sådan, krävs inga undertexter för videon. Detta undantag är snävt och avsiktligt — det ska inte användas som kryphål för att undvika undertextning av videor som innehåller väsentligt innehåll som annars inte finns i textform.

Undertexter kan vara öppna (inbrända direkt i videon och alltid synliga) eller stängda (levererade som ett separat spår som användare kan slå på eller av). Båda är godtagbara enligt WCAG 1.2.2, även om stängda undertexter generellt är att föredra eftersom de låter användare anpassa utseendet och kan stängas av av dem som inte behöver dem. I HTML implementeras stängda undertexter vanligtvis med elementet <track> med kind='captions' inuti ett <video>-element, som pekar på en WebVTT- eller SRT-undertextfil.

Varför det är viktigt

Ungefär 466 miljoner människor världen över lever med funktionsnedsättande hörselnedsättning, enligt Världshälsoorganisationen — en siffra som beräknas stiga till över 900 miljoner till 2050. Utöver dem med grav dövhet upplever en mycket större grupp situationsbetingade hörselsvårigheter: personer i bullriga miljöer såsom kollektivtrafik, kontorslandskap eller trånga kaféer som inte kan höra ljud även med fungerande hörsel, användare som tillfälligt saknar tillgång till ljudhårdvara, och personer som tittar på innehåll i tysta miljöer där ljudet måste vara avstängt.

För användare som är döva eller har nedsatt hörsel är undertexter ingen bekvämlighet — de är det enda sättet att ta del av det talade innehållet i en video. Utan undertexter kan en döv användare som besöker en e-handelssajt inte förstå en produktdemonstrationsvideo, en döv student kan inte följa en inspelad föreläsning, och en döv patient kan inte ta till sig informationen i ett sjukhus instruktionsvideo. Informationen är helt otillgänglig för dem, oavsett hur tydligt videon är filmad eller hur hög produktionskvaliteten är.

Undertexter gynnar också personer med kognitiva och inlärningsrelaterade funktionsnedsättningar, såsom personer med uppmärksamhetsstörning/hyperaktivitet eller dyslexi, som kan tycka att det är lättare att bearbeta information när den presenteras samtidigt i ljud- och textform. Icke-modersmålstalare gynnas eftersom undertexter förstärker förståelsen av tal med accent eller högt tempo. Äldre användare med åldersrelaterad hörselnedsättning — ett tillstånd som påverkar ungefär en tredjedel av personer över 65 — är också beroende av undertexter.

Överväg ett konkret scenario: en turkisk bank publicerar en video på sin webbplats som förklarar hur man öppnar ett digitalt konto. En potentiell kund som är döv besöker sajten. Utan undertexter kan hon inte förstå något av de talade stegen, kan inte följa processen och kan inte slutföra uppgiften — vilket skapar både ett tillgänglighetsproblem och en förlorad affärsmöjlighet för banken. Med korrekta, synkroniserade undertexter följer hon varje steg, slutför onboarding-processen och blir kund.

Utöver tillgång för personer med funktionsnedsättning ger undertexter mätbara SEO- och användbarhetsfördelar. Undertextfiler i WebVTT- eller SRT-format är maskinläsbara, vilket innebär att sökmotorer kan indexera hela texten i videoinnehållet och förbättra upptäckbarheten. Studier har visat att en majoritet av tittare ser videor i sociala medier utan ljud, vilket gör undertexter till en användbarhetsfunktion för den breda publiken. Undertexter gör det också lättare för sökmotorer och verktyg för tillgänglighetsutvärdering att förstå syftet och innehållet i inbäddade videor, vilket bidrar till övergripande kvalitetssignaler för sidan.

Relaterade Axe-core-regler

WCAG 1.2.2 kräver manuell testning. Det finns ingen automatiserad axe-core-regel som på ett tillförlitligt sätt upptäcker avsaknad eller felaktighet i undertexter för förinspelade synkroniserade medier. Skälen till detta är grundläggande för hur automatiserad testning fungerar:

  • Manuell testning krävs — avsaknad av undertextspår: Ett automatiserat verktyg kan upptäcka att ett <video>-element saknar ett <track kind='captions'>-element, och vissa verktyg kommer att flagga detta som ett potentiellt problem. Verktyget kan dock inte avgöra om videon faktiskt innehåller meningsfullt ljudinnehåll (den kan vara en stum video), om öppna (inbrända) undertexter finns i själva videon, eller om videon kvalificerar sig för undantaget för medialternativ. Mänsklig granskning krävs för att göra den bedömningen.
  • Manuell testning krävs — undertexternas korrekthet och fullständighet: Även när en undertextspårsfil finns och är länkad kan ett automatiserat verktyg inte bedöma om undertexterna korrekt återger det som sägs, om de inkluderar relevanta ljudeffekter och talaridentifiering, eller om de är korrekt synkroniserade med ljudet. En undertextfil som innehåller helt felaktig text, autogenererat nonsens eller undertexter som konsekvent ligger 10 sekunder fel i tid skulle klara en automatiserad kontroll men underkännas mot kriteriet. Endast en mänsklig granskare som tittar på videon samtidigt som hen läser undertexterna kan bedöma korrektheten.
  • Manuell testning krävs — öppna undertexter: Om undertexter är inbrända i själva videofilen (öppna undertexter) har automatiserade verktyg ingen möjlighet att upptäcka detta alls. De ser bara ett <video>-element utan spår och kan inte analysera det visuella innehållet i videoramarna för att avgöra om text finns.

På grund av dessa begränsningar måste WCAG 1.2.2 alltid inkludera ett steg med mänsklig granskning som en del av varje heltäckande granskning. Automatiska skanningar fungerar som en användbar första genomgång för att identifiera uppenbart saknade spårelement, men de kan inte ersätta manuell utvärdering av undertexternas kvalitet, korrekthet och synkronisering.

Hur man testar

  1. Inventera alla synkroniserade medier: Innan du kör något verktyg, granska sidan manuellt för att identifiera varje videoelement — inbäddade <video>-taggar, iframe-inbäddade spelare (YouTube, Vimeo, tredjepart) och alla HTML5-mediaplayers. Lista varje video och notera om den innehåller meningsfullt ljud (dialog, berättarröst, betydelsefulla ljudeffekter). Videor utan ljudspår eller med enbart bakgrundsmusik som inte bär någon informationsmässig betydelse kan behandlas annorlunda, men dokumentera din motivering.
  2. Kör en automatiserad skanning med axe DevTools eller Lighthouse: Öppna axe DevTools i webbläsarens utvecklingsverktyg och kör en fullständig sidskanning. Leta efter eventuella överträdelser eller ofullständiga punkter relaterade till video- eller ljudelement. Lighthouse (körs via Chrome DevTools under kategorin Accessibility audit) kommer på liknande sätt att flagga videor som saknar ett <track>-element. Observera att ett rent automatiserat resultat inte betyder att kriteriet är uppfyllt — det betyder bara att inget uppenbart saknat spår upptäcktes. Behandla automatiserade resultat som en startpunkt, inte en slutsats.
  3. Inspektera HTML-källan: För varje <video>-element på sidan, inspektera DOM:en för att verifiera om ett <track kind='captions'>-element finns och om dess src-attribut pekar på en giltig, tillgänglig undertextfil (WebVTT eller SRT). Kontrollera att attributet srclang är satt till rätt språk. Bekräfta att filen laddas utan nätverksfel genom att öppna URL:en direkt i webbläsaren.
  4. Spela upp videon och utvärdera undertexterna manuellt: Aktivera undertexter i videospelaren (eller bekräfta att de visas automatiskt om öppna undertexter används). Titta på videon i sin helhet — eller på ett statistiskt representativt urval över början, mitten och slutet. För varje segment, verifiera: (a) dialogen är korrekt transkriberad utan betydande fel, (b) talarbyten identifieras där det underlättar förståelsen, (c) meningsfullt icke-tal-ljud beskrivs inom hakparenteser (t.ex. [phone ringing]) och (d) undertexter visas och försvinner i synk med ljudet — inte avsevärt före eller efter de talade orden.
  5. Testa med skärmläsare där det är relevant: Använd NVDA med Firefox, VoiceOver med Safari eller JAWS med Chrome för att navigera till videoelementet. Bekräfta att spelarkontrollerna är tangentbordsåtkomliga och att det går att slå på och av undertexter utan mus. Detta testar användbarheten hos undertextfunktionen utöver dess existens.
  6. Testa inbäddade tredjepartsspelare: För iframes som bäddar in YouTube- eller Vimeo-spelare, öppna videon direkt på plattformen och verifiera att undertexter har laddats upp och är aktiverade som standard eller lätt kan slås på. Autogenererade undertexter på plattformar som YouTube uppfyller inte WCAG 1.2.2 om de inte har granskats och korrigerats för korrekthet.
  7. Dokumentera godkänd/underkänd med bevis: För varje testad video, dokumentera sidans URL, videotitel eller beskrivning, om undertexter fanns och din bedömning av korrektheten. Skärmdumpar eller tidsstämplade anteckningar från granskningen fungerar som revisionsunderlag.

Hur man åtgärdar

HTML5-video utan något undertextspår — Felaktigt

<!-- Fails 1.2.2: video with audio has no caption track at all -->
<video controls width='800'>
  <source src='product-demo.mp4' type='video/mp4'>
  Your browser does not support the video element.
</video>

HTML5-video utan något undertextspår — Korrekt

<!-- Passes 1.2.2: a WebVTT caption track is linked with kind='captions' -->
<video controls width='800'>
  <source src='product-demo.mp4' type='video/mp4'>
  <!-- The track element links the WebVTT file; srclang and label aid player UI -->
  <track
    kind='captions'
    src='product-demo-captions-en.vtt'
    srclang='en'
    label='English Captions'
    default
  >
  Your browser does not support the video element.
</video>

Flerspråkig video med endast subtitle-spår, inga undertexter — Felaktigt

<!-- Fails 1.2.2: kind='subtitles' provides translated dialogue but omits -->
<!-- sound effect descriptions and speaker identification needed for deaf users -->
<video controls width='800'>
  <source src='webinar.mp4' type='video/mp4'>
  <track kind='subtitles' src='webinar-tr.vtt' srclang='tr' label='Turkish'>
</video>

Flerspråkig video med endast subtitle-spår, inga undertexter — Korrekt

<!-- Passes 1.2.2: a dedicated captions track is provided alongside subtitles. -->
<!-- The captions file includes [Speaker: Dr. Aydin], [applause], etc. -->
<video controls width='800'>
  <source src='webinar.mp4' type='video/mp4'>
  <track
    kind='captions'
    src='webinar-captions-tr.vtt'
    srclang='tr'
    label='Turkish Captions'
    default
  >
  <track kind='subtitles' src='webinar-en.vtt' srclang='en' label='English'>
</video>

YouTube-inbäddning som förlitar sig på okorrigerade autogenererade undertexter — Felaktigt

<!-- Fails 1.2.2: uncorrected auto-captions are not considered accurate captions -->
<iframe
  width='800'
  height='450'
  src='https://www.youtube.com/embed/VIDEOID'
  title='Company Introduction Video'
  allowfullscreen
></iframe>

YouTube-inbäddning med verifierade manuellt redigerade undertexter — Korrekt

<!-- Passes 1.2.2 provided that captions have been uploaded or reviewed -->
<!-- in YouTube Studio and confirmed accurate by a human reviewer. -->
<!-- The &cc_load_policy=1 parameter enables captions by default. -->
<iframe
  width='800'
  height='450'
  src='https://www.youtube.com/embed/VIDEOID?cc_load_policy=1&cc_lang_pref=tr'
  title='Company Introduction Video'
  allowfullscreen
></iframe>
<!-- Also ensure in YouTube Studio that the caption track is marked as -->
<!-- human-reviewed and that auto-captions have been corrected. -->

Vanliga misstag

  • Att tillhandahålla en texttranskription istället för synkroniserade undertexter: En transkription som visas under eller bredvid en video uppfyller WCAG 1.2.3 (Audio Description or Media Alternative) i vissa sammanhang, men den uppfyller inte 1.2.2. Undertexter måste vara synkroniserade med videons tidslinje så att texten visas i samma ögonblick som motsvarande ljud förekommer. Ett statiskt textblock uppfyller inte detta krav.
  • Att använda kind='subtitles' istället för kind='captions': Subtitles är utformade för tittare som kan höra ljudet men inte förstår språket — de innehåller vanligtvis endast talad dialog översatt till ett annat språk. Undertexter (captions) är utformade för tittare som inte kan höra ljudet alls — de måste inkludera talaridentifiering, meningsfulla ljudeffekter och annan icke-tal-information. Att ersätta ett undertextspår (captions) med ett subtitle-spår där undertexter krävs är ett vanligt och allvarligt fel.
  • Att förlita sig på okorrigerade autogenererade undertexter från YouTube eller liknande plattformar: Autogenererade undertexter använder taligenkänning och ger ofta upphov till fel, särskilt för teknisk terminologi, egennamn, accenter eller snabbt tal. WCAG kräver att undertexter är korrekta. Autogenererade undertexter som inte har granskats och korrigerats av en människa uppfyller inte korrekthetskravet i 1.2.2.
  • Att inkludera ett <track>-element men peka på en trasig eller saknad VTT-fil: Om src-attributet i track-elementet refererar till en filsökväg som returnerar ett 404-fel kommer undertexterna tyst att misslyckas med att laddas. HTML:en klarar automatiserad granskning, men användaren får inga undertexter. Verifiera alltid att URL:en till undertextfilen fungerar korrekt i produktion.
  • Att utelämna meningsfullt icke-tal-ljud från undertextfiler: En undertextfil som endast transkriberar talade ord men ignorerar viktiga ljud — såsom ett larm, en telefon som ringer, applåder eller en krasch som är central för att förstå videon — uppfyller inte kriteriet. Undertexter måste beskriva all ljudinformation som är nödvändig för att förstå innehållet, inte bara dialogen.
  • Undertexter som är avsevärt osynkroniserade med ljudet: En WebVTT-fil med felaktiga tidsstämpelposter kan visa undertexter sekunder före eller efter motsvarande tal. Detta stör förståelsen och utgör ett misslyckande, även om själva undertexttexten är korrekt. Granska alltid synkroniseringen över hela videons längd, särskilt vid scenbyten och pauser.
  • Att anta att undantaget för medialternativ gäller brett: Vissa team antar att eftersom de har en skriven artikel som åtföljer en video, kvalificerar videon som ett medialternativ och behöver inga undertexter. Undantaget gäller endast när videon inte tillför någon information utöver vad texten redan innehåller, relationen är tydlig för användarna och videon tydligt är märkt som ett alternativ. En video som tillför demonstrationer, talarens tonfall eller visuellt innehåll som inte täcks i texten kvalificerar sig inte.
  • Att placera undertextkontroller som endast är åtkomliga med mus: Även om undertexter finns, om knappen för att aktivera dem i en anpassad videospelare inte är tangentbordsåtkomlig — till exempel ett stylat <div> med en onclick-händelse men utan tabindex='0' eller tangentbordshändelselyssnare — kan användare som är beroende av tangentbordsnavigering inte slå på undertexter. Själva undertextfunktionen måste kunna användas med tangentbord.
  • Att inte testa undertexter i inbäddade eller tredjepartsspelare: Team testar ofta undertextbeteende i sin utvecklingsmiljö men glömmer att produktionsinbäddningar via tredjepartsspelare (Vimeo, Wistia, JW Player) kan ha annat beteende för hur undertexter laddas, standardinställningar eller API-konfigurationer. Testa alltid undertextupplevelsen i den faktiska produktionsinbäddningen.
  • Att endast tillhandahålla undertexter på ett språk när webbplatsen har flerspråkig publik: Även om WCAG inte strikt kräver undertexter på alla språk som en webbplats stödjer, innebär det att endast tillhandahålla undertexter på ett språk när webbplatsen och videoinnehållet finns på till exempel turkiska och engelska att vissa användare får tillgängligt innehåll medan andra inte gör det. Bästa praxis är att tillhandahålla undertextspår som motsvarar varje språkversion av videon.

Relation till Turkiets tillgänglighetsreglering

Turkiets presidentdekret 2025/10, publicerat i den officiella tidningen med nummer 32933 den 21 juni 2025, fastställer bindande krav på webbtillgänglighet för ett brett spektrum av offentliga och privata aktörer verksamma i Turkiet. Dekretet föreskriver efterlevnad av WCAG 2.2 på nivå A som miniminivå, med efterlevnad på nivå AA starkt rekommenderad. WCAG 1.2.2 — Captions (Prerecorded) är ett krav på nivå A, vilket innebär att det är en av de mest grundläggande skyldigheterna enligt dekretet och att bristande efterlevnad utgör en direkt regulatorisk överträdelse.

De aktörer som omfattas av dekretet inkluderar offentliga institutioner och statliga organ på alla nivåer, e-handelsplattformar, banker och finansiella institutioner, sjukhus och vårdgivare, teleoperatörer med 200,000 eller fler abonnenter, licensierade resebyråer, privata transportföretag och privatskolor auktoriserade av Ministry of National Education (MoNE). Offentliga institutioner måste uppnå efterlevnad inom ett år från dekretets publiceringsdatum. Privata aktörer inom de berörda kategorierna har ett tvåårigt fönster för att uppnå efterlevnad.

För organisationer i dessa kategorier är den praktiska innebörden av WCAG 1.2.2 tydlig: allt videoinnehåll som publiceras på en webbplats eller digital plattform och som innehåller meningsfullt ljud måste ha korrekta undertexter. Detta är särskilt betydelsefullt för sektorer som bankväsendet, där produktförklaringar och onboarding-videor är vanliga; hälso- och sjukvård, där patientutbildningsvideor ofta publiceras online; och e-handel, där produktdemonstrationsvideor är centrala för köpupplevelsen. En bank som publicerar en otextad videotutorial om hur man använder mobilbank, eller ett sjukhus som lägger upp en otextad video om postoperativa vårdinstruktioner, skulle stå i direkt strid med dekretets krav på nivå A.

Dekretet fastställer ingen separat turkisk standard — det hänvisar direkt till de internationellt erkända WCAG 2.2-kriterierna, vilket innebär att turkiska efterlevnadsteam bör följa specifikationen för WCAG 1.2.2 så som den definieras av W3C och beskrivs i denna artikel. Organisationer bör dokumentera sina rutiner för undertextning, föra register över versioner av undertextfiler tillsammans med videoinnehåll och inkludera kontroll av undertexternas korrekthet som ett standardsteg i arbetsflödet för publicering av videoinnehåll. Tillgänglighetsrevisioner som genomförs för regulatoriska efterlevnadssyften måste inkludera manuell granskning av undertexternas korrekthet, eftersom automatiserade verktyg i sig inte är tillräckliga för att visa efterlevnad av detta kriterium.