Kryteria sukcesu WCAG · Level A
WCAG 1.2.1: Tylko audio i tylko wideo (nagranie)
WCAG 1.2.1 wymaga, aby nagrane wcześniej treści wyłącznie dźwiękowe oraz wyłącznie wideo miały alternatywę tekstową lub medialną, tak aby użytkownicy, którzy nie mogą słyszeć lub widzieć mediów, nadal mogli uzyskać dostęp do informacji. Jest to wymaganie na poziomie A, co oznacza, że stanowi minimalną podstawę zgodności z wytycznymi dostępności stron internetowych.
Co oznacza ta zasada
WCAG 1.2.1 dotyczy dwóch odrębnych typów mediów czasowych: treści wyłącznie dźwiękowych (takich jak odcinek podcastu, nagrane ogłoszenie telefoniczne lub utwór muzyczny przekazujący istotne informacje) oraz treści wyłącznie wideo (takich jak niema animacja instruktażowa lub pozbawiony głosu klip prezentujący produkt). Kryterium wymaga, aby każdemu z tych typów mediów towarzyszyła równoważna alternatywa, która udostępnia te same informacje osobom, które nie mogą odebrać oryginalnego formatu.
Dla nagranych wcześniej treści wyłącznie dźwiękowych wymaganą alternatywą jest tekstowy transkrypt. Transkrypt musi zawierać wszystkie wypowiedziane słowa, identyfikować mówiących tam, gdzie ma to znaczenie, oraz opisywać wszelkie istotne dźwięki niewerbalne (takie jak oklaski, alarmy czy muzyka niosąca wartość informacyjną). Sam tytuł lub krótki opis nie są wystarczające; transkrypt musi być pełnym tekstowym odpowiednikiem wszystkiego, co słyszy słuchacz.
Dla nagranych wcześniej treści wyłącznie wideo (wideo bez ścieżki dźwiękowej lub ze ścieżką dźwiękową, która nie zawiera istotnych informacji) wymaganą alternatywą jest tekstowy transkrypt lub ścieżka z audiodeskrypcją. Audiodeskrypcja opowiada treść wizualną — opisuje działania na ekranie, zmiany scen, tekst pojawiający się na ekranie oraz inne szczegóły wizualne — tak aby osoba niewidoma lub słabowidząca mogła zrozumieć treść wyłącznie za pomocą dźwięku.
Spełnienie kryterium wymaga, aby alternatywa była wyraźnie powiązana z mediami, łatwa do znalezienia i w pełni równoważna pod względem treści informacyjnej. Alternatywa może być udostępniona bezpośrednio na stronie, jako podlinkowany dokument lub jako dodatkowa ścieżka dźwiękowa, o ile jest łatwo dostępna z tej samej strony lub interfejsu odtwarzacza.
Niespełnienie ma miejsce, gdy: nie zapewniono żadnej alternatywy; alternatywa jest niekompletna lub pomija istotne informacje; alternatywa istnieje, ale jest tak trudna do zlokalizowania, że w praktyce wymaga od użytkownika wiedzy o jej istnieniu; lub alternatywa opisuje media bez odtworzenia ich faktycznej treści (na przykład napisanie „prowadzący wyjaśnia, jak zresetować urządzenie” zamiast podania rzeczywistych instrukcji krok po kroku).
WCAG 1.2.1 zawiera jeden oficjalny wyjątek: jeśli treść wyłącznie dźwiękowa lub wyłącznie wideo sama w sobie pełni rolę alternatywy medialnej dla tekstu, który już znajduje się na stronie, i jest to wyraźnie oznaczone, nie jest wymagana dodatkowa alternatywa. Na przykład krótki film, który wizualnie demonstruje dokładnie to, co pobliski pisemny samouczek opisuje w całości, może być zwolniony z tego wymogu, pod warunkiem że etykieta jasno wskazuje ten związek wszystkim użytkownikom.
Ważne jest również, że to kryterium obejmuje wyłącznie treści nagrane wcześniej — transmisje na żywo wyłącznie dźwiękowe i wyłącznie wideo są traktowane osobno w WCAG 1.2.9 i nie mieszczą się w zakresie tego punktu. Treści zawierające zarówno dźwięk, jak i obraz (media zsynchronizowane) podlegają WCAG 1.2.2 (Napisy) oraz 1.2.3 (Audiodeskrypcja lub alternatywa medialna), a nie 1.2.1.
Dlaczego to ma znaczenie
Treści wyłącznie dźwiękowe i wyłącznie wideo tworzą bariery dla wielu odrębnych grup użytkowników, a zrozumienie doświadczeń każdej z nich jest kluczowe, aby docenić, dlaczego to kryterium istnieje na fundamentalnym poziomie A.
Osoby Głuche i słabosłyszące nie mają dostępu do informacji zawartych w nagranych wcześniej treściach wyłącznie dźwiękowych bez tekstowego transkryptu. Dla osoby, która od urodzenia jest głęboko Głucha, wywiad podcastowy, nagrzone wyjaśnienie obsługi klienta czy odpowiedź FAQ wyłącznie w formie audio są po prostu niedostępne — jakby treść w ogóle nie istniała. Według Światowej Organizacji Zdrowia ponad 1,5 miliarda ludzi na świecie doświadcza pewnego stopnia ubytku słuchu, z czego około 430 milionów wymaga rehabilitacji. Tylko w Turcji badania wskazują, że miliony obywateli żyją z istotnym ubytkiem słuchu, z których wielu polega na Tureckim Języku Migowym lub tekście pisanym jako podstawowym sposobie komunikacji.
Osoby niewidome i słabowidzące są główną grupą docelową alternatyw dla treści wyłącznie wideo. Niemy film pokazujący montaż produktu, animacja wizualizująca dane czy samouczek wyłącznie wizualny są pozbawione sensu, gdy są przekazywane jedynie przez czytnik ekranu ogłaszający obecność elementu wideo. Bez audiodeskrypcji lub tekstowego transkryptu użytkownicy ci nie otrzymują z treści żadnych informacji.
Osoby z niepełnosprawnościami poznawczymi i trudnościami w uczeniu się często odnoszą korzyści z udostępniania informacji w wielu formatach. Osoba z dysleksją może uznać, że łatwiej jest wysłuchać audiodeskrypcji niż śledzić długi ciąg wizualny, podczas gdy inny użytkownik może preferować pisemny transkrypt krok po kroku, który może wielokrotnie czytać we własnym tempie. Zapewnienie alternatyw wspiera szersze spektrum stylów przetwarzania informacji.
Ograniczenia sytuacyjne i środowiskowe tworzą również szeroki przypadek użyteczności, wykraczający daleko poza osoby z trwałymi niepełnosprawnościami. Ktoś w cichej bibliotece lub biurze typu open space nie może odtwarzać treści audio i ogromnie korzysta z transkryptu. Użytkownik na wolnym łączu mobilnym, który nie może zbuforować wideo, może natychmiast przeczytać tekstową alternatywę. Użytkownik, dla którego język użyty w nagraniu nie jest ojczysty, może uznać, że znacznie łatwiej jest przeczytać transkrypt niż śledzić szybko wypowiadane treści.
Rozważmy konkretny scenariusz z życia: strona internetowa tureckiego banku publikuje nagrany wcześniej przewodnik audio wyjaśniający, jak aktywować nową kartę debetową. Klient, który jest Głuchy, otrzymuje ten przewodnik w ramach powitalnego e-maila. Bez transkryptu nie ma on możliwości dokończenia aktywacji bez zadzwonienia na infolinię — proces ten sam w sobie może stwarzać bariery dostępności. Zapewnienie dobrze zorganizowanego tekstowego transkryptu całkowicie eliminuje tę zależność i zapewnia klientowi równorzędną obsługę.
Z perspektywy SEO tekstowe transkrypty są w pełni indeksowane przez wyszukiwarki. Treści audio i wideo bez transkryptów stanowią niewykorzystaną szansę na widoczność w wynikach wyszukiwania organicznego. Transkrypt opublikowany obok odcinka podcastu lub filmu instruktażowego w praktyce podwaja ilość treści możliwej do zindeksowania na stronie i może znacząco poprawić trafność słów kluczowych dla zapytań związanych z tematyką danego medium.
Powiązane reguły Axe-core
WCAG 1.2.1 wymaga testów manualnych, ponieważ narzędzia automatyczne nie są w stanie ocenić treści ani kompletności alternatywy dla mediów. Automatyczny skaner może wykryć obecność elementu <video> lub <audio>, ale nie jest w stanie stwierdzić, czy podlinkowany transkrypt dokładnie odzwierciedla całą ścieżkę dźwiękową ani czy audiodeskrypcja obejmuje wszystkie istotne zdarzenia wizualne. Poniżej przedstawiono kwestie istotne dla podejścia axe-core do tego kryterium.
- Nie istnieje dedykowana zautomatyzowana reguła axe-core dla WCAG 1.2.1. Axe-core i silnik Deque axe DevTools oznaczają to kryterium jako wymagające przeglądu manualnego. Jest to celowy i prawidłowy wybór projektowy: w pełni zautomatyzowana reguła generowałaby niedopuszczalnie wysoki odsetek fałszywych trafień lub fałszywych negatywów. Skaner nie może „przeczytać” pliku audio ani „obejrzeć” wideo, aby zweryfikować, czy transkrypt jest kompletny i dokładny. W rezultacie każde narzędzie audytowe, które twierdzi, że automatycznie zalicza lub oblewa WCAG 1.2.1 bez udziału człowieka, powinno być traktowane z dużą ostrożnością.
- Co narzędzia automatyczne mogą sygnalizować pomocniczo: Niektóre narzędzia, w tym axe w trybie best-practice, oznaczają elementy
<audio>i<video>, które nie mają żadnej powiązanej treści tekstowej w bezpośrednim kontekście DOM. Jest to użyteczna wskazówka do przeglądu manualnego, ale pozytywna flaga nie oznacza, że transkrypt jest odpowiedni, a brak flagi nie oznacza, że transkrypt istnieje — podlinkowany transkrypt na innej stronie nie będzie widoczny dla skanera na poziomie elementu. - Testy manualne są wymagane, ponieważ: Ocena tego kryterium wymaga recenzenta, który może w całości zapoznać się z treścią audio lub wideo, a następnie porównać ją linijka po linijce z dostarczoną alternatywą, aby potwierdzić równoważność. Recenzent musi również ocenić, czy alternatywa jest łatwa do zlokalizowania z poziomu elementu multimedialnego, co wymaga nawigowania po stronie tak, jak robiłby to użytkownik — czego żadne obecne narzędzie automatyczne nie jest w stanie wiarygodnie odtworzyć.
Jak testować
- Uruchom skan automatyczny jako punkt wyjścia. Użyj axe DevTools, Lighthouse lub panelu audytu Accsible, aby przeskanować stronę. W wynikach wyszukaj oznaczone elementy
<audio>lub<video>. Pamiętaj, że brak problemów wykrytych automatycznie nie potwierdza zgodności z 1.2.1 — oznacza jedynie, że nie wykryto oczywistych problemów strukturalnych. Wykorzystaj skan do stworzenia inwentarza wszystkich elementów multimedialnych na stronie, które wymagają przeglądu manualnego. - Zidentyfikuj wszystkie nagrane wcześniej treści wyłącznie dźwiękowe i wyłącznie wideo. Ręcznie przejrzyj kod źródłowy strony i jej wyrenderowaną wersję. Wyszukaj elementy
<audio>, elementy<video>, w których ścieżka wideo nie zawiera istotnego dźwięku, osadzone odtwarzacze mediów (takie jak widżety SoundCloud lub Spotify) oraz wszelkie elementy<iframe>ładujące treści audio lub wideo z zewnętrznych źródeł. - Dla każdego elementu wyłącznie dźwiękowego zlokalizuj powiązany transkrypt. Transkrypt może znajdować się bezpośrednio na stronie, w sekcji rozwijanej lub być podlinkowany za pomocą znacznika kotwicy w pobliżu odtwarzacza. Przejdź do transkryptu i przeczytaj go w całości, jednocześnie słuchając nagrania. Potwierdź, że każde wypowiedziane słowo zostało ujęte, wszyscy mówiący są zidentyfikowani tam, gdzie ma to znaczenie, a wszystkie istotne dźwięki niewerbalne zostały opisane.
- Dla każdego elementu wyłącznie wideo zlokalizuj powiązaną alternatywę. Ustal, czy zapewniono tekstowy transkrypt, czy ścieżkę z audiodeskrypcją. Jeśli używana jest ścieżka z audiodeskrypcją, włącz ją w odtwarzaczu i oglądaj wideo, słuchając opisu. Potwierdź, że wszystkie istotne zdarzenia wizualne — działania, zmiany scen, tekst na ekranie, informacje graficzne — są opisane z wystarczającą szczegółowością, aby osoba niewidoma mogła zrozumieć treść bez oglądania wideo.
- Przetestuj z czytnikiem ekranu, aby zweryfikować możliwość odnalezienia alternatywy. Używając NVDA z Firefoxem, VoiceOver z Safari na macOS/iOS lub JAWS z Chrome, przejdź do elementu multimedialnego, korzystając wyłącznie z klawiatury (Tab, klawisze strzałek). Bez użycia myszy sprawdź, czy możesz zlokalizować link do transkryptu lub audiodeskrypcji z poziomu odtwarzacza, używając jedynie nawigacji klawiaturą i komunikatów czytnika ekranu. Jeśli do alternatywy nie można dotrzeć bez myszy, kryterium nie jest spełnione, nawet jeśli treść alternatywy jest merytorycznie odpowiednia.
- Sprawdź wyjątek dotyczący oznakowania. Jeśli transkrypt lub alternatywa są nieobecne, zweryfikuj, czy element multimedialny jest wyraźnie oznaczony jako alternatywa medialna dla sąsiadującej treści tekstowej na tej samej stronie. Jeśli tak, potwierdź, że otaczający tekst jest kompletnym odpowiednikiem treści multimedialnej i że oznaczenie jest postrzegalne dla wszystkich użytkowników.
Jak naprawić
Podcast lub nagrana narracja wyłącznie audio — niepoprawne
<!-- No transcript provided; the audio content is completely inaccessible
to deaf and hard-of-hearing users -->
<audio controls src='welcome-guide.mp3'>
Your browser does not support the audio element.
</audio>
Podcast lub nagrana narracja wyłącznie audio — poprawne
<!-- A full text transcript is provided immediately after the player,
making it discoverable by keyboard and screen reader users
without requiring any additional navigation -->
<figure>
<figcaption>Welcome Guide Audio — Card Activation Instructions</figcaption>
<audio controls src='welcome-guide.mp3'>
Your browser does not support the audio element.
</audio>
</figure>
<details>
<summary>Read the full transcript of this audio guide</summary>
<div>
<p><strong>Narrator:</strong> Welcome to your new debit card activation guide.
To begin, locate the 16-digit card number on the front of your card.</p>
<p><strong>Narrator:</strong> Enter this number in the field provided on
the activation screen, then press Confirm. [Confirmation chime sounds.]</p>
<p><strong>Narrator:</strong> Your card is now active and ready for use.</p>
</div>
</details>
Niemy film instruktażowy (wyłącznie wideo) — niepoprawne
<!-- Silent animation with no audio description or text transcript.
A blind user navigating with a screen reader will only hear
"video" announced — no information about the content is conveyed. -->
<video controls width='640' height='360'>
<source src='assembly-instructions.mp4' type='video/mp4'>
</video>
Niemy film instruktażowy (wyłącznie wideo) z tekstowym transkryptem — poprawne
<!-- A text transcript describing all meaningful visual actions is
linked immediately below the video player. The link text clearly
communicates the purpose of the destination. -->
<video controls width='640' height='360' aria-labelledby='video-title'>
<source src='assembly-instructions.mp4' type='video/mp4'>
</video>
<p id='video-title'>Product Assembly: Attaching the Base Unit</p>
<p>
<a href='assembly-transcript.html'>
View the full text description of this assembly video
</a>
</p>
Niemy film z wbudowaną ścieżką audiodeskrypcji — poprawne
<!-- For users who prefer audio, a described audio track is offered
as a <track> element with kind='descriptions'.
The text transcript link is also retained for deaf-blind users
and those using text-only browsing. -->
<video controls width='640' height='360'>
<source src='product-demo-silent.mp4' type='video/mp4'>
<track
kind='descriptions'
src='product-demo-descriptions.vtt'
srclang='en'
label='Audio Description (English)'
>
<track
kind='descriptions'
src='product-demo-descriptions-tr.vtt'
srclang='tr'
label='Sesli Betimleme (Türkçe)'
>
</video>
<p>
<a href='product-demo-transcript.html'>
Read the full text description of this product demonstration
</a>
</p>
Typowe błędy
- Zapewnienie streszczenia zamiast pełnego transkryptu. Napisanie krótkiego akapitu w rodzaju „To nagranie wyjaśnia naszą politykę zwrotów” nie jest równoważną alternatywą. Transkrypt musi odtworzyć faktyczną treść — każde zdanie, każdą instrukcję, każdy istotny szczegół — tak aby użytkownik, który nie słyszy dźwięku, niczego nie tracił, czytając transkrypt zamiast słuchać nagrania.
- Pomijanie niewerbalnych zdarzeń dźwiękowych w transkryptach. Jeśli nagranie zawiera sygnał ostrzegawczy, wiwatujący tłum, dzwonek do drzwi lub muzykę w tle sygnalizującą przejście, należy to odnotować w transkrypcie za pomocą opisów w nawiasach, takich jak [słychać alarm] lub [oklaski]. Pominięcie tych elementów sprawia, że transkrypt jest niekompletny informacyjnie.
- Umieszczanie transkryptu na zupełnie osobnej stronie bez widocznego, dostępnego z klawiatury linku. Jeśli użytkownik musi z góry wiedzieć, że transkrypt istnieje, i opuścić stronę z mediami, aby go znaleźć, możliwość jego odnalezienia jest niewystarczająca. Link do alternatywy musi znajdować się bezpośrednio obok elementu multimedialnego i być osiągalny z klawiatury.
- Zakładanie, że element
<video>z niemą ścieżką jest objęty napisami. Napisy (WCAG 1.2.2) dotyczą mówionego dźwięku w mediach zsynchronizowanych. Prawdziwie nieme wideo — takie, które nie zawiera żadnego istotnego dźwięku — jest treścią wyłącznie wideo i wymaga własnego opisu tekstowego lub audiodeskrypcji zgodnie z 1.2.1. Napisy ciszy nie przekazują żadnych informacji. - Używanie automatycznie generowanych transkryptów z narzędzi rozpoznawania mowy bez weryfikacji. Maszynowo generowane transkrypty z usług takich jak automatyczne napisy YouTube czy interfejsy API transkrypcji AI często zawierają błędy w nazwach własnych, terminologii technicznej i niestandardowym języku. Opublikowanie niezweryfikowanego automatycznego transkryptu zawierającego istotne błędy nie spełnia kryterium, ponieważ niedokładny transkrypt nie jest równoważną alternatywą.
- Brak identyfikacji mówiących w nagraniach audio z wieloma osobami. Transkrypt, który wygląda jak jeden nieprzerwany blok tekstu, bez wskazania, kto mówi, jest mylący i może być niejednoznaczny znaczeniowo. Etykiety mówiących powinny być stosowane konsekwentnie w każdym nagraniu, w którym występuje więcej niż jeden głos.
- Traktowanie atrybutu
altobrazu plakatowego jako substytutu transkryptu wideo. Atrybutaltobrazu plakatowego elementu<video>opisuje statyczną miniaturę, a nie samą treść wideo. W żadnej interpretacji nie spełnia on wymogu alternatywy dla mediów zgodnie z 1.2.1. - Zapewnienie audiodeskrypcji, która opisuje jedynie scenerię i ignoruje tekst na ekranie. Jeśli nieme wideo wyświetla ważny tekst — numery kroków, etykiety, wymiary, komunikaty o błędach — audiodeskrypcja lub transkrypt muszą ten tekst wyraźnie odczytać. Opisanie sceny wizualnej bez transkrypcji tekstu na ekranie pozostawia kluczowe informacje niedostępne.
- Oznaczanie treści jako zwolnionej z wymogu bez potwierdzenia pełnej równoważności. Wyjątek dla alternatyw medialnych wobec tekstu ma zastosowanie tylko wtedy, gdy tekst na stronie jest kompletnym odpowiednikiem treści multimedialnej. Jeśli tekst na stronie obejmuje jedynie część tego, co pokazuje wideo, wyjątek nie ma zastosowania i alternatywa jest nadal wymagana dla fragmentów nieobjętych tekstem.
- Brak zapewnienia alternatyw w języku tureckim dla treści medialnych w języku tureckim. Gdy treści wyłącznie dźwiękowe lub wyłącznie wideo są w języku tureckim, alternatywa również powinna być w języku tureckim (lub przynajmniej w głównym języku grupy docelowej). Zapewnienie wyłącznie angielskiego transkryptu dla tureckiej treści audio nie stanowi równoważnej alternatywy dla użytkowników mówiących po turecku.
Związek z tureckimi regulacjami dotyczącymi dostępności
Turecka Okrężnica Prezydencka 2025/10, opublikowana w Dzienniku Urzędowym nr 32933 w dniu 21 czerwca 2025 r., ustanawia obowiązujące ramy prawne dla dostępności cyfrowej, zgodne z WCAG 2.2. WCAG 1.2.1 jest kryterium poziomu A, co plasuje je w najbardziej podstawowej grupie wymagań określonych w tej okrężnicy. Zgodność na poziomie A stanowi absolutne minimum akceptowalnego standardu — naruszenia na tym poziomie są traktowane jako fundamentalne bariery, które całkowicie uniemożliwiają dostęp dotkniętym nimi użytkownikom.
Okrężnica ma szerokie zastosowanie zarówno w sektorze publicznym, jak i prywatnym. Instytucje publiczne — w tym wszystkie ministerstwa, agencje rządowe, gminy i przedsiębiorstwa państwowe — są zobowiązane do osiągnięcia pełnej zgodności z poziomem A w ciągu jednego roku od daty publikacji okrężnicy. Podmioty sektora prywatnego objęte okrężnicą otrzymują dwuletni okres przejściowy.
Podmioty sektora prywatnego wyraźnie objęte Okrężnicą Prezydencką 2025/10 obejmują: platformy e-commerce działające w Turcji niezależnie od miejsca rejestracji; banki i instytucje finansowe regulowane tureckim prawem bankowym; szpitale i prywatnych świadczeniodawców opieki zdrowotnej; przedsiębiorstwa telekomunikacyjne mające 200 000 lub więcej abonentów; biura podróży działające na podstawie tureckich zezwoleń turystycznych; prywatne przedsiębiorstwa transportu pasażerskiego; oraz prywatne instytucje edukacyjne upoważnione przez Ministerstwo Edukacji Narodowej (MoNE).
Dla tych podmiotów WCAG 1.2.1 ma bezpośrednie i praktyczne konsekwencje. Bank, który publikuje przewodniki wyłącznie audio dotyczące funkcji bankowości mobilnej bez transkryptów, szpital, który udostępnia nieme samouczki wideo wyłącznie w formie wizualnej dotyczące procedur przyjęcia pacjenta, czy operator telekomunikacyjny, który używa nagranych ogłoszeń wyłącznie audio na swoim portalu wsparcia bez tekstowych alternatyw — każdy z nich będzie bezpośrednio naruszał to wymaganie od momentu upływu odpowiedniego terminu na osiągnięcie zgodności.
Brak zgodności z okrężnicą może skutkować sankcjami administracyjnymi i konsekwencjami wizerunkowymi, a także narażeniem na skargi składane za pośrednictwem tureckiego Urzędu ds. Technologii Informacyjnych i Komunikacyjnych (BTK) oraz Prezydenckiego Biura Transformacji Cyfrowej. Biorąc pod uwagę, że 1.2.1 jest jednym z najprostszych do naprawienia kryteriów — wymagającym stworzenia tekstowego transkryptu lub audiodeskrypcji, a nie złożonych zmian technicznych — organizacje powinny priorytetowo potraktować audyt wszystkich zasobów wyłącznie dźwiękowych i wyłącznie wideo w swoich serwisach cyfrowych jako wczesny i wysokoefektywny krok w programach zapewniania zgodności z wymogami dostępności.
Zespoły redakcyjne, a nie tylko deweloperzy, odgrywają kluczową rolę w osiągnięciu zgodności z 1.2.1. Transkrypty muszą być tworzone, weryfikowane pod kątem dokładności i aktualizowane wraz z modyfikacją treści multimedialnych. Organizacje powinny ustanowić procesy redakcyjne, w których tworzenie transkryptów jest obowiązkowym etapem produkcji i publikacji treści, równorzędnym pod względem ważności z metadanymi SEO czy przeglądem merytorycznym — i upewnić się, że procesy te uwzględniają treści medialne w języku tureckim obok innych języków używanych na platformie.
Źródła i odniesienia
- W3C Understanding 1.2.1 Audio-only and Video-only (Prerecorded)
- W3C Techniques for 1.2.1
- WebAIM: Captions, Transcripts, and Audio Descriptions
- MDN: HTMLMediaElement — The HTML audio and video elements
- MDN: The track element for timed text tracks
- W3C Technique G158: Providing an alternative for time-based media for audio-only content
- W3C Technique G159: Providing an alternative for time-based media for video-only content
