Critérios de Sucesso WCAG · Level AA
WCAG 1.2.5: Audiodescrição (Pré-gravado)
A WCAG 1.2.5 exige que seja fornecida audiodescrição para todo o conteúdo de vídeo pré-gravado em mídia sincronizada, garantindo que pessoas cegas ou com baixa visão possam acessar informações visuais que não são transmitidas apenas pela faixa de áudio.
- Level AA
O Que Esta Regra Significa
\nWCAG 1.2.5 — Descrição em Áudio (Pré-gravada) é um critério de sucesso de Nível AA sob o Princípio 1: Perceptível. Exige que seja fornecida descrição em áudio para toda mídia sincronizada pré-gravada que contenha vídeo. Descrição em áudio é uma faixa de narração adicionada ao áudio principal de um vídeo que descreve informações visuais importantes — como ações, mudanças de cena, texto na tela, expressões faciais e outros elementos visuais — que não são comunicadas pelo diálogo ou áudio existentes.
\nO critério se aplica à mídia sincronizada, definida pelo WCAG como conteúdo que combina faixas de áudio e vídeo sincronizadas entre si ou com componentes interativos baseados em tempo. Isso inclui tutoriais em vídeo, filmes instrucionais, webinars gravados, vídeos promocionais, demonstrações de produtos e telejornais. Não se aplica a conteúdo apenas de áudio, conteúdo apenas de vídeo (que é tratado separadamente por 1.2.1) ou transmissões de vídeo ao vivo (que são cobertas, se for o caso, por 1.2.6 no Nível AAA).
\nPara aprovação, é necessário que, para cada vídeo pré-gravado com áudio, exista uma faixa adicional de descrição em áudio que possa ser ativada pelo usuário, ou uma versão do vídeo com descrição em áudio estendida, em que foram inseridas pausas para permitir que o narrador tenha tempo suficiente para descrever conteúdo visual complexo. Alternativamente, se a faixa de áudio existente já transmite completamente todas as informações visuais presentes no vídeo — ou seja, nada de significativo acontece visualmente sem ser descrito na narração ou diálogo existentes — então nenhuma descrição em áudio adicional é necessária.
\nHá falha quando informações visuais críticas para a compreensão do conteúdo do vídeo são apresentadas apenas pela faixa de imagem, sem descrição verbal correspondente. Por exemplo, um vídeo de treinamento que mostra uma pessoa apresentadora clicando em etapas de um software na tela, enquanto diz apenas "clique aqui, depois selecione esta opção", falha neste critério porque uma pessoa cega ouvindo apenas a faixa de áudio não teria como entender em qual elemento da interface está sendo clicado ou o que está sendo selecionado.
\nHá uma exceção oficial importante: se a mídia for em si uma alternativa em mídia para texto — ou seja, um vídeo foi produzido especificamente para servir como equivalente acessível a um documento em texto — e estiver claramente rotulada como tal, então a descrição em áudio não é exigida para esse conteúdo.
\n\nPor Que Isso Importa
\nA descrição em áudio é principalmente uma exigência para pessoas que são cegas ou têm deficiência visual significativa. De acordo com a Organização Mundial da Saúde, aproximadamente 2,2 bilhões de pessoas no mundo têm algum tipo de deficiência visual. Para essas pessoas, a experiência padrão de um vídeo sem descrição em áudio pode ser desorientadora ou totalmente desinformativa quando a narrativa depende de contexto visual. Uma pessoa cega que depende de um leitor de tela pode detectar que há um vídeo em uma página, mas, sem descrição em áudio, ouvirá apenas o diálogo ou sons ambientais capturados — deixando lacunas que podem tornar o conteúdo sem sentido ou enganoso.
\nConsidere um cenário concreto do mundo real: um banco turco publica um vídeo tutorial sobre como configurar a autenticação em duas etapas em seu app móvel. O vídeo mostra cada tela do app em sequência, com um narrador dizendo coisas como "agora toque no ícone de configurações" ou "você verá uma mensagem de confirmação". Sem descrição em áudio, uma pessoa cega cliente do banco, usando um leitor de tela, não consegue determinar onde o ícone de configurações está localizado visualmente, o que a mensagem de confirmação diz ou como são as telas. Ela fica efetivamente excluída do tutorial de autoatendimento e pode precisar ligar para o suporte ao cliente — gerando fricção, custo e uma experiência de uso pior.
\nAlém das pessoas que são completamente cegas, a descrição em áudio também beneficia pessoas com deficiências cognitivas que podem achar mais fácil processar informações quando elas são descritas verbalmente, além de serem mostradas visualmente. Também pode beneficiar pessoas em ambientes apenas de áudio que não conseguem ver uma tela, como ao dirigir, ou pessoas que têm dificuldade em ler texto na tela com rapidez suficiente à medida que ele aparece no vídeo.
\nDo ponto de vista de SEO e descobribilidade, conteúdo em vídeo que inclui transcrições ou roteiros de descrição contribui com texto adicional que mecanismos de busca podem indexar, potencialmente melhorando a classificação para consultas relevantes. Mais importante, fornecer descrição em áudio sinaliza para pessoas usuárias e órgãos reguladores que sua plataforma leva a inclusão a sério — o que é cada vez mais uma expectativa comercial e legal em muitos mercados.
\n\nRegras Relacionadas do Axe-core
\nWCAG 1.2.5 exige testes manuais. Ferramentas automatizadas como axe-core não podem determinar programaticamente se a descrição em áudio presente em um vídeo é precisa, suficiente ou significativa — esse julgamento exige uma pessoa revisora que possa assistir ao vídeo e avaliar se todas as informações visuais são comunicadas por meio do áudio. Não há regra do axe-core que possa sinalizar automaticamente uma faixa de descrição em áudio ausente ou inadequada.
\n- \n
- Revisão manual necessária — auditoria de conteúdo visual: Uma pessoa testadora deve assistir ao vídeo completo com a tela desligada (ou com apenas a faixa de descrição em áudio ativada) e avaliar se todas as informações apenas visuais — incluindo texto na tela, ações da pessoa que fala, mudanças de cena, gráficos, diagramas e sinais não verbais — são transmitidas de forma adequada. Ferramentas automatizadas não conseguem analisar o significado semântico de um quadro de vídeo nem avaliar se a narração corresponde ao que é mostrado visualmente. \n
- Revisão manual necessária — detecção de faixa: Embora o axe-core possa verificar a presença de um elemento
<track>comkind='descriptions'em um elemento<video>, ele não pode verificar se o arquivo da faixa de descrição realmente contém descrições significativas e precisas. Um vídeo pode ter uma faixa de descrições que esteja vazia, seja um texto sem sentido gerado por máquina ou simplesmente não esteja sincronizada — todos esses casos passariam na detecção automatizada, mas falhariam no critério na prática. \n - Revisão manual necessária — verificação de versão alternativa: Algumas implementações fornecem descrição em áudio oferecendo uma URL ou versão separada do vídeo com a descrição incorporada à faixa de áudio principal. Ferramentas automatizadas não têm como detectar a existência de, ou navegar até, uma versão alternativa de um recurso de vídeo vinculada em outro lugar na página. \n
Como Testar
\n- \n
- Identifique toda mídia sincronizada pré-gravada na página. Analise a página em busca de elementos
<video>, iframes incorporados (YouTube, Vimeo, players de terceiros) e quaisquer implementações de player de vídeo personalizado. Anote cada vídeo que contenha faixas de áudio e vídeo e seja pré-gravado, e não ao vivo. \n - Execute uma varredura automatizada com axe DevTools ou Lighthouse. Abra as ferramentas de desenvolvedor do navegador, execute o axe DevTools na página e filtre os resultados para quaisquer regras relacionadas a elementos de vídeo ou mídia. Varreduras automatizadas podem apontar ausência de elementos
<track>ou de papéis ARIA em players de vídeo personalizados, mas não confirmarão a adequação da descrição em áudio. Trate os resultados automatizados apenas como ponto de partida. \n - Assista a cada vídeo com a tela encoberta ou olhos fechados. Ouça apenas o áudio — incluindo qualquer faixa de descrição em áudio, se houver. Pergunte a si mesmo: cada informação visual significativa é comunicada por som? Você consegue acompanhar toda a narrativa, entender todas as ações na tela e identificar todo o texto e gráficos exibidos apenas pelo áudio? \n
- Verifique se há uma faixa de descrição em áudio. Inspecione os controles do player de vídeo em busca de um botão ou menu que ative a descrição em áudio. Para vídeo HTML5, inspecione o DOM em busca de um elemento
<track kind='descriptions'>. Ative a faixa de descrições e verifique se ela reproduz uma narração precisa e sincronizada do conteúdo visual. \n - Verifique se há uma versão alternativa com descrição. Procure um link ou botão claramente rotulado, adjacente ao vídeo, com texto como "Assistir com descrição em áudio" ou "Versão com descrição em áudio". Siga esse link e verifique se a versão alternativa contém descrição em áudio precisa e completa incorporada à sua faixa de áudio. \n
- Teste com um leitor de tela. Usando NVDA com Firefox, VoiceOver com Safari ou JAWS com Chrome, navegue até o elemento de vídeo. Confirme se o leitor de tela anuncia o controle de vídeo e qualquer opção de faixa de descrição associada. Reproduza o vídeo e verifique se a faixa de descrição é audível e sincronizada. Verifique se o leitor de tela não suprime nem entra em conflito com o áudio da descrição. \n
- Avalie o caso de exceção. Se o vídeo for apresentado como uma alternativa em mídia para um documento em texto, confirme se ele está rotulado como tal diretamente ao lado do vídeo. Se estiver rotulado corretamente e representar totalmente o mesmo conteúdo do texto, a descrição em áudio não é exigida — mas verifique se essa rotulagem está presente e é inequívoca. \n
Como Corrigir
\n\nVídeo sem faixa de descrição em áudio — Incorreto
\n<!-- A training video with significant visual content and no audio description -->\n<video controls width='800'>\n <source src='training-video.mp4' type='video/mp4'>\n <track kind='subtitles' src='subtitles-en.vtt' srclang='en' label='English'>\n</video>\n<!-- Fails 1.2.5: subtitles are present but no descriptions track exists.\n Visual-only information in the video is inaccessible to blind users. -->\n\nVídeo com faixa de descrição em áudio adicionada — Correto
\n<!-- A training video with an audio description track provided -->\n<video controls width='800'>\n <source src='training-video.mp4' type='video/mp4'>\n <track kind='subtitles' src='subtitles-en.vtt' srclang='en' label='English'>\n <!-- Audio description track added with kind='descriptions' -->\n <track kind='descriptions' src='audio-description-en.vtt' srclang='en' label='Audio Description (English)'>\n</video>\n<!-- Passes 1.2.5: screen readers and description-aware players can\n activate the descriptions track to narrate visual content for blind users. -->\n\nVídeo de terceiro incorporado sem alternativa com descrição — Incorreto
\n<!-- A YouTube embed with no accessible described alternative -->\n<iframe\n width='560'\n height='315'\n src='https://www.youtube.com/embed/VIDEOID'\n title='Product Demo'\n allowfullscreen>\n</iframe>\n<!-- Fails 1.2.5: if the YouTube video itself does not have an audio\n description track uploaded, there is no way for blind users to\n access visual-only content in the video. -->\n\nVídeo incorporado com alternativa descrita claramente rotulada — Correto
\n<!-- A YouTube embed accompanied by a link to an audio described version -->\n<figure>\n <iframe\n width='560'\n height='315'\n src='https://www.youtube.com/embed/VIDEOID'\n title='Product Demo'\n allowfullscreen>\n </iframe>\n <figcaption>\n Product Demo — visual walkthrough of the onboarding flow.\n <!-- Alternative described version linked directly below the video -->\n <a href='https://www.youtube.com/watch?v=DESCRIBED_VIDEOID'>\n Watch the audio described version of this video\n </a>\n </figcaption>\n</figure>\n<!-- Passes 1.2.5: a clearly labeled alternative with audio description\n is provided, allowing blind users to access the same content. -->\n\nPlayer de vídeo personalizado sem alternância de descrição — Incorreto
\n<!-- Custom video player with no mechanism to enable audio description -->\n<div class='video-player' role='region' aria-label='Product Tutorial'>\n <video id='tutorial-video'>\n <source src='tutorial.mp4' type='video/mp4'>\n </video>\n <div class='controls'>\n <button id='play-pause'>Play</button>\n <button id='mute'>Mute</button>\n </div>\n</div>\n<!-- Fails 1.2.5: no descriptions track, no AD toggle, no alternative. -->\n\nPlayer de vídeo personalizado com alternância de descrição em áudio — Correto
\n<!-- Custom video player with accessible audio description toggle -->\n<div class='video-player' role='region' aria-label='Product Tutorial'>\n <video id='tutorial-video'>\n <source src='tutorial.mp4' type='video/mp4'>\n <!-- Descriptions track linked; player JS activates it on toggle -->\n <track id='desc-track' kind='descriptions' src='tutorial-desc.vtt'\n srclang='en' label='Audio Description'>\n </video>\n <div class='controls'>\n <button id='play-pause'>Play</button>\n <button id='mute'>Mute</button>\n <!-- Accessible toggle button for audio description -->\n <button id='ad-toggle' aria-pressed='false'\n aria-label='Toggle audio description'>\n Audio Description\n </button>\n </div>\n</div>\n<!-- Passes 1.2.5: a descriptions track is present and the custom player\n exposes an accessible toggle so users can enable it. Player JS\n must set aria-pressed='true' when activated and enable the track. -->\n\nCommon Mistakes
\n- \n\n
(Content truncated due to token limit — please retry this article.)
