Critérios de Sucesso WCAG · Level A

WCAG 1.2.2: Legendas (Pré-gravado)

- Garantir que todo o conteúdo de áudio pré-gravado em mídia sincronizada (vídeo com áudio) tenha legendas precisas. - Assegurar que pessoas surdas e com deficiência auditiva possam acessar diálogos falados, efeitos sonoros e outras informações de áudio significativas. - Manter a exatidão das legendas para refletir fielmente o conteúdo de áudio original.

O que Esta Regra Significa

WCAG 1.2.2 — Legendas (Pré-gravado) exige que sejam fornecidas legendas para todo conteúdo de áudio pré-gravado em mídia sincronizada. Mídia sincronizada é definida como conteúdo de áudio ou vídeo que está sincronizado com outro formato e/ou com componentes interativos baseados em tempo — na prática, isso significa qualquer arquivo de vídeo que também contenha áudio, como aulas gravadas, demonstrações de produtos, clipes de notícias, depoimentos ou vídeos de marketing.

Legendas são uma alternativa em texto que é sincronizada com a linha do tempo do vídeo. Elas devem transmitir não apenas o diálogo falado, mas também qualquer outro áudio significativo — incluindo identificação de quem fala, efeitos sonoros relevantes (como [aplausos], [porta batendo] ou [música tocando]) e o tom ou modo de fala quando isso afeta a compreensão. Isso diferencia legendas de subtítulos, que normalmente apresentam apenas as palavras faladas e são destinados a públicos que conseguem ouvir o áudio, mas não entendem o idioma falado.

Um atendimento a este critério exige todos os seguintes pontos: existem legendas para toda mídia sincronizada pré-gravada, elas estão corretamente sincronizadas com o áudio correspondente, descrevem todo o áudio significativo (diálogo, identidade de quem fala, efeitos sonoros relevantes) e estão disponíveis no mesmo local que a própria mídia — não apenas vinculadas a partir de uma página separada.

Um não atendimento ocorre quando: nenhuma legenda é fornecida, as legendas existem mas são imprecisas ou incompletas (por exemplo, geradas automaticamente sem correção), as legendas omitem áudio significativo não verbal, as legendas estão presentes mas não devidamente sincronizadas, ou as legendas são fornecidas apenas como uma transcrição separada (uma transcrição sozinha não satisfaz este critério).

A única exceção oficial definida nas WCAG é a mídia que é, em si, uma alternativa em mídia para texto. Por exemplo, se uma página da web contém um artigo escrito e um vídeo que simplesmente reapresenta a mesma informação desse artigo, e o vídeo está claramente rotulado como tal, então não são exigidas legendas para o vídeo. Essa exceção é restrita e intencional — não deve ser usada como brecha para evitar legendar vídeos que contenham conteúdo substantivo não disponível de outra forma em formato de texto.

As legendas podem ser abertas (inseridas diretamente no vídeo e sempre visíveis) ou fechadas (entregues como uma faixa separada que as pessoas usuárias podem ativar ou desativar). Ambas são aceitáveis segundo a WCAG 1.2.2, embora legendas fechadas sejam geralmente preferíveis porque permitem que as pessoas personalizem a aparência e possam ser desativadas por quem não precisa delas. Em HTML, legendas fechadas são normalmente implementadas usando o elemento <track> com kind='captions' dentro de um elemento <video>, apontando para um arquivo de legendas WebVTT ou SRT.

Por Que Isso Importa

Aproximadamente 466 milhões de pessoas no mundo vivem com perda auditiva incapacitante, de acordo com a Organização Mundial da Saúde — um número projetado para subir para mais de 900 milhões até 2050. Além daquelas com surdez profunda, uma população muito maior enfrenta dificuldades auditivas situacionais: pessoas em ambientes barulhentos, como transporte público, escritórios de plano aberto ou cafés lotados, que não conseguem ouvir o áudio mesmo com audição funcional, pessoas usuárias que temporariamente perderam acesso a hardware de áudio e pessoas que assistem a conteúdo em ambientes silenciosos onde o áudio precisa ficar mudo.

Para pessoas surdas ou com deficiência auditiva, legendas não são uma conveniência — são a única forma de acessar o conteúdo falado de um vídeo. Sem legendas, uma pessoa surda que visita um site de e-commerce não consegue entender um vídeo de demonstração de produto, uma estudante surda não consegue acompanhar uma aula gravada e uma paciente surda não consegue absorver as informações em um vídeo instrutivo de um hospital. A informação é totalmente inacessível para elas, independentemente de quão claramente o vídeo foi filmado ou de quão alta é a qualidade de produção.

As legendas também beneficiam pessoas com deficiências cognitivas e de aprendizagem, como aquelas com transtorno de déficit de atenção e hiperatividade ou dislexia, que podem achar mais fácil processar informações quando elas são apresentadas simultaneamente em formato de áudio e texto. Pessoas que não são falantes nativas se beneficiam porque as legendas reforçam a compreensão de fala com sotaque ou em ritmo acelerado. Pessoas idosas com perda auditiva relacionada à idade — uma condição que afeta aproximadamente um terço das pessoas com mais de 65 anos — também dependem de legendas.

Considere um cenário concreto: um banco turco publica um vídeo em seu site explicando como abrir uma conta digital. Uma potencial cliente que é surda visita o site. Sem legendas, ela não consegue entender nenhuma das etapas faladas, não consegue acompanhar o processo e não consegue concluir a tarefa — criando tanto uma falha de acessibilidade quanto uma oportunidade de negócio perdida para o banco. Com legendas precisas e sincronizadas, ela acompanha cada etapa, conclui o onboarding e se torna cliente.

Além do acesso para pessoas com deficiência, as legendas trazem benefícios mensuráveis de SEO e usabilidade. Arquivos de legendas em formato WebVTT ou SRT são legíveis por máquina, o que significa que mecanismos de busca podem indexar o texto completo do conteúdo em vídeo, melhorando a capacidade de descoberta. Estudos mostram que a maioria das pessoas espectadoras assiste a vídeos em redes sociais sem som, tornando as legendas efetivamente um recurso de usabilidade para o público em geral. As legendas também facilitam que mecanismos de busca e ferramentas de avaliação de acessibilidade entendam o propósito e o conteúdo de vídeos incorporados, contribuindo para sinais gerais de qualidade da página.

Regras Relacionadas do Axe-core

WCAG 1.2.2 exige testes manuais. Não há nenhuma regra automatizada do axe-core que detecte de forma confiável a ausência ou imprecisão de legendas para mídia sincronizada pré-gravada. As razões para isso são fundamentais para o modo como o teste automatizado funciona:

  • Teste manual necessário — ausência de faixa de legendas: Uma ferramenta automatizada pode detectar que um elemento <video> não possui um elemento <track kind='captions'>, e algumas ferramentas sinalizarão isso como um possível problema. No entanto, a ferramenta não consegue determinar se o vídeo realmente contém conteúdo de áudio significativo (ele pode ser um vídeo silencioso), se legendas abertas (inseridas) estão presentes no próprio vídeo ou se o vídeo se qualifica para a exceção de alternativa em mídia. É necessária revisão humana para fazer essa determinação.
  • Teste manual necessário — precisão e completude das legendas: Mesmo quando um arquivo de faixa de legendas está presente e vinculado, uma ferramenta automatizada não consegue avaliar se as legendas refletem com precisão o que é falado, se incluem efeitos sonoros relevantes e identificação de quem fala ou se estão devidamente sincronizadas com o áudio. Um arquivo de legendas contendo texto totalmente errado, texto sem sentido gerado automaticamente ou legendas constantemente 10 segundos fora de sincronia passaria na detecção automatizada, mas falharia no critério. Somente uma pessoa revisora que assista ao vídeo enquanto lê as legendas pode avaliar a precisão.
  • Teste manual necessário — legendas abertas: Se as legendas estiverem inseridas no próprio arquivo de vídeo (legendas abertas), as ferramentas automatizadas não têm como detectar isso. Elas veem apenas um elemento <video> sem uma faixa e não conseguem analisar o conteúdo visual dos quadros de vídeo para determinar se há texto presente.

Devido a essas limitações, a WCAG 1.2.2 deve sempre incluir uma etapa de revisão humana como parte de qualquer auditoria abrangente. Varreduras automatizadas servem como um primeiro passo útil para identificar elementos de faixa obviamente ausentes, mas não podem substituir a avaliação manual da qualidade, precisão e sincronização das legendas.

Como Testar

  1. Fazer um inventário de toda a mídia sincronizada: Antes de executar qualquer ferramenta, revise manualmente a página para identificar cada elemento de vídeo — tags <video> incorporadas, players incorporados via iframe (YouTube, Vimeo, terceiros) e quaisquer players de mídia HTML5. Liste cada vídeo e anote se ele contém áudio significativo (diálogo, narração, efeitos sonoros importantes). Vídeos sem trilha de áudio ou com apenas música de fundo que não carrega conteúdo informativo podem ser tratados de forma diferente, mas documente seu raciocínio.
  2. Executar uma varredura automatizada com axe DevTools ou Lighthouse: Abra o axe DevTools nas ferramentas de desenvolvedor do navegador e execute uma varredura de página inteira. Procure por quaisquer violações ou itens incompletos relacionados a elementos de vídeo ou áudio. O Lighthouse (executado via Chrome DevTools na categoria de auditoria de Acessibilidade) também sinalizará vídeos sem um elemento <track>. Observe que um resultado automatizado limpo não significa que o critério foi satisfeito — significa apenas que nenhuma faixa obviamente ausente foi detectada. Trate os resultados automatizados como ponto de partida, não como conclusão.
  3. Inspecionar o código-fonte HTML: Para cada elemento <video> na página, inspecione o DOM para verificar se um elemento <track kind='captions'> está presente e se seu atributo src aponta para um arquivo de legendas válido e acessível (WebVTT ou SRT). Verifique se o atributo srclang está definido para o idioma apropriado. Confirme que o arquivo é carregado sem erro de rede abrindo a URL diretamente no navegador.
  4. Reproduzir o vídeo e avaliar as legendas manualmente: Ative as legendas no player de vídeo (ou confirme que elas aparecem automaticamente se forem legendas abertas). Assista ao vídeo na íntegra — ou a uma amostra estatisticamente representativa no início, meio e fim. Para cada trecho, verifique: (a) o diálogo é transcrito com precisão, sem erros significativos, (b) mudanças de quem fala são identificadas quando isso ajuda na compreensão, (c) áudio significativo não verbal é descrito entre colchetes (por exemplo, [telefone tocando]) e (d) as legendas aparecem e desaparecem em sincronia com o áudio — não significativamente antes ou depois das palavras faladas.
  5. Testar com leitor de tela quando relevante: Usando NVDA com Firefox, VoiceOver com Safari ou JAWS com Chrome, navegue até o elemento de vídeo. Confirme se os controles do player são acessíveis por teclado e se ativar e desativar as legendas pode ser feito sem mouse. Isso testa a usabilidade do recurso de legendas além de sua existência.
  6. Testar players incorporados de terceiros: Para iframes que incorporam players do YouTube ou Vimeo, abra o vídeo diretamente na plataforma e verifique se as legendas foram enviadas e estão ativadas por padrão ou facilmente ativáveis. Legendas geradas automaticamente em plataformas como o YouTube não satisfazem a WCAG 1.2.2, a menos que tenham sido revisadas e corrigidas quanto à precisão.
  7. Documentar atendimento/não atendimento com evidências: Para cada vídeo testado, registre a URL da página, o título ou descrição do vídeo, se as legendas estavam presentes e sua avaliação de precisão. Capturas de tela ou anotações com marcação de tempo da revisão servem como evidência de auditoria.

Como Corrigir

Vídeo HTML5 sem nenhuma faixa de legendas — Incorreto

<!-- Fails 1.2.2: video with audio has no caption track at all -->
<video controls width='800'>
  <source src='product-demo.mp4' type='video/mp4'>
  Your browser does not support the video element.
</video>

Vídeo HTML5 sem nenhuma faixa de legendas — Correto

<!-- Passes 1.2.2: a WebVTT caption track is linked with kind='captions' -->
<video controls width='800'>
  <source src='product-demo.mp4' type='video/mp4'>
  <!-- The track element links the WebVTT file; srclang and label aid player UI -->
  <track
    kind='captions'
    src='product-demo-captions-en.vtt'
    srclang='en'
    label='English Captions'
    default
  >
  Your browser does not support the video element.
</video>

Vídeo multilíngue com apenas faixa de subtítulos, sem legendas — Incorreto

<!-- Fails 1.2.2: kind='subtitles' provides translated dialogue but omits -->
<!-- sound effect descriptions and speaker identification needed for deaf users -->
<video controls width='800'>
  <source src='webinar.mp4' type='video/mp4'>
  <track kind='subtitles' src='webinar-tr.vtt' srclang='tr' label='Turkish'>
</video>

Vídeo multilíngue com apenas faixa de subtítulos, sem legendas — Correto

<!-- Passes 1.2.2: a dedicated captions track is provided alongside subtitles. -->
<!-- The captions file includes [Speaker: Dr. Aydin], [applause], etc. -->
<video controls width='800'>
  <source src='webinar.mp4' type='video/mp4'>
  <track
    kind='captions'
    src='webinar-captions-tr.vtt'
    srclang='tr'
    label='Turkish Captions'
    default
  >
  <track kind='subtitles' src='webinar-en.vtt' srclang='en' label='English'>
</video>

Incorporação do YouTube dependendo de legendas automáticas não corrigidas — Incorreto

<!-- Fails 1.2.2: uncorrected auto-captions are not considered accurate captions -->
<iframe
  width='800'
  height='450'
  src='https://www.youtube.com/embed/VIDEOID'
  title='Company Introduction Video'
  allowfullscreen
></iframe>

Incorporação do YouTube com legendas verificadas e editadas por humanos — Correto

<!-- Passes 1.2.2 provided that captions have been uploaded or reviewed -->
<!-- in YouTube Studio and confirmed accurate by a human reviewer. -->
<!-- The &cc_load_policy=1 parameter enables captions by default. -->
<iframe
  width='800'
  height='450'
  src='https://www.youtube.com/embed/VIDEOID?cc_load_policy=1&cc_lang_pref=tr'
  title='Company Introduction Video'
  allowfullscreen
></iframe>
<!-- Also ensure in YouTube Studio that the caption track is marked as -->
<!-- human-reviewed and that auto-captions have been corrected. -->

Erros Comuns

  • Fornecer uma transcrição em texto em vez de legendas sincronizadas: Uma transcrição que aparece abaixo ou ao lado de um vídeo satisfaz a WCAG 1.2.3 (Descrição em Áudio ou Alternativa em Mídia) em alguns contextos, mas não satisfaz 1.2.2. As legendas devem ser sincronizadas com a linha do tempo do vídeo, de modo que o texto apareça no momento em que o áudio correspondente ocorre. Um bloco estático de texto não atende a esse requisito.
  • Usar kind='subtitles' em vez de kind='captions': Subtítulos são projetados para pessoas espectadoras que conseguem ouvir o áudio, mas não entendem o idioma — normalmente incluem apenas o diálogo falado traduzido para outro idioma. Legendas são projetadas para pessoas espectadoras que não conseguem ouvir o áudio — elas devem incluir identificação de quem fala, efeitos sonoros significativos e outras informações não verbais. Substituir uma faixa de legendas por uma faixa de subtítulos quando legendas são exigidas é um erro comum e com consequências.
  • Confiar em legendas automáticas não corrigidas do YouTube ou plataformas similares: Legendas geradas automaticamente usam reconhecimento de fala e frequentemente produzem erros, especialmente para terminologia técnica, nomes próprios, sotaques ou fala rápida. A WCAG exige que as legendas sejam precisas. Legendas automáticas que não foram revisadas e corrigidas por uma pessoa não atendem ao padrão de precisão de 1.2.2.
  • Incluir um elemento <track> apontando para um arquivo VTT ausente ou com erro: Se o atributo src do elemento track fizer referência a um caminho de arquivo que retorna erro 404, as legendas falharão silenciosamente ao carregar. O HTML passa na inspeção automatizada, mas a pessoa usuária não recebe legendas. Sempre verifique se a URL do arquivo de legendas é resolvida corretamente em produção.
  • Omitir áudio significativo não verbal dos arquivos de legendas: Um arquivo de legendas que transcreve apenas palavras faladas, mas ignora sons importantes — como um alarme, um telefone tocando, aplausos ou um estrondo que é central para entender o vídeo — falha no critério. As legendas devem descrever todas as informações de áudio necessárias para entender o conteúdo, não apenas o diálogo.
  • Legendas significativamente fora de sincronia com o áudio: Um arquivo WebVTT com entradas de carimbo de tempo incorretas pode exibir legendas segundos antes ou depois da fala correspondente. Isso prejudica a compreensão e constitui uma falha, mesmo que o texto das legendas em si seja preciso. Sempre revise a sincronização ao longo de toda a duração do vídeo, especialmente em cortes de cena e pausas.
  • Presumir que a exceção de alternativa em mídia se aplica amplamente: Algumas equipes presumem que, por terem um artigo escrito acompanhando um vídeo, o vídeo se qualifica como alternativa em mídia e não precisa de legendas. A exceção se aplica apenas quando o vídeo não adiciona nenhuma informação além do que o texto já contém, a relação é explícita para as pessoas usuárias e o vídeo está claramente rotulado como alternativa. Um vídeo que adiciona demonstrações, tom de voz de quem fala ou informações visuais não cobertas no texto não se qualifica.
  • Colocar controles de legendas acessíveis apenas via mouse: Mesmo que as legendas existam, se o botão para ativá-las em um player de vídeo personalizado não for acessível por teclado — por exemplo, um <div> estilizado com um manipulador onclick, mas sem tabindex='0' ou ouvinte de evento de teclado — pessoas que dependem de navegação por teclado não conseguem ativar as legendas. O próprio recurso de legendas deve ser operável por teclado.
  • Não testar legendas em players incorporados ou de terceiros: As equipes frequentemente testam o comportamento das legendas em seu ambiente de desenvolvimento, mas esquecem que incorporações em produção por meio de players de terceiros (Vimeo, Wistia, JW Player) podem ter comportamento diferente de carregamento de legendas, estados padrão ou configurações de API. Sempre teste a experiência de legendas no contexto real de incorporação em produção.
  • Fornecer legendas em apenas um idioma quando o site atende públicos multilíngues: Embora a WCAG não exija estritamente legendas em todos os idiomas que um site suporta, fornecer legendas apenas em um idioma quando o site e o conteúdo em vídeo estão disponíveis, por exemplo, em turco e inglês, significa que algumas pessoas usuárias recebem conteúdo acessível enquanto outras não. A boa prática é fornecer faixas de legendas correspondentes a cada versão de idioma do vídeo.

Relação com os Regulamentos de Acessibilidade da Turquia

A Circular Presidencial 2025/10 da Turquia, publicada no Diário Oficial de número 32933 em 21 de junho de 2025, estabelece obrigações vinculantes de acessibilidade na web para uma ampla gama de entidades públicas e privadas que operam na Turquia. A circular determina conformidade com a WCAG 2.2 no Nível A como linha de base mínima, com a conformidade no Nível AA fortemente recomendada. A WCAG 1.2.2 — Legendas (Pré-gravado) é um requisito de Nível A, o que significa que está entre as obrigações mais fundamentais da circular e a não conformidade constitui uma violação regulatória direta.

As entidades abrangidas pela circular incluem instituições públicas e órgãos governamentais em todos os níveis, plataformas de e-commerce, bancos e instituições financeiras, hospitais e prestadores de serviços de saúde, operadoras de telecomunicações com 200.000 ou mais assinantes, agências de viagens licenciadas, empresas privadas de transporte e escolas privadas autorizadas pelo Ministério da Educação Nacional (MoNE). Instituições públicas devem alcançar conformidade dentro de um ano a partir da data de publicação da circular. Entidades do setor privado nas categorias abrangidas têm uma janela de dois anos para conformidade.

Para organizações nessas categorias, a implicação prática da WCAG 1.2.2 é clara: qualquer conteúdo em vídeo publicado em um site ou plataforma digital que inclua áudio significativo deve ser legendado com precisão. Isso é particularmente significativo para setores como o bancário, onde vídeos de explicação de produtos e de onboarding são comuns; saúde, onde vídeos de educação de pacientes são frequentemente publicados online; e e-commerce, onde vídeos de demonstração de produtos são centrais para a experiência de compra. Um banco que publica um tutorial em vídeo sem legendas sobre como usar o banco móvel, ou um hospital que publica um vídeo sem legendas sobre instruções de cuidados pós-operatórios, estaria em violação direta dos requisitos de Nível A da circular.

A circular não estabelece um padrão turco separado — ela faz referência direta aos critérios internacionalmente reconhecidos da WCAG 2.2, o que significa que as equipes de conformidade na Turquia devem seguir a especificação WCAG 1.2.2 conforme definida pelo W3C e descrita neste artigo. As organizações devem documentar suas práticas de legendagem, manter registros das versões de arquivos de legendas juntamente com o conteúdo em vídeo e incluir a precisão das legendas como uma etapa padrão em seu fluxo de publicação de conteúdo em vídeo. Auditorias de acessibilidade conduzidas para fins de conformidade regulatória devem incluir revisão manual da precisão das legendas, já que ferramentas automatizadas sozinhas são insuficientes para demonstrar conformidade com este critério.