WCAG 1.4.7: Áudio de Fundo Baixo ou Inexistente

A WCAG 1.4.7 exige que o conteúdo de áudio pré-gravado que contenha fala não tenha sons de fundo, permita que os sons de fundo sejam desligados ou mantenha os sons de fundo pelo menos 20 dB mais baixos do que a fala em primeiro plano. Isso protege usuários com perda auditiva e deficiências cognitivas que têm dificuldade em separar a fala de áudios concorrentes.

O Que Esta Regra Significa

O Critério de Sucesso 1.4.7 das WCAG — Áudio de Fundo Baixo ou Inexistente — aplica-se a conteúdo apenas de áudio pré-gravado que contenha fala em primeiro plano. Não se aplica a áudio que seja em si uma performance musical, como uma canção, nem a áudio que seja principalmente uma paisagem sonora ambiente sem componente de fala intencional. Quando há conteúdo de áudio baseado em fala, o critério exige que pelo menos uma das três condições a seguir seja atendida:

Sem áudio de fundo: A faixa de áudio contém fala sem nenhum som de fundo — silêncio atrás da voz.
Controle pelo usuário: Qualquer áudio de fundo pode ser desligado pelo usuário, de forma independente da fala em primeiro plano, sem afetar o conteúdo da fala.
Regra de 20 dB: Os sons de fundo estão pelo menos 20 decibéis abaixo, em volume, da fala em primeiro plano. Uma diferença de 20 dB equivale aproximadamente a o áudio de fundo ser quatro vezes mais baixo que a fala, o que representa uma diferença perceptiva significativa para a maioria dos ouvintes.

Um aprovado é registrado quando qualquer uma dessas três condições é plenamente satisfeita. Uma falha ocorre quando a fala em primeiro plano compete com áudio de fundo que não pode ser desligado e cuja diferença de volume é menor que 20 dB em relação ao sinal de fala. Observe que efeitos sonoros ocasionais — como um breve som de notificação — que duram apenas um ou dois segundos são explicitamente isentos deste requisito pela especificação WCAG.

Este critério se aplica à faixa de áudio independentemente de o áudio ser entregue como um arquivo de áudio independente, como o componente de áudio de um vídeo, ou incorporado por meio de um player de podcast, elemento HTML5 <audio> ou um widget de mídia de terceiros. O requisito diz respeito à produção do próprio conteúdo de áudio, não a um elemento HTML específico ou atributo ARIA — razão pela qual ferramentas de varredura automatizada não conseguem detectar violações de forma confiável e a revisão manual do conteúdo de áudio real é sempre necessária.

Por Que Isso Importa

Aproximadamente 1,5 bilhão de pessoas no mundo vivem com algum grau de perda auditiva, de acordo com a Organização Mundial da Saúde. Mesmo uma perda auditiva moderada pode tornar extremamente difícil — às vezes impossível — isolar a voz de quem fala quando música de fundo, ruído ambiente ou outros elementos de áudio são mixados em níveis de volume semelhantes ou concorrentes. Para usuários que dependem de aparelhos auditivos ou implantes cocleares, a interferência do áudio de fundo é amplificada junto com a fala, tornando a inteligibilidade dramaticamente pior, e não melhor.

Usuários com deficiências cognitivas, incluindo aqueles com transtornos de déficit de atenção, distúrbios de processamento auditivo ou lesões cerebrais traumáticas, também enfrentam desafios significativos quando faixas de áudio contêm sons concorrentes. Mesmo quando o ouvinte não tem perda auditiva mensurável, seu cérebro pode ter dificuldade em filtrar sinais de áudio irrelevantes e focar no conteúdo da fala, levando a fadiga, falha de compreensão ou exclusão completa do conteúdo.

Considere um cenário concreto do mundo real: uma agência governamental turca publica um áudio gravado explicando como cidadãos podem solicitar um benefício social. A voz do narrador é mixada sobre uma faixa contínua de música de fundo em níveis de volume aproximadamente iguais. Um usuário com perda auditiva sensorioneural moderada acessa a página usando um aparelho auditivo. Como o aparelho amplifica todas as frequências simultaneamente, a música compete diretamente com a fala do narrador. O usuário não consegue entender as instruções e perde o prazo para a solicitação do benefício. Se o áudio tivesse sido gravado sem música de fundo, ou se tivesse sido fornecido um controle de volume para suprimir a faixa de fundo de forma independente, o usuário teria tido acesso igual à informação.

Além da deficiência, áudio claro com ruído de fundo mínimo melhora a compreensão para todos os usuários — aqueles que escutam em ambientes barulhentos em dispositivos móveis, falantes não nativos do idioma em questão e usuários em situações de baixa largura de banda em que a qualidade do áudio já pode estar degradada. Há também benefícios indiretos de SEO: transcrições de áudio claramente inteligível produzem conteúdo de texto de maior qualidade que os mecanismos de busca podem indexar, melhorando a encontrabilidade do seu conteúdo.

Regras Relacionadas do Axe-core

WCAG 1.4.7 exige testes manuais. Não há regra automatizada do axe-core que possa detectar essa violação, e isso é intencional. Varredores de acessibilidade automatizados como axe-core, Lighthouse ou IBM Equal Access Checker operam analisando a estrutura do DOM, atributos HTML, papéis ARIA e estilos computados de uma página da web. Eles não têm capacidade de:

Analisar o conteúdo de áudio de um arquivo: Varredores não podem abrir um arquivo de áudio ou vídeo e medir os níveis relativos de decibéis da fala em primeiro plano em comparação com o áudio de fundo. Fazer isso exigiria processamento de sinal de áudio muito além do escopo de um verificador de acessibilidade baseado em DOM.
Detectar se existe um controle separado para o áudio de fundo e se ele funciona corretamente: Mesmo que um controle de interface rotulado como "Desligar música de fundo" esteja presente no DOM, um varredor não pode verificar se ele realmente suprime a faixa de áudio de fundo sem afetar a faixa de fala, nem pode verificar se o controle funciona como esperado em todos os navegadores.
Distinguir fala de áudio não verbal: Ferramentas automatizadas não conseguem classificar de forma confiável um arquivo de áudio como primariamente de fala, primariamente musical ou primariamente ambiente, o que é a determinação prévia necessária antes mesmo de o critério se aplicar.

Como toda avaliação deve ser feita por um revisor humano ouvindo o conteúdo e, quando necessário, usando software de análise de áudio para medir níveis de decibéis, o axe-core sinaliza este critério como exigindo revisão manual. Quando você executa o axe DevTools em uma página que contém elementos <audio> ou <video>, a ferramenta pode exibir um aviso geral relacionado a mídia lembrando você de avaliar manualmente os critérios de qualidade de áudio, mas não produzirá automaticamente um veredito de aprovado ou reprovado para 1.4.7.

Como Testar

Faça um inventário de todo o conteúdo de áudio na página. Carregue a página e identifique cada elemento <audio>, cada elemento <video> com faixa de áudio, cada podcast ou player de mídia incorporado e qualquer áudio de fundo que seja reproduzido automaticamente. Determine se cada trecho de áudio é pré-gravado e contém fala em primeiro plano. Se for uma faixa puramente musical ou som ambiente sem fala, 1.4.7 não se aplica a ela.
Execute uma varredura automatizada para problemas de base. Use axe DevTools, Lighthouse ou a auditoria integrada do widget Accsible para analisar a página. Embora essas ferramentas não avaliem a qualidade do áudio, elas podem sinalizar legendas ausentes, ausência de atributos controls em elementos <audio> ou problemas relacionados de acessibilidade de mídia. Resolva quaisquer problemas sinalizados antes de prosseguir para a avaliação manual do áudio.
Ouça cada faixa de áudio qualificada em sua totalidade. Use o player integrado da página ou baixe o arquivo e abra-o em um reprodutor de mídia. Ouça especificamente música de fundo, som ambiente ou outro áudio não verbal que seja reproduzido simultaneamente com a fala em primeiro plano.
Avalie se o áudio de fundo pode ser desligado de forma independente. Se o player fornecer um controle separado para silenciar ou reduzir a música de fundo sem afetar a faixa de voz, verifique se esse controle funciona como esperado no Chrome, Firefox e Safari. Teste apenas com teclado para confirmar que o controle é acessível.
Meça os níveis de decibéis se o áudio de fundo estiver presente e não puder ser desligado. Importe o arquivo de áudio em um editor de áudio gratuito como o Audacity. Use a visualização de forma de onda ou espectrograma integrada e a ferramenta "Analyze > Contrast" (ou equivalente) para medir o nível médio de RMS dos trechos de fala em comparação com o nível médio de RMS dos trechos de áudio de fundo. Confirme que a diferença é de pelo menos 20 dB. Se você não tiver acesso a software de análise de áudio, use seu julgamento profissional como ouvinte experiente: se uma pessoa típica com perda auditiva leve achar o áudio de fundo distrativo ou ofuscante, trate-o como uma provável falha.
Teste com tecnologias assistivas. Usando NVDA com Firefox, VoiceOver com Safari no macOS e JAWS com Chrome, navegue até cada player de áudio. Confirme que todos os controles — incluindo qualquer alternância separada de áudio de fundo — são alcançáveis pelo teclado (Tab/Shift+Tab), anunciados corretamente pelo leitor de tela e operáveis com Enter ou Espaço. Isso não testa diretamente a qualidade do áudio, mas confirma que quaisquer controles de correção que você tenha adicionado são acessíveis.
Documente as conclusões. Registre quais arquivos de áudio passam (sem áudio de fundo, controle disponível ao usuário ou diferença de 20 dB confirmada), quais falham e quais são isentos (efeitos sonoros curtos com menos de 2 segundos ou áudio que é primariamente musical em vez de fala).

Como Corrigir

Cenário 1: Música de fundo mixada muito alta — Incorreto

<!-- Audio file contains a narrator speaking over background music
     mixed at roughly equal volume levels. No separate control exists.
     This fails WCAG 1.4.7 because background audio is not 20 dB below speech
     and cannot be turned off independently. -->
<audio controls src='product-explainer.mp3'>
  Your browser does not support the audio element.
</audio>

Cenário 1: Música de fundo mixada muito alta — Correto

<!-- The audio file has been re-exported with no background music.
     If background music is desired for branding, produce two separate
     audio tracks: one speech-only and one with music. Offer the
     speech-only version as the default accessible option. -->
<audio controls src='product-explainer-speech-only.mp3'>
  Your browser does not support the audio element.
</audio>
<p>
  <a href='product-explainer-with-music.mp3'>
    Listen to version with background music (may be harder to follow for some users)
  </a>
</p>

Cenário 2: Áudio de fundo com controle independente de mudo — Incorreto

<!-- A custom player claims to offer background audio control,
     but the button is not keyboard-accessible and has no accessible name.
     Sighted mouse users can click it, but screen reader users and
     keyboard-only users cannot reach or operate the control. -->
<div class='player'>
  <audio id='main-audio' src='lecture-with-ambience.mp3'></audio>
  <button onclick='document.getElementById("main-audio").play()'>Play</button>
  <div onclick='toggleBackground()' style='cursor:pointer'>
    <img src='music-icon.png'>
  </div>
</div>

Cenário 2: Áudio de fundo com controle independente de mudo — Correto

<!-- The background audio toggle is now a proper <button> element with
     an accessible name, keyboard focus, and an aria-pressed state so
     screen readers announce whether background audio is on or off. -->
<div class='player'>
  <audio id='main-audio' src='lecture-with-ambience.mp3'></audio>
  <audio id='bg-audio' src='background-ambience.mp3' loop></audio>
  <button onclick='document.getElementById("main-audio").play()'>Play lecture</button>
  <button
    id='bg-toggle'
    aria-pressed='true'
    onclick='toggleBackground()'
  >
    Background audio: on
  </button>
</div>
<script>
  function toggleBackground() {
    var bg = document.getElementById('bg-audio');
    var btn = document.getElementById('bg-toggle');
    if (bg.paused) {
      bg.play();
      btn.setAttribute('aria-pressed', 'true');
      btn.textContent = 'Background audio: on';
    } else {
      bg.pause();
      btn.setAttribute('aria-pressed', 'false');
      btn.textContent = 'Background audio: off';
    }
  }
</script>

Cenário 3: Áudio de fundo em reprodução automática ao carregar a página — Incorreto

<!-- Background audio autoplays when the page loads and there is
     no way to turn it off. If a narrator audio also plays, the
     background audio will compete with it and cannot be suppressed. -->
<audio autoplay loop src='ambient-background.mp3'></audio>
<audio controls src='welcome-message.mp3'></audio>

Cenário 3: Áudio de fundo em reprodução automática ao carregar a página — Correto

<!-- Background audio does not autoplay. A clearly labeled, keyboard-
     accessible button allows the user to opt in if desired. The speech
     audio is presented independently and cleanly without competition. -->
<audio id='bg' loop src='ambient-background.mp3'></audio>
<button onclick='document.getElementById("bg").play()'>
  Play background music (optional)
</button>
<audio controls src='welcome-message.mp3'>
  Your browser does not support the audio element.
</audio>

Erros Comuns

Mixar música de fundo a -10 dB em vez dos -20 dB exigidos: Produtores frequentemente aplicam uma redução modesta de volume à música de fundo e presumem que é suficiente. O padrão WCAG exige uma diferença completa de 20 dB (aproximadamente quatro vezes mais baixo), não apenas uma redução perceptível. Sempre verifique com uma ferramenta de análise de áudio em vez de confiar apenas em julgamento subjetivo.
Confundir o controle de volume geral do player com um controle independente de áudio de fundo: Um controle deslizante de volume principal que reduz simultaneamente a fala e o áudio de fundo não satisfaz a condição de "o usuário pode desligar o áudio de fundo". O controle deve suprimir apenas o áudio de fundo sem afetar a fala em primeiro plano.
Presumir que o critério se aplica apenas a arquivos de áudio independentes: Muitos desenvolvedores ignoram que a faixa de áudio de um elemento de vídeo também está igualmente sujeita a 1.4.7. Um vídeo explicativo com música de fundo alta mixada na faixa de áudio falha no critério da mesma forma que um arquivo de podcast falharia.
Tratar todos os sons curtos como isentos: A isenção das WCAG para efeitos sonoros breves aplica-se apenas a sons que duram dois segundos ou menos. Um jingle curto recorrente que se repete a cada poucos segundos, ou um loop de fundo de sons curtos, não está coberto por essa isenção e ainda deve cumprir o critério.
Não testar a alternância de áudio de fundo com navegação apenas por teclado: As equipes frequentemente implementam um botão de mudo visualmente atraente usando um elemento não interativo como um <div> ou <span>, que não é alcançável pela tecla Tab nem operável com Enter ou Espaço. Use um elemento nativo <button> para que o suporte a teclado e tecnologia assistiva seja incorporado.
Esquecer de adicionar aria-pressed ou estado equivalente a botões de alternância de áudio de fundo: Sem um indicador de estado, usuários de leitores de tela podem operar o botão, mas não conseguem saber se o áudio de fundo está atualmente ligado ou desligado. Sempre reflita o estado atual no nome acessível do botão ou por meio de aria-pressed.
Produzir apenas um arquivo de áudio mixado em vez de oferecer faixas separadas: Quando o áudio de fundo é parte integrante da intenção criativa, as equipes frequentemente exportam um único arquivo mixado em vez de oferecer uma alternativa apenas com fala. Fornecer uma versão separada apenas com fala custa muito pouco esforço adicional de produção e elimina completamente o risco de não conformidade.
Aplicar 1.4.7 a transmissões de áudio ao vivo: O critério cobre explicitamente apenas áudio pré-gravado. Transmissões de áudio ao vivo não estão sujeitas a esta regra específica, embora outros critérios, como 1.4.4 (Redimensionar Texto) e requisitos de legendas, ainda possam se aplicar ao conteúdo associado.
Deixar de verificar players incorporados de terceiros: Quando o conteúdo é incorporado de plataformas externas (hospedagem de podcasts, CDNs de vídeo, serviços de compartilhamento de áudio), as equipes frequentemente presumem que a conformidade é responsabilidade da plataforma. No entanto, o proprietário da página é responsável pela acessibilidade de todo o conteúdo em suas páginas, incluindo mídia incorporada. Verifique se o player de terceiros atende aos requisitos de qualidade de áudio ou oferece os controles necessários.
Medir níveis de pico em vez de níveis médios de RMS ao verificar o requisito de 20 dB: O limite de 20 dB em WCAG 1.4.7 refere-se à sonoridade perceptiva do áudio, melhor aproximada por níveis médios de RMS (Root Mean Square), não por níveis de pico instantâneos. Usar medições de nível de pico pode produzir leituras enganosamente favoráveis que não refletem a experiência real de escuta.

Relação com os Regulamentos de Acessibilidade da Turquia

A Circular Presidencial 2025/10 da Turquia, publicada no Diário Oficial nº 32933 em 21 de junho de 2025, estabelece requisitos obrigatórios de acessibilidade digital para uma ampla gama de entidades dos setores público e privado que operam na Turquia. A Circular adota as WCAG 2.2 como seu padrão técnico normativo e define obrigações específicas de conformidade com base no tipo de organização.

As entidades sujeitas à conformidade obrigatória sob a Circular incluem instituições públicas e órgãos governamentais em todos os níveis, plataformas de e-commerce, bancos e prestadores de serviços financeiros, hospitais e instituições de saúde, operadoras de telecomunicações com 200.000 ou mais assinantes, agências de viagens licenciadas, empresas de transporte privado e escolas privadas autorizadas pelo Ministério da Educação Nacional (MoNE). Essas organizações são obrigadas a atender, no mínimo, aos níveis A e AA das WCAG 2.2.

WCAG 1.4.7 — Áudio de Fundo Baixo ou Inexistente — é um critério de Nível AAA. Isso significa que ele não está entre os critérios que as entidades abrangidas são legalmente obrigadas a cumprir sob os requisitos básicos da Circular 2025/10. No entanto, várias considerações importantes se aplicam. Primeiro, organizações que se comprometem voluntariamente com a conformidade AAA — ou que atendem populações com alta concentração de usuários com deficiência auditiva, como hospitais, clínicas de audiologia ou agências de serviços sociais — devem tratar 1.4.7 como efetivamente obrigatório em seu contexto. Segundo, qualquer entidade cujos serviços digitais incluam conteúdo instrucional em áudio, gravações de atendimento ao cliente, módulos de e-learning ou transmissões informativas direcionadas ao público perceberá que cumprir 1.4.7 melhora substancialmente a usabilidade real desses serviços para cidadãos turcos com deficiências auditivas.

A Turquia tem uma população significativa de pessoas com deficiência auditiva, e a Circular reflete o compromisso do governo em garantir participação digital igualitária. Embora os critérios AAA sejam posicionados como aspiracionais no padrão técnico, instituições públicas turcas em particular são incentivadas a exceder os requisitos mínimos sempre que seu conteúdo e recursos permitirem. Demonstrar conformidade com 1.4.7 sinaliza maturidade organizacional, reduz o risco jurídico e reputacional e posiciona os serviços digitais turcos como líderes em design inclusivo tanto no mercado interno quanto em mercados internacionais onde a conformidade AAA pode ser exigida contratualmente.