Criterios de éxito de las WCAG · Level AAA

WCAG 1.4.7: Audio de fondo bajo o inexistente

WCAG 1.4.7 exige que el contenido de audio pregrabado que contenga habla no tenga sonidos de fondo, permita desactivar los sonidos de fondo o mantenga los sonidos de fondo al menos 20 dB más bajos que la voz en primer plano. Esto protege a las personas usuarias con pérdida auditiva y discapacidades cognitivas que tienen dificultades para separar el habla del audio que compite con ella.

Qué significa esta regla

El Criterio de Éxito 1.4.7 de las WCAG — Audio de fondo bajo o inexistente — se aplica a contenido solo de audio pregrabado que contiene voz en primer plano. No se aplica a audio que sea en sí mismo una interpretación musical, como una canción, ni a audio que sea principalmente un paisaje sonoro ambiental sin un componente de voz previsto. Cuando hay contenido de audio basado en voz, el criterio exige que se cumpla al menos una de las siguientes tres condiciones:

  • Sin audio de fondo: La pista de audio contiene voz sin ningún sonido de fondo — silencio detrás de la voz.
  • Control del usuario: Cualquier audio de fondo puede ser desactivado por la persona usuaria, de forma independiente de la voz en primer plano, sin afectar al contenido hablado.
  • Regla de 20 dB: Los sonidos de fondo están al menos 20 decibelios por debajo en volumen de la voz en primer plano. Una diferencia de 20 dB equivale aproximadamente a que el audio de fondo sea cuatro veces más silencioso que la voz, lo que supone una diferencia perceptiva significativa para la mayoría de las personas oyentes.

Se registra un cumplimiento cuando se satisface completamente cualquiera de esas tres condiciones. Se produce un incumplimiento cuando la voz en primer plano compite con un audio de fondo que no puede desactivarse y cuya diferencia de volumen es inferior a 20 dB en relación con la señal de voz. Ten en cuenta que los efectos de sonido ocasionales — como un breve tono de notificación — que duran solo uno o dos segundos están explícitamente exentos de este requisito según la especificación WCAG.

Este criterio se aplica a la pista de audio independientemente de si ese audio se ofrece como un archivo de audio independiente, como el componente de audio de un vídeo, o incrustado mediante un reproductor de pódcast, el elemento HTML5 <audio> o un widget de medios de terceros. El requisito se refiere a la producción del propio contenido de audio, no a un elemento HTML específico ni a un atributo ARIA — por lo que las herramientas de análisis automatizado no pueden detectar de forma fiable las infracciones y siempre es necesaria la revisión manual del contenido de audio real.

Por qué es importante

Aproximadamente 1.5 mil millones de personas en todo el mundo viven con algún grado de pérdida auditiva, según la Organización Mundial de la Salud. Incluso una pérdida auditiva moderada puede hacer extremadamente difícil — a veces imposible — aislar la voz de una persona cuando la música de fondo, el ruido ambiental u otros elementos de audio se mezclan a niveles de volumen similares o competitivos. Para las personas que dependen de audífonos o implantes cocleares, la interferencia del audio de fondo se amplifica junto con la voz, lo que empeora drásticamente la inteligibilidad en lugar de mejorarla.

Las personas con discapacidades cognitivas, incluidas aquellas con trastornos por déficit de atención, trastornos del procesamiento auditivo o lesiones cerebrales traumáticas, también se enfrentan a desafíos significativos cuando las pistas de audio contienen sonidos que compiten entre sí. Incluso cuando la persona oyente no tiene una pérdida auditiva medible, su cerebro puede tener dificultades para filtrar las señales de audio irrelevantes y concentrarse en el contenido hablado, lo que provoca fatiga, fallos de comprensión o una exclusión completa del contenido.

Considera un escenario concreto del mundo real: una agencia gubernamental turca publica un audio grabado que explica cómo pueden las personas ciudadanas solicitar una prestación social. La voz de la narradora se mezcla sobre una pista continua de música de fondo a niveles de volumen aproximadamente iguales. Una persona con pérdida auditiva neurosensorial moderada visita la página usando un audífono. Como el audífono amplifica todas las frecuencias simultáneamente, la música compite directamente con la voz de la narradora. La persona no puede entender las instrucciones y pierde un plazo para su solicitud de prestación. Si el audio se hubiera grabado sin música de fondo, o si se hubiera proporcionado un control de volumen para suprimir la pista de fondo de forma independiente, la persona habría tenido acceso igualitario a la información.

Más allá de la discapacidad, un audio claro con ruido de fondo mínimo mejora la comprensión para todas las personas usuarias — quienes escuchan en entornos ruidosos en dispositivos móviles, las personas que no son hablantes nativas del idioma utilizado, y quienes se encuentran en situaciones de bajo ancho de banda donde la calidad del audio ya puede estar degradada. También hay beneficios indirectos de SEO: las transcripciones de audio claramente inteligible producen contenido de texto de mayor calidad que los motores de búsqueda pueden indexar, mejorando la capacidad de descubrimiento de tu contenido.

Reglas relacionadas de Axe-core

WCAG 1.4.7 requiere pruebas manuales. No existe una regla automatizada de axe-core que pueda detectar esta infracción, y esto es intencional. Los escáneres de accesibilidad automatizados como axe-core, Lighthouse o IBM Equal Access Checker funcionan analizando la estructura del DOM, los atributos HTML, los roles ARIA y los estilos calculados de una página web. No tienen capacidad para:

  • Analizar el contenido de audio de un archivo: Los escáneres no pueden abrir un archivo de audio o vídeo y medir los niveles relativos de decibelios de la voz en primer plano frente al audio de fondo. Hacerlo requeriría un procesamiento de señal de audio muy por encima del alcance de un comprobador de accesibilidad basado en el DOM.
  • Detectar si existe un control independiente para el audio de fondo y si funciona correctamente: Incluso si hay un control de interfaz de usuario etiquetado como "Turn off background music" presente en el DOM, un escáner no puede verificar que realmente suprima la pista de audio de fondo sin afectar a la pista de voz, ni puede verificar que el control funcione como se espera en todos los navegadores.
  • Distinguir entre audio hablado y no hablado: Las herramientas automatizadas no pueden clasificar de forma fiable un archivo de audio como principalmente de voz, principalmente musical o principalmente ambiental, lo cual es la determinación previa necesaria antes de que el criterio siquiera se aplique.

Dado que toda la evaluación debe realizarla una persona revisora escuchando el contenido y, cuando sea necesario, utilizando software de análisis de audio para medir los niveles de decibelios, axe-core marca este criterio como algo que requiere revisión manual. Cuando ejecutas axe DevTools en una página que contiene elementos <audio> o <video>, la herramienta puede mostrar un aviso general relacionado con medios que te recuerde evaluar manualmente los criterios de calidad del audio, pero no emitirá automáticamente un veredicto de cumplimiento o incumplimiento para 1.4.7.

Cómo hacer las pruebas

  1. Haz un inventario de todo el contenido de audio de la página. Carga la página e identifica cada elemento <audio>, cada elemento <video> con pista de audio, cada pódcast o reproductor de medios incrustado y cualquier audio de fondo que se reproduzca automáticamente. Determina si cada pieza de audio está pregrabada y contiene voz en primer plano. Si se trata de una pista de música pura o de sonido ambiental sin voz, 1.4.7 no se aplica.
  2. Ejecuta un análisis automatizado para detectar problemas de base. Usa axe DevTools, Lighthouse o la auditoría integrada del widget Accsible para analizar la página. Aunque estas herramientas no evaluarán la calidad del audio, pueden señalar subtítulos faltantes, ausencia de atributos controls en elementos <audio> u otros problemas relacionados con la accesibilidad de medios. Aborda cualquier problema señalado antes de proceder a la evaluación manual del audio.
  3. Escucha cada pista de audio que cumpla las condiciones en su totalidad. Usa el reproductor integrado en la página o descarga el archivo y ábrelo en un reproductor multimedia. Escucha específicamente si hay música de fondo, sonido ambiental u otro audio no hablado que se reproduzca simultáneamente con la voz en primer plano.
  4. Evalúa si el audio de fondo puede desactivarse de forma independiente. Si el reproductor proporciona un control separado para silenciar o bajar la música de fondo sin afectar a la pista de voz, verifica que este control funcione como se espera en Chrome, Firefox y Safari. Haz pruebas solo con teclado para confirmar que el control es accesible.
  5. Mide los niveles de decibelios si hay audio de fondo y no puede desactivarse. Importa el archivo de audio en un editor de audio gratuito como Audacity. Usa la vista de forma de onda o espectrograma integrada y la herramienta "Analyze > Contrast" (o equivalente) para medir el nivel RMS promedio de los segmentos de voz frente al nivel RMS promedio de los segmentos de audio de fondo. Confirma que la diferencia sea de al menos 20 dB. Si no tienes acceso a software de análisis de audio, utiliza tu criterio profesional como persona oyente con experiencia: si una persona típica con pérdida auditiva leve encontraría el audio de fondo distractor u ocultando la voz, trátalo como un probable incumplimiento.
  6. Haz pruebas con tecnologías de apoyo. Usando NVDA con Firefox, VoiceOver con Safari en macOS y JAWS con Chrome, navega hasta cada reproductor de audio. Confirma que todos los controles — incluido cualquier conmutador independiente para el audio de fondo — sean alcanzables con el teclado (Tab/Shift+Tab), anunciados correctamente por el lector de pantalla y operables con Enter o Space. Esto no prueba directamente la calidad del audio, pero confirma que cualquier control de corrección que hayas añadido sea accesible.
  7. Documenta los hallazgos. Registra qué archivos de audio cumplen (sin audio de fondo, control disponible para la persona usuaria o diferencia de 20 dB confirmada), cuáles incumplen y cuáles están exentos (efectos de sonido breves de menos de 2 segundos o audio que es principalmente música en lugar de voz).

Cómo corregir

Escenario 1: Música de fondo mezclada demasiado alta — Incorrecto

<!-- Audio file contains a narrator speaking over background music
     mixed at roughly equal volume levels. No separate control exists.
     This fails WCAG 1.4.7 because background audio is not 20 dB below speech
     and cannot be turned off independently. -->
<audio controls src='product-explainer.mp3'>
  Your browser does not support the audio element.
</audio>

Escenario 1: Música de fondo mezclada demasiado alta — Correcto

<!-- The audio file has been re-exported with no background music.
     If background music is desired for branding, produce two separate
     audio tracks: one speech-only and one with music. Offer the
     speech-only version as the default accessible option. -->
<audio controls src='product-explainer-speech-only.mp3'>
  Your browser does not support the audio element.
</audio>
<p>
  <a href='product-explainer-with-music.mp3'>
    Listen to version with background music (may be harder to follow for some users)
  </a>
</p>

Escenario 2: Audio de fondo con un control de silencio independiente — Incorrecto

<!-- A custom player claims to offer background audio control,
     but the button is not keyboard-accessible and has no accessible name.
     Sighted mouse users can click it, but screen reader users and
     keyboard-only users cannot reach or operate the control. -->
<div class='player'>
  <audio id='main-audio' src='lecture-with-ambience.mp3'></audio>
  <button onclick='document.getElementById("main-audio").play()'>Play</button>
  <div onclick='toggleBackground()' style='cursor:pointer'>
    <img src='music-icon.png'>
  </div>
</div>

Escenario 2: Audio de fondo con un control de silencio independiente — Correcto

<!-- The background audio toggle is now a proper <button> element with
     an accessible name, keyboard focus, and an aria-pressed state so
     screen readers announce whether background audio is on or off. -->
<div class='player'>
  <audio id='main-audio' src='lecture-with-ambience.mp3'></audio>
  <audio id='bg-audio' src='background-ambience.mp3' loop></audio>
  <button onclick='document.getElementById("main-audio").play()'>Play lecture</button>
  <button
    id='bg-toggle'
    aria-pressed='true'
    onclick='toggleBackground()'
  >
    Background audio: on
  </button>
</div>
<script>
  function toggleBackground() {
    var bg = document.getElementById('bg-audio');
    var btn = document.getElementById('bg-toggle');
    if (bg.paused) {
      bg.play();
      btn.setAttribute('aria-pressed', 'true');
      btn.textContent = 'Background audio: on';
    } else {
      bg.pause();
      btn.setAttribute('aria-pressed', 'false');
      btn.textContent = 'Background audio: off';
    }
  }
</script>

Escenario 3: Audio de fondo con reproducción automática al cargar la página — Incorrecto

<!-- Background audio autoplays when the page loads and there is
     no way to turn it off. If a narrator audio also plays, the
     background audio will compete with it and cannot be suppressed. -->
<audio autoplay loop src='ambient-background.mp3'></audio>
<audio controls src='welcome-message.mp3'></audio>

Escenario 3: Audio de fondo con reproducción automática al cargar la página — Correcto

<!-- Background audio does not autoplay. A clearly labeled, keyboard-
     accessible button allows the user to opt in if desired. The speech
     audio is presented independently and cleanly without competition. -->
<audio id='bg' loop src='ambient-background.mp3'></audio>
<button onclick='document.getElementById("bg").play()'>
  Play background music (optional)
</button>
<audio controls src='welcome-message.mp3'>
  Your browser does not support the audio element.
</audio>

Errores comunes

  • Mezclar la música de fondo a -10 dB en lugar de los -20 dB requeridos: Las personas productoras suelen aplicar una reducción de volumen moderada a la música de fondo y asumir que es suficiente. El estándar WCAG exige una diferencia completa de 20 dB (aproximadamente cuatro veces más silencioso), no solo una reducción perceptible. Verifica siempre con una herramienta de análisis de audio en lugar de basarte únicamente en el juicio subjetivo.
  • Confundir el control de volumen general del reproductor con un control independiente del audio de fondo: Un control maestro de volumen que baja simultáneamente la voz y el audio de fondo no satisface la condición de "la persona usuaria puede desactivar el audio de fondo". El control debe suprimir solo el audio de fondo sin afectar a la voz en primer plano.
  • Suponer que el criterio solo se aplica a archivos de audio independientes: Muchas personas desarrolladoras pasan por alto que la pista de audio de un elemento de vídeo también está sujeta por igual a 1.4.7. Un vídeo explicativo con música de fondo alta mezclada en la pista de audio incumple el criterio igual que lo haría un archivo de pódcast.
  • Tratar todos los sonidos breves como exentos: La exención de las WCAG para efectos de sonido breves se aplica solo a sonidos que duran dos segundos o menos. Un jingle corto recurrente que se repite cada pocos segundos, o un bucle de fondo de sonidos cortos, no está cubierto por esta exención y debe seguir cumpliendo.
  • No probar el conmutador de audio de fondo con navegación solo por teclado: Los equipos suelen implementar un botón de silencio visualmente atractivo usando un elemento no interactivo como un <div> o un <span>, que no es alcanzable con la tecla Tab ni operable con Enter o Space. Usa un elemento nativo <button> para que la compatibilidad con teclado y tecnologías de apoyo esté integrada.
  • Olvidar añadir aria-pressed o un estado equivalente a los botones de conmutación del audio de fondo: Sin un indicador de estado, las personas usuarias de lectores de pantalla pueden operar el botón pero no pueden saber si el audio de fondo está actualmente activado o desactivado. Refleja siempre el estado actual en el nombre accesible del botón o mediante aria-pressed.
  • Producir solo un archivo de audio mezclado en lugar de ofrecer pistas separadas: Cuando el audio de fondo es parte integral de la intención creativa, los equipos suelen exportar un único archivo mezclado en lugar de ofrecer una alternativa solo de voz. Proporcionar una versión separada solo de voz cuesta muy poco esfuerzo adicional de producción y elimina por completo el riesgo de incumplimiento.
  • Aplicar 1.4.7 a transmisiones de audio en directo: El criterio cubre explícitamente solo audio pregrabado. Las emisiones de audio en directo no están sujetas a esta regla específica, aunque otros criterios como 1.4.4 (Redimensionar texto) y los requisitos de subtitulado pueden seguir aplicándose al contenido asociado.
  • Descuidar la revisión de reproductores incrustados de terceros: Cuando el contenido se incrusta desde plataformas externas (alojadores de pódcast, CDNs de vídeo, servicios para compartir audio), los equipos suelen asumir que el cumplimiento es responsabilidad de la plataforma. Sin embargo, la persona propietaria de la página es responsable de la accesibilidad de todo el contenido de sus páginas, incluidos los medios incrustados. Verifica que el reproductor de terceros cumpla los requisitos de calidad de audio o que ofrezca los controles necesarios.
  • Medir niveles pico en lugar de niveles RMS promedio al comprobar el requisito de 20 dB: El umbral de 20 dB en WCAG 1.4.7 se refiere a la sonoridad perceptiva del audio, que se aproxima mejor mediante niveles RMS (Root Mean Square) promedio, no niveles pico instantáneos. Usar mediciones de nivel pico puede producir lecturas engañosamente favorables que no reflejan la experiencia de escucha real.

Relación con la normativa de accesibilidad de Turquía

La Circular Presidencial 2025/10 de Turquía, publicada en el Boletín Oficial n.º 32933 el 21 de junio de 2025, establece requisitos obligatorios de accesibilidad digital para una amplia gama de entidades del sector público y privado que operan en Turquía. La Circular adopta WCAG 2.2 como su estándar técnico normativo y define obligaciones específicas de conformidad según el tipo de organización.

Las entidades sujetas al cumplimiento obligatorio según la Circular incluyen instituciones públicas y organismos gubernamentales de todos los niveles, plataformas de comercio electrónico, bancos y proveedores de servicios financieros, hospitales e instituciones sanitarias, operadores de telecomunicaciones con 200,000 o más abonados, agencias de viajes con licencia, empresas de transporte privado y escuelas privadas autorizadas por el Ministerio de Educación Nacional (MoNE). Estas organizaciones están obligadas a cumplir como mínimo con WCAG 2.2 Nivel A y Nivel AA.

WCAG 1.4.7 — Audio de fondo bajo o inexistente — es un criterio de Nivel AAA. Esto significa que no se encuentra entre los criterios que las entidades cubiertas están legalmente obligadas a cumplir según los requisitos de base de la Circular 2025/10. Sin embargo, se aplican varias consideraciones importantes. En primer lugar, las organizaciones que se comprometen voluntariamente a la conformidad AAA — o que atienden a poblaciones con altas concentraciones de personas usuarias con discapacidad auditiva, como hospitales, clínicas de audiología o agencias de servicios sociales — deberían tratar 1.4.7 como efectivamente obligatorio en su contexto. En segundo lugar, cualquier entidad cuyos servicios digitales incluyan contenido instructivo basado en audio, grabaciones de atención al cliente, módulos de aprendizaje en línea o emisiones informativas dirigidas al público comprobará que cumplir 1.4.7 mejora sustancialmente la usabilidad real de esos servicios para la ciudadanía turca con discapacidades auditivas.

Turquía tiene una población significativa de personas con discapacidad auditiva, y la Circular refleja el compromiso del gobierno de garantizar una participación digital en igualdad de condiciones. Aunque los criterios AAA se presentan como aspiracionales en el estándar técnico, se anima especialmente a las instituciones públicas turcas a superar los requisitos mínimos siempre que su contenido y recursos lo permitan. Demostrar el cumplimiento de 1.4.7 indica madurez organizativa, reduce el riesgo legal y reputacional y sitúa a los servicios digitales turcos como líderes en diseño inclusivo tanto a nivel nacional como en mercados internacionales donde la conformidad AAA puede ser un requisito contractual.