WCAG 1.2.2 : Sous-titres (préenregistré)

La WCAG 1.2.2 exige que tout contenu audio préenregistré dans des médias synchronisés (vidéo avec audio) comporte des sous-titres précis. Cela garantit que les personnes sourdes et malentendantes peuvent accéder aux dialogues parlés, aux effets sonores et aux autres informations audio significatives.

Ce que signifie cette règle

WCAG 1.2.2 — Sous-titres (préenregistrés) exige que des sous-titres soient fournis pour tout contenu audio préenregistré dans des médias synchronisés. Les médias synchronisés sont définis comme du contenu audio ou vidéo synchronisé avec un autre format et/ou avec des composants interactifs basés sur le temps — en pratique, cela signifie tout fichier vidéo qui contient également de l’audio, comme des cours enregistrés, des démonstrations de produits, des extraits d’actualités, des témoignages ou des vidéos marketing.

Les sous-titres sont une alternative textuelle synchronisée avec la chronologie de la vidéo. Ils doivent transmettre non seulement le dialogue parlé, mais aussi tout autre audio significatif — y compris l’identification des locuteurs, les effets sonores pertinents (tels que [applaudissements], [claquement de porte] ou [musique]), ainsi que le ton ou la manière de parler lorsque cela affecte la compréhension. Cela distingue les sous-titres des sous-titres de traduction (subtitles), qui présentent généralement uniquement les paroles prononcées et sont destinés à des publics qui peuvent entendre l’audio mais ne comprennent pas la langue parlée.

Un succès au regard de ce critère exige tous les éléments suivants : des sous-titres existent pour tous les médias synchronisés préenregistrés, ils sont correctement synchronisés avec l’audio correspondant, ils décrivent tout l’audio significatif (dialogue, identité des locuteurs, effets sonores pertinents) et ils sont disponibles au même emplacement que le média lui-même — et non simplement liés depuis une page distincte.

Un échec se produit lorsque : aucun sous-titre n’est fourni, des sous-titres existent mais sont inexacts ou incomplets (par exemple, générés automatiquement sans correction), les sous-titres omettent un audio non verbal significatif, les sous-titres sont présents mais pas correctement synchronisés, ou les sous-titres sont fournis uniquement sous forme de transcription séparée (une transcription seule ne satisfait pas ce critère).

La seule exception officielle définie dans les WCAG concerne les médias qui sont eux-mêmes une alternative média à du texte. Par exemple, si une page web contient un article écrit et une vidéo qui ne fait que présenter à nouveau la même information que cet article, et que la vidéo est clairement étiquetée comme telle, alors les sous-titres pour la vidéo ne sont pas requis. Cette exception est étroite et intentionnelle — elle ne doit pas être utilisée comme une faille pour éviter de sous-titrer des vidéos qui contiennent un contenu substantiel non disponible par ailleurs sous forme textuelle.

Les sous-titres peuvent être ouverts (intégrés directement dans la vidéo et toujours visibles) ou fermés (fournis sous forme de piste séparée que les utilisateurs peuvent activer ou désactiver). Les deux sont acceptables au regard de WCAG 1.2.2, bien que les sous-titres fermés soient généralement préférables car ils permettent aux utilisateurs de personnaliser l’apparence et peuvent être désactivés par ceux qui n’en ont pas besoin. En HTML, les sous-titres fermés sont généralement implémentés à l’aide de l’élément <track> avec kind='captions' à l’intérieur d’un élément <video>, pointant vers un fichier de sous-titres WebVTT ou SRT.

Pourquoi c’est important

Environ 466 millions de personnes dans le monde vivent avec une perte auditive invalidante, selon l’Organisation mondiale de la santé — un chiffre qui devrait dépasser 900 millions d’ici 2050. Au-delà des personnes atteintes de surdité profonde, une population bien plus large connaît des difficultés auditives situationnelles : des personnes dans des environnements bruyants tels que les transports publics, les bureaux en open space ou les cafés bondés qui ne peuvent pas entendre l’audio même avec une audition fonctionnelle, des utilisateurs qui ont temporairement perdu l’accès au matériel audio, et des personnes qui regardent du contenu dans des environnements calmes où l’audio doit être coupé.

Pour les utilisateurs sourds ou malentendants, les sous-titres ne sont pas un confort — ils sont le seul moyen d’accéder au contenu parlé d’une vidéo. Sans sous-titres, une personne sourde visitant un site d’e-commerce ne peut pas comprendre une vidéo de démonstration de produit, un étudiant sourd ne peut pas suivre un cours enregistré, et un patient sourd ne peut pas assimiler les informations d’une vidéo d’instructions d’un hôpital. L’information leur est totalement inaccessible, quel que soit le degré de clarté de la vidéo ou la qualité de la production.

Les sous-titres bénéficient également aux personnes ayant des handicaps cognitifs et des troubles d’apprentissage, comme celles atteintes de trouble du déficit de l’attention avec ou sans hyperactivité ou de dyslexie, qui peuvent trouver plus facile de traiter l’information lorsqu’elle est présentée simultanément sous forme audio et textuelle. Les locuteurs non natifs en bénéficient car les sous-titres renforcent la compréhension d’une parole accentuée ou rapide. Les personnes âgées souffrant d’une baisse de l’audition liée à l’âge — une condition qui touche environ un tiers des personnes de plus de 65 ans — s’appuient également sur les sous-titres.

Considérons un scénario concret : une banque turque publie une vidéo sur son site expliquant comment ouvrir un compte numérique. Une cliente potentielle sourde visite le site. Sans sous-titres, elle ne peut comprendre aucune des étapes énoncées, ne peut pas suivre le processus et est incapable de mener la démarche à bien — créant à la fois un échec en matière d’accessibilité et une opportunité commerciale manquée pour la banque. Avec des sous-titres précis et synchronisés, elle suit chaque étape, termine l’onboarding et devient cliente.

Au-delà de l’accès pour les personnes handicapées, les sous-titres offrent des avantages mesurables en matière de SEO et d’utilisabilité. Les fichiers de sous-titres au format WebVTT ou SRT sont lisibles par machine, ce qui signifie que les moteurs de recherche peuvent indexer le texte intégral du contenu vidéo, améliorant ainsi la découvrabilité. Des études ont montré qu’une majorité de spectateurs regardent les vidéos sur les réseaux sociaux sans le son, ce qui fait des sous-titres une fonctionnalité d’utilisabilité pour le grand public. Les sous-titres facilitent également la compréhension, par les moteurs de recherche et les outils d’évaluation de l’accessibilité, de l’objectif et du contenu des vidéos intégrées, contribuant ainsi aux signaux globaux de qualité de la page.

Règles Axe-core associées

WCAG 1.2.2 nécessite des tests manuels. Il n’existe aucune règle axe-core automatisée qui détecte de manière fiable l’absence ou l’inexactitude des sous-titres pour les médias synchronisés préenregistrés. Les raisons en sont fondamentales pour la façon dont les tests automatisés fonctionnent :

Test manuel requis — absence de piste de sous-titres : Un outil automatisé peut détecter qu’un élément <video> ne comporte pas d’élément <track kind='captions'>, et certains outils signaleront cela comme un problème potentiel. Cependant, l’outil ne peut pas déterminer si la vidéo contient réellement un contenu audio significatif (il peut s’agir d’une vidéo muette), si des sous-titres ouverts (intégrés) sont présents dans la vidéo elle-même, ou si la vidéo remplit les conditions de l’exception relative à l’alternative média. Un examen humain est nécessaire pour prendre cette décision.
Test manuel requis — exactitude et exhaustivité des sous-titres : Même lorsqu’un fichier de piste de sous-titres est présent et lié, un outil automatisé ne peut pas évaluer si les sous-titres reflètent fidèlement ce qui est dit, s’ils incluent les effets sonores pertinents et l’identification des locuteurs, ou s’ils sont correctement synchronisés avec l’audio. Un fichier de sous-titres contenant un texte entièrement erroné, un charabia généré automatiquement, ou des sous-titres systématiquement décalés de 10 secondes passerait la détection automatisée mais échouerait au regard du critère. Seul un examinateur humain qui regarde la vidéo tout en lisant les sous-titres peut évaluer l’exactitude.
Test manuel requis — sous-titres ouverts : Si les sous-titres sont intégrés directement dans le fichier vidéo (sous-titres ouverts), les outils automatisés n’ont aucun moyen de le détecter. Ils ne voient qu’un élément <video> sans piste et ne peuvent pas analyser le contenu visuel des images vidéo pour déterminer si du texte est présent.

En raison de ces limitations, WCAG 1.2.2 doit toujours inclure une étape de revue humaine dans le cadre de tout audit complet. Les analyses automatisées servent de premier passage utile pour identifier les éléments de piste manifestement manquants, mais elles ne peuvent pas se substituer à une évaluation manuelle de la qualité, de l’exactitude et de la synchronisation des sous-titres.

Comment tester

Recenser tous les médias synchronisés : Avant d’exécuter un outil, examinez manuellement la page pour identifier chaque élément vidéo — balises <video> intégrées, lecteurs intégrés via iframe (YouTube, Vimeo, tiers) et tout lecteur multimédia HTML5. Dressez la liste de chaque vidéo et notez si elle contient un audio significatif (dialogue, narration, effets sonores importants). Les vidéos sans piste audio ou avec uniquement une musique de fond sans contenu informationnel peuvent être traitées différemment, mais documentez votre raisonnement.
Exécuter une analyse automatisée avec axe DevTools ou Lighthouse : Ouvrez axe DevTools dans les outils de développement du navigateur et lancez une analyse de page complète. Recherchez toute violation ou tout élément incomplet lié aux éléments vidéo ou audio. Lighthouse (exécuté via Chrome DevTools dans la catégorie d’audit Accessibilité) signalera de la même manière les vidéos dépourvues d’élément <track>. Notez qu’un résultat automatisé sans erreur ne signifie pas que le critère est satisfait — cela signifie seulement qu’aucune piste manifestement manquante n’a été détectée. Considérez les résultats automatisés comme un point de départ, non comme une conclusion.
Inspecter le code source HTML : Pour chaque élément <video> sur la page, inspectez le DOM pour vérifier si un élément <track kind='captions'> est présent et si son attribut src pointe vers un fichier de sous-titres valide et accessible (WebVTT ou SRT). Vérifiez que l’attribut srclang est défini sur la langue appropriée. Confirmez que le fichier se charge sans erreur réseau en ouvrant l’URL directement dans le navigateur.
Lire la vidéo et évaluer manuellement les sous-titres : Activez les sous-titres dans le lecteur vidéo (ou confirmez qu’ils apparaissent automatiquement si des sous-titres ouverts sont utilisés). Regardez la vidéo dans son intégralité — ou un échantillon statistiquement représentatif couvrant le début, le milieu et la fin. Pour chaque segment, vérifiez : (a) le dialogue est transcrit avec précision sans erreurs significatives, (b) les changements de locuteur sont identifiés lorsque cela aide à la compréhension, (c) l’audio non verbal significatif est décrit entre crochets (par exemple, [sonnerie de téléphone]), et (d) les sous-titres apparaissent et disparaissent en synchronisation avec l’audio — pas significativement en avance ou en retard par rapport aux paroles.
Tester avec un lecteur d’écran lorsque pertinent : En utilisant NVDA avec Firefox, VoiceOver avec Safari ou JAWS avec Chrome, naviguez jusqu’à l’élément vidéo. Confirmez que les contrôles du lecteur sont accessibles au clavier et que l’activation ou la désactivation des sous-titres peut se faire sans souris. Cela teste l’utilisabilité de la fonctionnalité de sous-titrage en plus de son existence.
Tester les lecteurs intégrés tiers : Pour les iframes intégrant des lecteurs YouTube ou Vimeo, ouvrez la vidéo directement sur la plateforme et vérifiez que des sous-titres ont été téléversés et sont activés par défaut ou facilement activables. Les sous-titres générés automatiquement sur des plateformes comme YouTube ne satisfont pas WCAG 1.2.2 à moins d’avoir été revus et corrigés pour en garantir l’exactitude.
Documenter les succès/échecs avec des preuves : Pour chaque vidéo testée, enregistrez l’URL de la page, le titre ou la description de la vidéo, la présence ou non de sous-titres, et votre évaluation de leur exactitude. Des captures d’écran ou des notes horodatées issues de la revue servent de preuves d’audit.

Comment corriger

Vidéo HTML5 sans aucune piste de sous-titres — Incorrect

<!-- Fails 1.2.2: video with audio has no caption track at all -->
<video controls width='800'>
  <source src='product-demo.mp4' type='video/mp4'>
  Your browser does not support the video element.
</video>

Vidéo HTML5 sans aucune piste de sous-titres — Correct

<!-- Passes 1.2.2: a WebVTT caption track is linked with kind='captions' -->
<video controls width='800'>
  <source src='product-demo.mp4' type='video/mp4'>
  <!-- The track element links the WebVTT file; srclang and label aid player UI -->
  <track
    kind='captions'
    src='product-demo-captions-en.vtt'
    srclang='en'
    label='English Captions'
    default
  >
  Your browser does not support the video element.
</video>

Vidéo multilingue avec uniquement une piste de sous-titres de traduction, sans sous-titres complets — Incorrect

<!-- Fails 1.2.2: kind='subtitles' provides translated dialogue but omits -->
<!-- sound effect descriptions and speaker identification needed for deaf users -->
<video controls width='800'>
  <source src='webinar.mp4' type='video/mp4'>
  <track kind='subtitles' src='webinar-tr.vtt' srclang='tr' label='Turkish'>
</video>

Vidéo multilingue avec uniquement une piste de sous-titres de traduction, sans sous-titres complets — Correct

<!-- Passes 1.2.2: a dedicated captions track is provided alongside subtitles. -->
<!-- The captions file includes [Speaker: Dr. Aydin], [applause], etc. -->
<video controls width='800'>
  <source src='webinar.mp4' type='video/mp4'>
  <track
    kind='captions'
    src='webinar-captions-tr.vtt'
    srclang='tr'
    label='Turkish Captions'
    default
  >
  <track kind='subtitles' src='webinar-en.vtt' srclang='en' label='English'>
</video>

Intégration YouTube reposant sur des sous-titres auto-générés non corrigés — Incorrect

<!-- Fails 1.2.2: uncorrected auto-captions are not considered accurate captions -->
<iframe
  width='800'
  height='450'
  src='https://www.youtube.com/embed/VIDEOID'
  title='Company Introduction Video'
  allowfullscreen
></iframe>

Intégration YouTube avec des sous-titres vérifiés et édités par des humains — Correct

<!-- Passes 1.2.2 provided that captions have been uploaded or reviewed -->
<!-- in YouTube Studio and confirmed accurate by a human reviewer. -->
<!-- The &cc_load_policy=1 parameter enables captions by default. -->
<iframe
  width='800'
  height='450'
  src='https://www.youtube.com/embed/VIDEOID?cc_load_policy=1&cc_lang_pref=tr'
  title='Company Introduction Video'
  allowfullscreen
></iframe>
<!-- Also ensure in YouTube Studio that the caption track is marked as -->
<!-- human-reviewed and that auto-captions have been corrected. -->

Erreurs courantes

Fournir une transcription textuelle au lieu de sous-titres synchronisés : Une transcription qui apparaît en dessous ou à côté d’une vidéo satisfait WCAG 1.2.3 (Description audio ou alternative média) dans certains contextes, mais ne satisfait pas 1.2.2. Les sous-titres doivent être synchronisés avec la chronologie de la vidéo afin que le texte apparaisse au moment où l’audio correspondant se produit. Un bloc de texte statique ne répond pas à cette exigence.
Utiliser kind='subtitles' au lieu de kind='captions' : Les sous-titres de traduction (subtitles) sont conçus pour les spectateurs qui peuvent entendre l’audio mais ne comprennent pas la langue — ils incluent généralement uniquement le dialogue parlé traduit dans une autre langue. Les sous-titres (captions) sont conçus pour les spectateurs qui ne peuvent pas entendre l’audio du tout — ils doivent inclure l’identification des locuteurs, les effets sonores significatifs et d’autres informations non verbales. Remplacer une piste de sous-titres complets par une piste de sous-titres de traduction là où une piste de sous-titres est requise est une erreur fréquente et lourde de conséquences.
Se fier à des sous-titres auto-générés non corrigés provenant de YouTube ou de plateformes similaires : Les sous-titres générés automatiquement utilisent la reconnaissance vocale et produisent fréquemment des erreurs, en particulier pour la terminologie technique, les noms propres, les accents ou la parole rapide. Les WCAG exigent des sous-titres exacts. Des sous-titres générés automatiquement qui n’ont pas été revus et corrigés par un humain ne répondent pas au standard d’exactitude de 1.2.2.
Inclure un élément <track> mais le faire pointer vers un fichier VTT manquant ou défectueux : Si l’attribut src de l’élément track référence un chemin de fichier qui renvoie une erreur 404, les sous-titres échoueront silencieusement à se charger. Le HTML passe l’inspection automatisée, mais l’utilisateur ne reçoit aucun sous-titre. Vérifiez toujours que l’URL du fichier de sous-titres se résout correctement en production.
Omettre l’audio non verbal significatif dans les fichiers de sous-titres : Un fichier de sous-titres qui transcrit uniquement les paroles mais ignore des sons importants — comme une alarme, une sonnerie de téléphone, des applaudissements ou un fracas central à la compréhension de la vidéo — échoue au regard du critère. Les sous-titres doivent décrire toutes les informations audio nécessaires à la compréhension du contenu, pas seulement le dialogue.
Sous-titres significativement désynchronisés par rapport à l’audio : Un fichier WebVTT avec des entrées d’horodatage incorrectes peut afficher les sous-titres plusieurs secondes avant ou après la parole correspondante. Cela perturbe la compréhension et constitue un échec, même si le texte des sous-titres est exact. Vérifiez toujours la synchronisation sur toute la durée de la vidéo, en particulier autour des changements de scène et des pauses.
Supposer que l’exception relative à l’alternative média s’applique largement : Certaines équipes supposent que parce qu’elles disposent d’un article écrit accompagnant une vidéo, la vidéo remplit les conditions d’alternative média et n’a pas besoin de sous-titres. L’exception s’applique uniquement lorsque la vidéo n’ajoute aucune information au-delà de ce que le texte contient déjà, que la relation est explicite pour les utilisateurs et que la vidéo est clairement étiquetée comme alternative. Une vidéo qui ajoute des démonstrations, un ton de voix ou des informations visuelles non couvertes par le texte ne remplit pas ces conditions.
Placer des contrôles de sous-titres accessibles uniquement à la souris : Même si des sous-titres existent, si le bouton permettant de les activer dans un lecteur vidéo personnalisé n’est pas accessible au clavier — par exemple, un <div> stylisé avec un gestionnaire onclick mais sans tabindex='0' ni gestionnaire d’événements clavier — les utilisateurs qui dépendent de la navigation au clavier ne peuvent pas activer les sous-titres. La fonctionnalité de sous-titrage elle-même doit être opérable au clavier.
Ne pas tester les sous-titres dans les lecteurs intégrés ou tiers : Les équipes testent souvent le comportement des sous-titres dans leur environnement de développement mais oublient que les intégrations en production via des lecteurs tiers (Vimeo, Wistia, JW Player) peuvent avoir un comportement de chargement des sous-titres, des états par défaut ou des configurations d’API différents. Testez toujours l’expérience de sous-titrage dans le contexte réel d’intégration en production.
Fournir des sous-titres dans une seule langue alors que le site s’adresse à des publics multilingues : Bien que les WCAG n’exigent pas strictement des sous-titres dans chaque langue prise en charge par un site, fournir des sous-titres dans une seule langue lorsque le site et le contenu vidéo sont disponibles en turc et en anglais, par exemple, signifie que certains utilisateurs reçoivent un contenu accessible tandis que d’autres non. La bonne pratique consiste à fournir des pistes de sous-titres correspondant à chaque version linguistique de la vidéo.

Lien avec la réglementation d’accessibilité de la Turquie

La circulaire présidentielle 2025/10 de la Turquie, publiée au Journal officiel n° 32933 le 21 juin 2025, établit des obligations contraignantes en matière d’accessibilité web pour un large éventail d’entités publiques et privées opérant en Turquie. La circulaire impose la conformité aux WCAG 2.2 au niveau A comme base minimale, la conformité au niveau AA étant fortement recommandée. WCAG 1.2.2 — Sous-titres (préenregistrés) est une exigence de niveau A, ce qui signifie qu’elle fait partie des obligations les plus fondamentales au titre de la circulaire et que la non-conformité constitue une violation réglementaire directe.

Les entités couvertes par la circulaire comprennent les institutions publiques et les organismes gouvernementaux à tous les niveaux, les plateformes d’e-commerce, les banques et institutions financières, les hôpitaux et prestataires de soins de santé, les opérateurs de télécommunications comptant 200,000 abonnés ou plus, les agences de voyage agréées, les entreprises de transport privé et les écoles privées autorisées par le ministère de l’Éducation nationale (MoNE). Les institutions publiques doivent atteindre la conformité dans l’année suivant la date de publication de la circulaire. Les entités du secteur privé relevant des catégories couvertes disposent d’un délai de deux ans pour se mettre en conformité.

Pour les organisations de ces catégories, l’implication pratique de WCAG 1.2.2 est claire : tout contenu vidéo publié sur un site web ou une plateforme numérique qui inclut un audio significatif doit être sous-titré avec exactitude. Cela est particulièrement important pour des secteurs tels que la banque, où les vidéos d’explication de produits et d’onboarding sont courantes ; la santé, où des vidéos d’éducation des patients sont fréquemment publiées en ligne ; et l’e-commerce, où les vidéos de démonstration de produits sont centrales dans l’expérience d’achat. Une banque qui publie un tutoriel vidéo non sous-titré expliquant comment utiliser la banque mobile, ou un hôpital qui met en ligne une vidéo non sous-titrée sur les instructions de soins post-opératoires, serait en violation directe des exigences de niveau A de la circulaire.

La circulaire n’établit pas une norme turque distincte — elle renvoie directement aux critères WCAG 2.2 reconnus internationalement, ce qui signifie que les équipes de conformité turques doivent suivre la spécification WCAG 1.2.2 telle que définie par le W3C et décrite dans cet article. Les organisations doivent documenter leurs pratiques de sous-titrage, conserver des enregistrements des versions de fichiers de sous-titres aux côtés du contenu vidéo et inclure l’exactitude des sous-titres comme étape standard dans leur flux de publication de contenu vidéo. Les audits d’accessibilité menés à des fins de conformité réglementaire doivent inclure une revue manuelle de l’exactitude des sous-titres, car les outils automatisés seuls sont insuffisants pour démontrer la conformité à ce critère.

Sources et références

Articles connexes

AWCAG 1.1.1 : Contenu non textuel AWCAG 1.2.1 : Audio seul et vidéo seule (préenregistrés)AWCAG 1.2.3 : Audiodescription ou alternative aux médias (préenregistré)