WCAG 達成基準 · Level A
WCAG 1.2.2: キャプション(事前録画)
WCAG 1.2.2 は、同期メディア(音声付き動画)内のすべての事前録音された音声コンテンツに、正確なキャプションを含めることを求めています。これにより、ろう者や難聴のユーザーが、話し言葉の会話、効果音、その他の意味のある音声情報にアクセスできるようになります。
- Level A
- Wcag
- Wcag 2 2 a
- 知覚可能
- アクセシビリティ
このルールの意味
WCAG 1.2.2 — キャプション(事前録音)では、同期メディア内のすべての事前録音された音声コンテンツにキャプションを提供することが求められています。同期メディアとは、別の形式や時間ベースのインタラクティブなコンポーネントと同期している音声または動画コンテンツと定義されます。実務上は、録画講義、製品デモ、ニュースクリップ、証言動画、マーケティング動画など、音声を含むあらゆる動画ファイルを意味します。
キャプションは、動画のタイムラインと同期したテキストによる代替手段です。キャプションは、話されている対話だけでなく、話者の識別、関連する効果音([applause]、[door slams]、[music plays] など)、理解に影響する話し方や口調など、その他の意味のある音声も伝えなければなりません。これは、通常は話し言葉のみを表示し、音声は聞こえるが話されている言語を理解できない視聴者を対象とする字幕と区別されます。
この達成基準における適合(パス)には、次のすべてが必要です。すべての事前録音された同期メディアにキャプションが存在すること、キャプションが対応する音声と正確に同期していること、キャプションがすべての意味のある音声(対話、話者の識別、関連する効果音)を記述していること、そしてキャプションがメディアそのものと同じ場所で利用可能であること(別ページからのリンクだけではないこと)。
不適合(フェイル)となるのは、キャプションがまったく提供されていない場合、キャプションは存在するが不正確または不完全な場合(例:修正されていない自動生成キャプション)、キャプションが意味のある非音声情報を省略している場合、キャプションは存在するが適切に同期していない場合、あるいはキャプションが別個のトランスクリプトとしてのみ提供されている場合です(トランスクリプトだけではこの達成基準を満たしません)。
WCAG で定義されている唯一の公式な例外は、メディア自体がテキストのメディア代替である場合です。たとえば、ウェブページに記事の本文があり、その記事と同じ情報を単に再提示する動画があり、その動画がそのようなものとして明確にラベル付けされている場合、その動画にはキャプションは不要です。この例外は範囲が狭く意図的なものであり、テキストとしては提供されていない実質的なコンテンツを含む動画へのキャプション付与を回避する抜け道として使うべきではありません。
キャプションは、オープンキャプション(動画に直接焼き込まれて常に表示されるもの)でも、クローズドキャプション(ユーザーがオン/オフを切り替えられる別トラックとして提供されるもの)でも構いません。どちらも WCAG 1.2.2 の下で許容されますが、クローズドキャプションは表示のカスタマイズが可能で、不要なユーザーはオフにできるため、一般的には望ましいとされています。HTML では、クローズドキャプションは通常、<video> 要素内で kind='captions' を指定した <track> 要素を用い、WebVTT または SRT のキャプションファイルを参照することで実装されます。
なぜ重要か
世界保健機関によると、世界で約 4億6600万人が日常生活に支障をきたす難聴とともに生活しており、この数字は 2050年までに 9億人を超えると予測されています。重度のろう者にとどまらず、状況的な聴取の困難を経験する人々はさらに多く存在します。公共交通機関、オープンプランオフィス、混雑したカフェなどの騒がしい環境で、聴力自体はあっても音声が聞き取れない人、音声ハードウェアへのアクセスを一時的に失っているユーザー、静かな環境で音声をミュートせざるを得ない状況でコンテンツを視聴している人などです。
ろう者や難聴のユーザーにとって、キャプションは単なる利便性ではなく、動画の話し言葉コンテンツにアクセスする唯一の手段です。キャプションがなければ、EC サイトを訪れたろう者のユーザーは製品デモ動画の内容を理解できず、ろうの学生は録画講義についていくことができず、ろうの患者は病院の説明動画の情報を理解できません。動画がどれほど鮮明に撮影されていても、制作品質がどれほど高くても、その情報は彼らにとって完全にアクセス不能です。
キャプションは、注意欠如・多動症やディスレクシアなどの認知・学習障害のある人々にとっても有益であり、音声とテキストが同時に提示される方が情報を処理しやすい場合があります。非母語話者は、アクセントのある話し方や速い話し言葉の理解をキャプションによって補強できます。65歳以上の約 3分の1に影響するとされる加齢性難聴のある高齢ユーザーも、キャプションに依存しています。
具体的なシナリオを考えてみましょう。あるトルコの銀行が、自社サイトにデジタル口座の開設方法を説明する動画を掲載したとします。ろうの見込み顧客がそのサイトを訪れます。キャプションがなければ、彼女は話されている手順をまったく理解できず、プロセスを追うことも、手続きを完了することもできません。これはアクセシビリティ上の不備であると同時に、銀行にとってのビジネス機会の損失でもあります。正確で同期したキャプションがあれば、彼女はすべてのステップを追い、オンボーディングを完了し、顧客となることができます。
障害のある人へのアクセス確保にとどまらず、キャプションには測定可能な SEO とユーザビリティ上の利点があります。WebVTT や SRT 形式のキャプションファイルは機械可読であり、検索エンジンは動画コンテンツの全文をインデックス化できるため、発見性が向上します。多くの視聴者がソーシャルメディアの動画を音声なしで視聴していることも研究で示されており、キャプションは事実上、一般ユーザー向けのユーザビリティ機能となっています。キャプションはまた、検索エンジンやアクセシビリティ評価ツールが埋め込み動画の目的や内容を理解しやすくするため、ページ全体の品質シグナルにも寄与します。
関連する Axe-core のルール
WCAG 1.2.2 には手動テストが必要です。事前録音された同期メディアのキャプションの欠如や不正確さを確実に検出できる自動の axe-core ルールは存在しません。その理由は、自動テストの仕組みに根本的に関わるものです。
- キャプショントラックの欠如 — 手動テストが必要: 自動ツールは、
<video>要素に<track kind='captions'>要素がないことを検出でき、一部のツールはこれを潜在的な問題としてフラグ付けします。しかし、そのツールは、その動画に実際に意味のある音声コンテンツが含まれているか(無音動画かもしれません)、動画自体にオープンキャプション(焼き込みキャプション)が存在するか、あるいはその動画がメディア代替の例外に該当するかどうかを判断できません。その判断には人による確認が必要です。 - キャプションの正確性と完全性 — 手動テストが必要: キャプショントラックファイルが存在しリンクされている場合でも、自動ツールはキャプションが話されている内容を正確に反映しているか、関連する効果音や話者の識別を含んでいるか、音声と適切に同期しているかを評価できません。まったく別のテキスト、意味不明な自動生成テキスト、あるいは常に 10秒ずれているキャプションファイルであっても、自動検出では「存在する」と判断されますが、この達成基準には不適合です。動画を視聴しながらキャプションを読む人間のレビュアーだけが、その正確性を評価できます。
- オープンキャプション — 手動テストが必要: キャプションが動画ファイル自体に焼き込まれている(オープンキャプション)場合、自動ツールはこれをまったく検出できません。ツールには
<video>要素がトラックなしで存在するようにしか見えず、動画フレームの視覚的内容を解析してテキストの有無を判断することはできません。
これらの制約があるため、WCAG 1.2.2 を包括的に監査する際には、必ず人によるレビュー工程を含める必要があります。自動スキャンは、明らかに欠落しているトラック要素を特定するための有用な第一段階ですが、キャプションの品質、正確性、同期を評価する手動検証の代わりにはなりません。
テスト方法
- すべての同期メディアの棚卸し: いかなるツールを実行する前に、ページを手動で確認し、すべての動画要素を特定します。埋め込みの
<video>タグ、iframe で埋め込まれたプレーヤー(YouTube、Vimeo、サードパーティ)、および HTML5 メディアプレーヤーを含みます。各動画をリストアップし、意味のある音声(対話、ナレーション、重要な効果音)が含まれているかどうかを記録します。音声トラックがない動画や、情報的な内容を持たない BGM のみの動画は異なる扱いにできる場合がありますが、その判断理由を文書化してください。 - axe DevTools または Lighthouse による自動スキャンの実行: ブラウザの開発者ツールで axe DevTools を開き、ページ全体のスキャンを実行します。動画や音声要素に関連する違反や不完全な項目がないか確認します。Lighthouse(Chrome DevTools の Accessibility 監査カテゴリから実行)も、
<track>要素がない動画を同様にフラグ付けします。自動テストで問題なしと表示されても、この達成基準が満たされているとは限りません。単に明らかなトラックの欠如が検出されなかったことを意味するだけです。自動テストの結果は出発点として扱い、結論とみなさないでください。 - HTML ソースの確認: ページ上の各
<video>要素について、DOM を確認し、<track kind='captions'>要素が存在するかどうか、そのsrc属性が有効でアクセス可能なキャプションファイル(WebVTT または SRT)を指しているかどうかを検証します。srclang属性が適切な言語に設定されていることを確認します。ブラウザで URL を直接開き、ネットワークエラーなくファイルが読み込まれることを確認してください。 - 動画を再生し、キャプションを手動で評価: 動画プレーヤーでキャプションを有効にする(オープンキャプションの場合は自動的に表示されることを確認する)か、キャプションが自動的に表示されることを確認します。動画全体、または冒頭・中盤・終盤にわたる統計的に代表性のあるサンプルを視聴します。各セグメントについて、(a) 対話が重大な誤りなく正確に書き起こされているか、(b) 理解の助けになる場合に話者の切り替わりが識別されているか、(c) 意味のある非音声情報が角括弧付きで記述されているか(例:[phone ringing])、(d) キャプションが音声と同期して表示・非表示になり、話し言葉より大きく先行したり遅れたりしていないかを確認します。
- 必要に応じてスクリーンリーダーでテスト: NVDA と Firefox、VoiceOver と Safari、または JAWS と Chrome を使用して動画要素に移動します。プレーヤーのコントロールがキーボードで操作可能であること、キャプションのオン/オフ切り替えがマウスなしで行えることを確認します。これはキャプション機能の存在だけでなく、そのユーザビリティもテストするものです。
- サードパーティ埋め込みプレーヤーのテスト: YouTube や Vimeo のプレーヤーを埋め込んだ iframe の場合、プラットフォーム上で動画を直接開き、キャプションがアップロードされているか、デフォルトで有効になっているか、または簡単に切り替えられるかを確認します。YouTube などのプラットフォームの自動生成キャプションは、正確性のためにレビュー・修正されていない限り、WCAG 1.2.2 を満たしません。
- 証拠とともにパス/フェイルを記録: テストした各動画について、ページ URL、動画のタイトルまたは説明、キャプションの有無、正確性の評価を記録します。レビュー時のスクリーンショットやタイムスタンプ付きのメモは監査証拠として役立ちます。
修正方法
キャプショントラックのない HTML5 動画 — 不適切
<!-- Fails 1.2.2: video with audio has no caption track at all -->
<video controls width='800'>
<source src='product-demo.mp4' type='video/mp4'>
Your browser does not support the video element.
</video>
キャプショントラックのない HTML5 動画 — 適切
<!-- Passes 1.2.2: a WebVTT caption track is linked with kind='captions' -->
<video controls width='800'>
<source src='product-demo.mp4' type='video/mp4'>
<!-- The track element links the WebVTT file; srclang and label aid player UI -->
<track
kind='captions'
src='product-demo-captions-en.vtt'
srclang='en'
label='English Captions'
default
>
Your browser does not support the video element.
</video>
字幕トラックのみでキャプションがない多言語動画 — 不適切
<!-- Fails 1.2.2: kind='subtitles' provides translated dialogue but omits -->
<!-- sound effect descriptions and speaker identification needed for deaf users -->
<video controls width='800'>
<source src='webinar.mp4' type='video/mp4'>
<track kind='subtitles' src='webinar-tr.vtt' srclang='tr' label='Turkish'>
</video>
字幕トラックに加えてキャプションを備えた多言語動画 — 適切
<!-- Passes 1.2.2: a dedicated captions track is provided alongside subtitles. -->
<!-- The captions file includes [Speaker: Dr. Aydin], [applause], etc. -->
<video controls width='800'>
<source src='webinar.mp4' type='video/mp4'>
<track
kind='captions'
src='webinar-captions-tr.vtt'
srclang='tr'
label='Turkish Captions'
default
>
<track kind='subtitles' src='webinar-en.vtt' srclang='en' label='English'>
</video>
修正されていない自動生成キャプションに依存する YouTube 埋め込み — 不適切
<!-- Fails 1.2.2: uncorrected auto-captions are not considered accurate captions -->
<iframe
width='800'
height='450'
src='https://www.youtube.com/embed/VIDEOID'
title='Company Introduction Video'
allowfullscreen
></iframe>
人手で検証・編集されたキャプション付き YouTube 埋め込み — 適切
<!-- Passes 1.2.2 provided that captions have been uploaded or reviewed -->
<!-- in YouTube Studio and confirmed accurate by a human reviewer. -->
<!-- The &cc_load_policy=1 parameter enables captions by default. -->
<iframe
width='800'
height='450'
src='https://www.youtube.com/embed/VIDEOID?cc_load_policy=1&cc_lang_pref=tr'
title='Company Introduction Video'
allowfullscreen
></iframe>
<!-- Also ensure in YouTube Studio that the caption track is marked as -->
<!-- human-reviewed and that auto-captions have been corrected. -->
よくある間違い
- 同期キャプションの代わりにテキストトランスクリプトのみを提供する: 動画の下や横に表示されるトランスクリプトは、状況によっては WCAG 1.2.3(音声解説またはメディアの代替)を満たしますが、1.2.2 は満たしません。キャプションは動画のタイムラインと同期しており、対応する音声が再生される瞬間にテキストが表示されなければなりません。静的なテキストブロックではこの要件を満たせません。
kind='captions'の代わりにkind='subtitles'を使用する: 字幕は、音声は聞こえるが言語を理解できない視聴者向けに設計されており、通常は翻訳された話し言葉のみを含みます。キャプションは、音声をまったく聞くことができない視聴者向けに設計されており、話者の識別、意味のある効果音、その他の非音声情報を含めなければなりません。キャプションが必要な場面で字幕トラックを代用するのは、一般的かつ重大な誤りです。- YouTube などのプラットフォームの修正されていない自動生成キャプションに依存する: 自動生成キャプションは音声認識を使用しており、専門用語、固有名詞、アクセント、速い話し言葉などで頻繁に誤りを生じます。WCAG はキャプションの正確性を求めています。人によるレビューと修正が行われていない自動生成キャプションは、1.2.2 の正確性基準を満たしません。
<track>要素は含めているが、壊れたまたは存在しない VTT ファイルを参照している: track 要素のsrc属性が 404 エラーを返すファイルパスを参照している場合、キャプションはユーザーに気づかれないまま読み込みに失敗します。HTML は自動検査を通過しますが、ユーザーはキャプションを受け取れません。運用環境でキャプションファイルの URL が正しく解決されることを必ず確認してください。- キャプションファイルから意味のある非音声情報を省略する: 話し言葉だけを書き起こし、重要な音(アラーム、電話の呼び出し音、拍手、動画の理解に不可欠な衝突音など)を無視するキャプションファイルは、この達成基準に不適合です。キャプションは、対話だけでなく、コンテンツの理解に必要なすべての音声情報を記述しなければなりません。
- 音声と大きく同期していないキャプション: タイムスタンプの指定が誤っている WebVTT ファイルでは、キャプションが対応する音声より数秒早く、または遅れて表示されることがあります。これは理解を妨げるものであり、キャプションのテキスト自体が正確であっても不適合となります。特にシーンの切り替えやポーズの前後など、動画全体にわたって同期を確認してください。
- メディア代替の例外が広く適用されると誤解する: 一部のチームは、動画に対応する記事があるからという理由で、その動画がメディア代替に該当し、キャプションが不要だと誤解しています。この例外は、動画がテキストに含まれる情報以上のものを一切追加しておらず、その関係がユーザーに明示され、動画が明確に代替としてラベル付けされている場合にのみ適用されます。デモンストレーション、話者のトーン、テキストに含まれていない視覚情報などを追加する動画は、この例外には該当しません。
- マウスでしかアクセスできないキャプションコントロール: キャプションが存在していても、カスタム動画プレーヤー内のキャプション有効化ボタンがキーボードでアクセスできない場合(例:
tabindex='0'やキーボードイベントリスナーのない onclick ハンドラー付きのスタイル済み<div>)、キーボード操作に依存するユーザーはキャプションをオンにできません。キャプション機能自体がキーボードで操作可能でなければなりません。 - 埋め込みまたはサードパーティプレーヤーでキャプションをテストしない: チームは開発環境でキャプションの挙動をテストしていても、本番環境でのサードパーティプレーヤー(Vimeo、Wistia、JW Player など)による埋め込みでは、キャプションの読み込み挙動、デフォルト状態、API 設定が異なる場合があることを見落としがちです。実際の本番埋め込みコンテキストでキャプションの体験を必ずテストしてください。
- 多言語サイトでキャプションを 1言語にしか提供しない: WCAG は、サイトがサポートするすべての言語でキャプションを提供することを厳密には要求していませんが、たとえばサイトと動画コンテンツがトルコ語と英語で提供されているにもかかわらず、キャプションが一方の言語にしかない場合、一部のユーザーはアクセシブルなコンテンツを受け取れる一方で、他のユーザーはそうではありません。ベストプラクティスは、動画の各言語版に対応するキャプショントラックを提供することです。
トルコのアクセシビリティ規制との関係
2025年6月21日付官報(番号 32933)で公布されたトルコ大統領通達 2025/10 は、トルコで事業を行う幅広い公的・民間主体に対し、拘束力のあるウェブアクセシビリティ義務を定めています。この通達は、最低限の基準として WCAG 2.2 レベル A への適合を義務付け、レベル AA への適合を強く推奨しています。WCAG 1.2.2 — キャプション(事前録音)はレベル A の要件であり、この通達における最も基本的な義務の一つであることを意味し、不適合は直接的な規制違反となります。
通達の対象となる主体には、あらゆるレベルの公的機関・政府機関、EC プラットフォーム、銀行および金融機関、病院および医療提供者、20万件以上の加入者を有する通信事業者、認可を受けた旅行代理店、民間の交通事業者、国民教育省(MoNE)に認可された私立学校が含まれます。公的機関は、通達の公布日から 1年以内に適合を達成する必要があります。対象となる民間部門の事業者には 2年の適合猶予期間が与えられています。
これらのカテゴリに属する組織にとって、WCAG 1.2.2 の実務的な意味は明確です。ウェブサイトやデジタルプラットフォーム上で公開される、意味のある音声を含むあらゆる動画コンテンツには、正確なキャプションを付与しなければなりません。これは、製品説明やオンボーディング動画が一般的な銀行、患者向け教育動画が頻繁にオンライン公開される医療機関、製品デモ動画が購買体験の中心となる EC などのセクターにとって特に重要です。モバイルバンキングの使い方を説明する動画チュートリアルをキャプションなしで公開する銀行や、術後ケアの説明動画をキャプションなしで掲載する病院は、通達のレベル A 要件に直接違反することになります。
通達は別個のトルコ独自基準を定めているわけではなく、国際的に認められた WCAG 2.2 の達成基準を直接参照しています。これは、トルコのコンプライアンスチームが、W3C によって定義され、本記事で説明されているとおりの WCAG 1.2.2 の仕様に従うべきであることを意味します。組織は、自らのキャプション付与の運用を文書化し、動画コンテンツと並行してキャプションファイルのバージョン記録を維持し、動画コンテンツ公開ワークフローの標準ステップとしてキャプションの正確性確認を組み込むべきです。規制遵守を目的としたアクセシビリティ監査では、自動ツールだけではこの達成基準への適合を示すには不十分であるため、キャプションの正確性に関する手動レビューを必ず含めなければなりません。
