WCAG 達成基準 · Level AAA
WCAG 1.2.7: 拡張音声解説(事前録音)
WCAG 1.2.7 は、前景の音声の一時停止だけではすべての視覚情報を伝えるのに不十分な場合、事前に録音された同期メディアに対して、ビデオを一時停止することで実現される拡張音声解説を提供することを求めています。これにより、標準的な音声解説ではカバーできない複雑な視覚コンテンツについて、視覚障害者やロービジョンのユーザーが十分に理解できるようになります。
- Level AAA
- Wcag
- Wcag 2 2 aaa
- 知覚可能
- アクセシビリティ
このルールの意味
WCAG 達成基準 1.2.7 — 拡張音声解説(事前録音)はレベル AAA に位置づけられ、レベル AA の要件である SC 1.2.5(事前録音された音声解説)を直接拡張したものです。標準的な音声解説では、動画の音声トラックに存在する自然な無音部分を利用して視覚情報をナレーションしますが、拡張音声解説ではさらに踏み込みます。必要な解説をすべて収めるには無音部分が短すぎる、あるいは頻度が少なすぎる場合、動画を一時停止し、その間に音声解説を再生し、その後動画を再開します。
この達成基準は、特に事前録音された同期メディアに適用されます。つまり、教材用フィルム、企業研修ビデオ、ドキュメンタリー、製品デモ動画など、映像と同期したサウンドトラックを持つ動画コンテンツです。ライブメディア、音声のみのコンテンツ、サウンドトラックのない映像のみのコンテンツには適用されません。
この達成基準における適合には、次のいずれかが必要です。(a) 自然な無音部分に収まりきらない重要な視覚情報の解説を提供するために再生を一時停止する拡張音声解説トラックまたはメディアのバージョンが提供されている、または (b) すべての視覚情報が既存の音声トラックだけで追加の解説なしにすでに伝えられている(「同等に解説された」バージョンと呼ばれることもあります)。不適合となるのは、事前録音された同期動画に、画面上のテキスト、図、物語を進行させる表情、デモンストレーションなどの意味のある視覚情報が含まれているにもかかわらず、それが自然な無音部分での音声解説でも拡張解説でも伝えられておらず、既存の音声だけでは視覚障害ユーザーがその情報を得られない場合です。
WCAG では重要な例外も認めています。メディア自体がテキストのメディア代替である場合、たとえばテキスト文書の動画版であり、その旨が明確にラベル付けされている場合には、拡張音声解説は必須ではありません。さらに、前景音声がすでにすべての視覚コンテンツを完全に説明している場合には、追加の解説は不要です。
拡張音声解説を提供するには、多くの場合、動画の完全に別バージョンを制作する必要がある点にも留意が必要です。ほとんどのメディアプレーヤーは、解説を提供するための一時停止と再開の仕組みをネイティブにはサポートしていないためです。一般的なアプローチとしては、別 URL からアクセスできる専用の「解説付きバージョン」や、プレーヤー上のトグルボタン、あるいは TTML(Timed Text Markup Language)や SMIL ベースの拡張解説トラックをサポートするメディアプレーヤーの利用などがあります。
なぜ重要か
拡張音声解説は、全盲または重度のロービジョンのユーザーにとって極めて重要です。このユーザー層は、多くの開発者が想定しているよりもはるかに大きいものです。世界保健機関によると、世界で約 22 億人が何らかの視覚障害を抱えており、そのうち少なくとも 10 億人は予防可能であった、あるいは未対応の状態の障害を抱えています。スクリーンリーダーや音声出力のみに依存しているユーザーにとって、自然な無音部分で許される範囲だけを説明する動画では、理解に大きな空白が生じる可能性があります。
外科手技を示す医療研修ビデオを考えてみてください。ナレーターは「では、ここで切開を行います」と言いながら、カメラは特定の解剖学的ランドマークにズームインし、外科医の手が精密な操作を行います。話し言葉のナレーションは、視聴者が視覚的な文脈を見えていることを前提としています。標準的な音声解説では、短い無音部分に短い説明を挿入できるかもしれませんが、2 分間にわたって動作が途切れず、話し言葉も続いている場合、視覚障害のある医学生は、手技の習得に不可欠な視覚的な詳細をほとんど得られません。拡張音声解説では動画を一時停止し、見えている解剖構造、使用している具体的な器具、アプローチの角度、組織の反応などを完全に説明します。これにより、その学生も学習教材に同等にアクセスできるようになります。
全盲に限らず、拡張音声解説は、情報処理が遅く、説明的なナレーションによる追加の文脈から恩恵を受ける認知障害のあるユーザーにも役立ちます。また、通勤中に研修ビデオを「聞いている」人など、視覚能力にかかわらず画面を見ることができない音声のみの利用状況にあるユーザーにも有用です。
ビジネスおよび法的な観点からも、拡張音声解説の提供は、インクルージョンへの真剣で測定可能なコミットメントを示すものです。公共機関、銀行、医療機関、教育機関などの規制対象セクターの組織にとって、複雑なメディアコンテンツでレベル AAA 準拠を示すことは、法的リスクや評判リスクを有意に低減し得ます。また実務的な SEO 上の利点もあります。拡張音声解説の制作に用いられる台本は、豊富なトランスクリプトとして機能することが多く、検索エンジンはそれを意味のあるコンテンツとしてインデックスするため、動画ベースのリソースの発見性が向上します。
関連する Axe-core ルール
WCAG 1.2.7 では、動画の意味内容を評価したり、音声トラックと映像トラックを比較したり、視覚情報が十分に説明されているかどうかを判断したりすることが自動ツールにはできないため、手動テストが必要です。動画を視聴し、何が視覚的に描かれているかを理解し、拡張音声解説が存在し、正確で完全かどうかを判断できる axe-core ルールは存在しません。これは本質的に人間による判断が必要なタスクです。
- 手動評価 — 視覚コンテンツと音声コンテンツの比較: テスターは、目を開けた状態と目を閉じた状態(またはスクリーンリーダーを使用して)で動画を視聴し、標準の音声解説を含む音声だけで、すべての意味のある視覚情報が伝わっているかどうかを判断する必要があります。そうでない場合、テスターは拡張音声解説バージョンが提供されているかどうかを確認しなければなりません。自動ツールは、動画フレームを意味のある視覚イベントとして解釈したり、それを音声の意味内容と関連付けたりする能力がないため、この比較を行うことはできません。
- 手動評価 — 一時停止と再開のメカニズム: 拡張解説があるとされている場合、テスターは、解説の再生中にプレーヤーが実際に一時停止し、その後正しく再開することを確認しなければなりません。この挙動はメディアプレーヤーとタイミングに関する問題であり、自動スキャナーはメディアの再生状態を実行・観察しないため、人間による実際の再生テストが必要です。
- 手動評価 — 解説の正確性と完全性: 拡張音声解説トラックが存在する場合でも、その内容が正確で、視覚的に重要な情報をすべてカバーしている必要があります。自動ルールは、解説テキストが画面に表示されている内容を正しく完全に表現しているかどうかを評価できません。たとえば、ボードに重要なラベル付きデータポイントを含む図が表示されているのに、解説が「プレゼンターがボードを指さしている」としか述べていない場合、その解説は技術的には存在していても、この達成基準には不適合となります。
テスト方法
- まず自動アクセシビリティスキャンを実行する。 動画を含むページで axe DevTools(ブラウザ拡張)または Lighthouse を使用します。どちらのツールも拡張音声解説への準拠を直接検証することはできませんが、欠落または壊れたメディア要素、欠落した track 要素、その他の構造的な問題を検出できます。メディアコンテンツに関する警告を出発点として記録します。axe は、要素レベルでキャプショントラックや音声解説トラックの欠如を指摘する場合があり、手動レビューの範囲を絞り込むのに役立ちます。
- ページ上のすべての事前録音された同期メディアを特定する。 すべての
<video>要素や埋め込みメディアプレーヤー(YouTube iframe、Vimeo 埋め込み、カスタムプレーヤー)を探します。それぞれに同期した音声と映像が含まれていることを確認します。純粋な音声ポッドキャストや無音動画は、この達成基準の対象外です。 - 音声のみで動画を視聴する。 目を閉じるか、スクリーンリーダー(Firefox と NVDA、Safari と VoiceOver、または Chrome と JAWS)を使用して、既存の音声解説トラックを含む動画全体を聞きます。何が視覚的に起きているのか理解できないすべての瞬間—動作、画面上のテキスト、図、シーンの切り替え、物語を進行させる登場人物の表情—を記録します。
- メモを映像トラックと照合する。 次に、音声をミュートした状態で動画を視聴し、画面に表示されるすべての視覚情報を記録します。それを先ほど聞いた内容と照合します。意味のある視覚コンテンツが音声で伝えられていなかった場合、その動画には音声解説が必要です。また、その解説を収めるのに十分な自然な無音部分が短すぎる、または存在しない場合、拡張音声解説が必要です。
- 拡張解説バージョンがあるか確認する。 「音声解説付きバージョン」などと明確にラベル付けされたリンク、動画プレーヤー内のトグル、別 URL 上の解説付きバージョンを探します。存在する場合、それを有効にし、解説付きバージョンを再生しながらステップ 3 と 4 を繰り返し、今度は一時停止と解説によって不足していた視覚情報がカバーされていることを確認します。
- NVDA + Firefox で一時停止と再開の挙動をテストする。 拡張解説バージョンを再生しながら、動画が一時停止し、音声解説が明瞭に提供され、その後動画が正しい位置から再開することを確認します。スクリーンリーダーが解説内容をアナウンスするか、視覚障害ユーザーにも聞こえる形で提供されていることを確認します。
- macOS/iOS の VoiceOver + Safari でテストする。 再生テストを繰り返します。解説付きバージョンがキーボード操作(Tab、Space、Enter)で利用可能であり、VoiceOver がプレーヤーのコントロールを正しくアナウンスしていること、特に解説トグルが正しく読み上げられることを確認します。
- 解説スクリプトの正確性を検証する。 可能であれば拡張解説のスクリプトまたはトランスクリプトを入手します。それを動画と照合し、事実に即していること、重要な視覚イベントをすべてカバーしていること、視覚ユーザーがコンテンツを理解するために利用する情報が省略されていないことを確認します。
修正方法
シナリオ 1: 音声解説がまったくない動画 — 不適切
<!-- A training video with no audio description track and no described version link.
Blind users receive only the foreground narration, missing all visual demonstrations. -->
<video controls width='800'>
<source src='surgical-technique.mp4' type='video/mp4'>
<track kind='captions' src='captions-en.vtt' srclang='en' label='English Captions' default>
</video>
シナリオ 1: 拡張音声解説バージョン付き動画 — 適切
<!-- Provide a clearly labeled link to the extended described version.
The described version pauses at critical moments to deliver full visual descriptions.
This is the most reliable cross-browser approach. -->
<video controls width='800' id='main-video'>
<source src='surgical-technique.mp4' type='video/mp4'>
<track kind='captions' src='captions-en.vtt' srclang='en' label='English Captions' default>
<track kind='descriptions' src='descriptions-en.vtt' srclang='en' label='Audio Descriptions'>
</video>
<p>
<a href='surgical-technique-extended-described.mp4'>
Watch extended audio described version of this video
</a>
</p>
シナリオ 2: 動きの速いビジュアルを持つ埋め込み YouTube 動画 — 不適切
<!-- An iframe embed of a product demo video. The YouTube auto-captions exist
but there is no audio description, and the visual demonstrations are rapid
with no natural pauses long enough for description. -->
<iframe
width='560'
height='315'
src='https://www.youtube.com/embed/EXAMPLE_ID'
title='Product demonstration video'
allowfullscreen>
</iframe>
シナリオ 2: 解説付きバージョンへのトグルを備えた埋め込み動画 — 適切
<!-- Offer a button that swaps the src to the extended described version.
The described version was produced as a separate MP4 with pauses built in.
The button is keyboard-accessible and has a clear accessible name. -->
<div role='region' aria-label='Product demonstration video player'>
<iframe
id='demo-video-frame'
width='560'
height='315'
src='https://www.youtube.com/embed/EXAMPLE_ID'
title='Product demonstration video'
allowfullscreen>
</iframe>
<p>
<button
type='button'
aria-pressed='false'
onclick='toggleDescribedVersion(this)'>
Enable extended audio description
</button>
</p>
</div>
<!-- The toggleDescribedVersion() function swaps the iframe src
to the described YouTube video ID and updates aria-pressed. -->
シナリオ 3: 解説トラックがあるが短すぎる HTML5 動画プレーヤー — 不適切
<!-- A descriptions track exists but its cue text is truncated to fit within
existing audio pauses. Key visual information (a data chart with five labeled
columns) is summarized as 'a chart appears on screen' — insufficient. -->
<video controls width='800'>
<source src='annual-report.mp4' type='video/mp4'>
<track kind='captions' src='captions-en.vtt' srclang='en' label='English' default>
<track kind='descriptions' src='brief-descriptions.vtt' srclang='en' label='Descriptions'>
</video>
<!-- brief-descriptions.vtt contains only: 'A chart appears on screen.' -->
シナリオ 3: 完全なナレーションを備えた別の拡張解説付きバージョン — 適切
<!-- The extended described version pauses playback at the chart moment
and delivers: 'A bar chart titled Annual Revenue by Region appears.
Five bars are shown: Europe 2.1 million, Asia 3.4 million,
North America 4.8 million, South America 1.2 million, Africa 0.9 million.
North America leads all regions.' The video then resumes. -->
<video controls width='800'>
<source src='annual-report.mp4' type='video/mp4'>
<track kind='captions' src='captions-en.vtt' srclang='en' label='English' default>
</video>
<p>
<strong>Extended audio described version:</strong>
<a href='annual-report-extended-described.mp4'>
Annual report video with extended audio descriptions
</a>
</p>
よくある間違い
- キャプショントラックを音声解説の代わりとみなすこと: キャプションは、ろう者向けに話し言葉の対話や効果音をテキストとして伝えるものです。視覚障害者向けに視覚コンテンツを説明するものではありません。キャプショントラックしかない動画で、視覚情報が音声で説明されていない場合、この達成基準には不適合となります。
- 無音部分が十分かどうかを確認せずに標準の音声解説トラックだけを提供すること: 多くのチームは
<track kind='descriptions'>要素を追加しただけで作業完了とみなし、すべての重要な視覚イベントに解説を収めるのに十分な無音部分があるかどうかを検証していません。動きの速いデモ、複雑な図、密度の高い画面上のテキストは、通常、拡張解説を必要とします。 - 明らかな視覚的変化だけを説明し、画面上のテキストコンテンツを省略すること: 画面上のテキスト—スライドタイトル、フォームラベル、グラフの軸、デモに表示されるボタンラベル—は、音声解説の中で完全に読み上げる必要があります。「スライドが表示される」と言うだけで、スライドのタイトルや主要な箇条書きを読まない場合、重要な情報が利用できないままになります。
- 明確でプログラム的に判別可能なアクセシブルネームなしに解説付きバージョンへのリンクを提供すること: 「ここをクリック」や「解説付きバージョン」とだけ表示され、どの動画の解説版なのかを特定できないリンクは、WCAG 2.4.6 に不適合であり、複数の動画があるページをスクリーンリーダーで操作するユーザーに混乱を招きます。
- トグルボタンで解説付きバージョンに切り替える際に
aria-pressedを更新せず、フィードバックも提供しないこと: ボタンが標準再生と解説付き再生を切り替える場合、aria-pressed(true/false)または同等のライブリージョンによるアナウンスを使用して、スクリーンリーダーユーザーが現在の状態と操作が反映されたことを把握できるようにする必要があります。 - 拡張解説付きバージョンを制作しても、再開位置の正確さをテストしないこと: 解説のための一時停止後、動画は中断した位置から正確に再開しなければなりません。少し前や少し後から再開すると、物語の文脈が失われ、視覚障害ユーザーの混乱がさらに増します。
- 動画トランスクリプトだけでこの達成基準を満たしていると想定すること: トランスクリプトは有用であり、SC 1.2.8(メディアの代替)を支援しますが、1.2.7 を満たすものではありません。拡張音声解説は、時間同期された音声による仕組みであり、別個に読む文書ではありません。
- シーンの感情的または物語的な意味を担う視覚情報を説明しないこと: 顧客の証言動画などで、登場人物の表情、ボディランゲージ、視覚的な反応が状況理解の中心となっている場合、それを説明しないと、話し言葉の対話が完全であっても、視覚障害ユーザーは同等の理解を得られません。
- メイン動画を更新しても解説付きバージョンを更新しないこと: 元の動画が再編集、更新、差し替えられた場合(教材コンテンツではよくあります)、拡張解説トラックまたはバージョンも更新する必要があります。古い解説は、もはや存在しないシーンを説明することで、ユーザーを積極的に誤解させる可能性があります。
- サードパーティ iframe(YouTube、Vimeo)で動画を埋め込み、プラットフォーム側が解説を処理してくれると想定すること: プラットフォームが提供する音声解説(存在する場合でも)は、拡張解説であることはまれです。コンテンツ所有者は、拡張解説付きバージョンが存在し、埋め込みページからリンクされているか、アクセス可能になっていることを保証する責任があります。
トルコのアクセシビリティ規制との関係
トルコの大統領通達 2025/10は、2025 年 6 月 21 日付官報第 32933 号で公布され、特定のデジタルサービス提供者に対するアクセシビリティ義務を定めています。この通達は、一般向けに提供されるデジタル製品およびサービスについてアクセシビリティ標準への準拠を義務付けており、そのベースラインとして WCAG 2.1 レベル AA への準拠と大枠で整合しています。
通達の対象となる主体には、公共機関・公的機関、e コマースプラットフォーム、銀行および金融機関、病院および医療提供者、20 万人以上の加入者を持つ通信事業者、認可旅行代理店、民間輸送会社、国民教育省(MoNE)に認可された私立学校が含まれます。これらの主体にとって、WCAG 2.1 レベル AA 準拠が強制力のある最低ラインとなります。
WCAG 1.2.7(拡張音声解説)はレベル AAA の達成基準であり、通達のベースライン要件によって直接義務付けられているわけではありません。しかし、トルコの規制環境においても、その重要性は過小評価すべきではありません。第一に、外科トレーニングビデオを公開する医療提供者、政策解説動画を公開する公共機関、教育用動画コンテンツを配布する私立学校など、複雑なメディアコンテンツを制作する組織には、厳格な法的義務がなくても、最も重要な教材に拡張音声解説を実装することについて、倫理的にも実務的にも強い根拠があります。
第二に、トルコのデジタルアクセシビリティ規制が成熟し、執行メカニズムが強化されるにつれ、レベル AAA の達成基準は、最先端のベストプラクティスの指標として参照されることが増えています。特に医療、教育、金融といった高リスク領域で、自主的に AAA 準拠を示す組織は、将来の規制更新に対して有利な立場を確保でき、より広範な反差別枠組みの下での苦情リスクも低減できます。
第三に、公共放送局およびメディア組織にとっては、たとえ 2025/10 通達で直接名指しされていなくても、トルコのラジオ・テレビ最高評議会(RTÜK)は歴史的に放送コンテンツのアクセシビリティ規定に関与してきました。オンデマンドおよびウェブ配信動画に拡張音声解説を適用することは、そうした義務の趣旨と整合するものです。
Accsible widget SDK を利用する組織は、オーバーレイウィジェットがエンドユーザーにアクセシビリティ機能やコントロールを提示できる一方で、拡張音声解説そのものはコンテンツ制作レベルで実装しなければならず、クライアントサイドツールによって自動的に後付けすることはできない点を認識しておく必要があります。ただし SDK は、アクセシビリティパネル内に解説付きバージョンのトグルやリンクを表示することで、その代替バージョンを必要とするユーザーにとってより見つけやすくすることは可能です。
出典と参考資料
- W3C Understanding 1.2.7 Extended Audio Description (Prerecorded)
- W3C Techniques for WCAG 1.2.7
- WebAIM: Captions, Transcripts, and Audio Descriptions
- MDN: HTMLTrackElement and the track element
- W3C Technique G8: Providing a movie with extended audio descriptions
- W3C Technique G78: Providing a second, user-selectable, audio track
