WCAG Başarı Kriterleri · Level A

WCAG 1.2.3: Sesli Betimleme veya Ortam Alternatifi (Önceden Kaydedilmiş)

WCAG 1.2.3, önceden kaydedilmiş eşzamanlı medyanın (sesli video) görsel içeriğin bir sesli betimlemesini veya tam metin alternatifini sunmasını gerektirir; böylece kör olan veya az gören kullanıcıların görsel olarak aktarılan bilgilere erişebilmesi sağlanır.

Bu Kuralın Anlamı

WCAG Başarı Ölçütü 1.2.3, görme engelli ve az gören kullanıcıların video içerik tüketirken karşılaştığı en temel engellerden birini ele alır: hiç seslendirilmemiş görsel bilgilerin kaybı. Ölçüt, tüm önceden kaydedilmiş eşzamanlı medya için — yani sesle eşleştirilmiş video içerik için — web yazarlarının görsel parçaya ilişkin bir sesli betimleme veya metin biçiminde tam bir medya alternatifi sağlaması gerektiğini belirtir.

Sesli betimleme, bir videonun ses parçasına eklenen ve yalnızca ana sesten anlaşılamayan önemli görsel ayrıntıları anlatan bir anlatımdır. Bu betimlemeler genellikle diyalogdaki doğal duraklamalar sırasında eklenir veya anlatıcının karmaşık görsel olayları betimlemesine zaman tanımak için video kısa süreliğine duraklatılabilir. Örneğin, bir eğitim videosu, sunucunun bir beyaz tahta üzerinde bir diyagram çizdiğini ancak bunu sözlü olarak yorumlamadığını gösteriyorsa, sesli betimleme neyin çizildiğini ve neden önemli olduğunu anlatır.

Medya için tam metin alternatifi, eşzamanlı medyadaki tüm bilgileri — hem ses içeriğini (diyalog, anlatım, ses efektleri) hem de görsel içeriği (eylemler, ortamlar, ekrandaki metin, konuşmacı tanımlama) — metin biçiminde aktaran bir belgedir. Bu, bir transkriptin daha kapsamlı bir sürümüdür; videoyu göremeyen veya duyamayan bir kullanıcının videonun ilettiği tüm bilgileri anlayabilmesi için görsel olayları yeterince kesin biçimde betimlemelidir.

Bu ölçüt özellikle önceden kaydedilmiş eşzamanlı medyaya uygulanır. Canlı video akışları diğer ölçütlerle ele alınır (altyazılar için 1.2.4) ve yalnızca ses içeren içerik 1.2.1 kapsamındadır. Önemli olarak, video parçası tamamen dekoratifse — örneğin, hiçbir bilgi iletmeyen animasyonlu bir arka plan — bu ölçüt uygulanmaz. Benzer şekilde, bir videonun ses parçası zaten tüm anlamlı görsel bilgileri tam olarak betimliyorsa (bazen “eşdeğer ses” olarak adlandırılan durum), ek bir sesli betimleme gerekmez.

1.2.3 kapsamında başarılı sayılmak için, her bir önceden kaydedilmiş eşzamanlı medya parçası için aşağıdakilerden en az birinin doğru olması gerekir: bir sesli betimleme sağlanmıştır veya tüm sesli ve görsel bilgileri aktaran bir metin alternatifi medyaya bağlantılıdır ya da doğrudan bitişiğindedir. Başarısızlık, video içeriğinde anlamlı görsel öğeler — ekrandaki metin, grafik veriler, temel duyguyu ileten yüz ifadeleri, gösterim adımları — bulunmasına rağmen bunların hiçbir ses veya metin alternatifiyle aktarılmaması durumunda ortaya çıkar.

1.2.3’ün Seviye A gereksinimi olduğunu ve bu nedenle asgari beklentiyi oluşturduğunu unutmayın. Daha güçlü Seviye AA ölçütü 1.2.5 (Sesli Betimleme — Önceden Kaydedilmiş), ihtiyaç duyulan tüm durumlarda sesli betimleme gerektirirken, 1.2.3 Seviye A’da metin alternatifine ikame olarak izin verir.

Neden Önemlidir

Dünya Sağlık Örgütü’ne göre dünya genelinde yaklaşık 2,2 milyar kişinin bir tür görme bozukluğu vardır. Görme engelli kullanıcılar için sesli betimleme veya metin alternatifi olmayan video içerik, görsel bilgi kaynağı olarak tamamen erişilemezdir. Bir ekran okuyucu, bir video öğesinin var olduğunu bildirebilir ve ilişkili altyazıları okuyabilir, ancak video karelerinin görsel içeriğini yorumlayamaz. Sesli betimleme veya medya alternatifi olmadan, bu kullanıcılar videonun gösterip söylemediği her şeyi kaçırırlar.

Somut bir senaryo düşünün: Bir Türk e-ticaret platformu, akıllı ev cihazı için bir ürün tanıtım videosu yayınlıyor. Videoda sunucu, cihazı bir akıllı telefon uygulamasıyla eşleştiriyor, her iki ekrandaki menülerde geziniyor ve kabloları belirli portlara takıyor. Sunucunun anlatımı cihazın faydalarına odaklanıyor, ancak hangi düğmelere basıldığını veya hangi menü öğelerinin seçildiğini açıklamıyor. Bu videoyu ekran okuyucu ile izleyen görme engelli bir kullanıcı yalnızca anlatımı duyar — evde kurulumu tekrarlamasını sağlayacak hiçbir görsel işlem bilgisini alamaz. Sesli betimleme veya ayrıntılı bir metin alternatifi ile bu kullanıcı aynı öğretici içeriğe tam erişim kazanır.

Görme engelli kullanıcıların ötesinde, ayrıntılı metin alternatifleri, hızlı ilerleyen bir videoya kıyasla yazılı talimatları daha kolay işleyebilen bilişsel engelli kullanıcılar için de faydalıdır. Ayrıca video akışı yapamayan bant genişliği kısıtlı ortamlardaki kullanıcılar, videonun engellendiği kurumsal ağlardaki kullanıcılar ve cihazları veya tarayıcıları belirli video formatlarını desteklemeyen kullanıcılar için de yararlıdır. Arama motorları da metin alternatiflerini indeksler; bu da video içeriğini tam metin arama yoluyla keşfedilebilir hale getirerek SEO’yu iyileştirir — erişilebilirlik değerinin yanında anlamlı bir ticari faydadır.

Video kontrollerini hassas biçimde kullanamayan motor engelli kullanıcılar için metin alternatifi, durdurma, geri sarma veya oynatma kontrolleriyle uğraşmadan içeriği kendi hızlarında tüketmelerine olanak tanır. Kısacası, sesli betimlemeler ve medya alternatifleri geniş bir kullanıcı kitlesine hizmet eder ve yalnızca erişim için onlara kesinlikle ihtiyaç duyanların çok ötesinde, video içeriğinin genel kalitesini ve erişimini artırır.

İlgili Axe-core Kuralları

WCAG 1.2.3 manuel test gerektirir. Bu ölçütün ihlalini otomatik olarak işaretleyen bir axe-core kuralı yoktur ve bunun nedenini anlamak, test uzmanlarının manuel olarak nelere bakması gerektiğini netleştirmeye yardımcı olur.

  • Manuel test gerekli — görsel içerik analizi: Otomatik araçlar bir <video> öğesinin, bir <track> öğesinin veya ilişkili bir transkript bağlantısının varlığını tespit edebilir, ancak bir sesli betimlemenin veya metin alternatifinin içeriğinin yeterli olup olmadığını değerlendiremez. Yeterlilik, tüm anlamlı görsel bilginin aktarılıp aktarılmadığına bağlıdır — bu da videoyu izleyip alternatifi okuyarak ve ikisini karşılaştırarak insan yargısı gerektirir. Bir axe taraması, bir <track kind='descriptions'> öğesinin var olduğunu doğrulayabilir, ancak betimlemelerin videodaki tüm kritik görsel olayları gerçekten kapsayıp kapsamadığını doğrulayamaz.
  • Manuel test gerekli — eşdeğerlik değerlendirmesi: Ana ses parçasının zaten tüm görsel bilgileri betimleyip betimlemediğini (ek bir sesli betimlemeyi gereksiz kılıp kılmadığını) belirlemek doğası gereği içerik odaklı bir yargıdır. Bir insan inceleyici videoyu izlemeli ve yalnızca sesi dinleyen görme engelli bir kullanıcının herhangi bir anlamlı bilgiyi kaçırıp kaçırmayacağını değerlendirmelidir. Hiçbir otomatik kural bu belirlemeyi güvenilir biçimde yapamaz.
  • Manuel test gerekli — metin alternatifinin tamlığı: Sesli betimleme yerine bir metin alternatifi (tam medya alternatifi) sağlanmışsa, bir insan metin alternatifini okumalı ve videoyla karşılaştırarak tüm görsel olayların, ekrandaki metnin ve anlamlı eylemlerin temsil edildiğini doğrulamalıdır. Otomatik araçlar bir transkript bağlantısının varlığını kontrol edebilir, ancak bu transkriptin eksiksiz ve doğru olup olmadığını değerlendiremez.

Nasıl Test Edilir

  1. Otomatik tarama temel seviyesi: Videoyu içeren sayfada axe DevTools veya Google Lighthouse çalıştırın. Bu araçların hiçbiri doğrudan bir 1.2.3 ihlalini işaretlemese de, eksik <track> öğeleri (altyazılar için 1.2.2 kapsamında işaretlenir) veya görüntü tabanlı medya için eksik metin alternatifleri gibi ilgili sorunları ortaya çıkarabilir. Sayfada bulunan video öğelerini not edin; böylece 1.2.3 kapsamında hangilerinin manuel inceleme gerektirdiğini bilirsiniz.
  2. Eşzamanlı medyayı belirleyin: Sayfadaki her <video> öğesini (veya YouTube ya da Vimeo iframe’leri gibi gömülü üçüncü taraf oynatıcıları) bulun. Her videonun önceden kaydedilmiş ve eşzamanlı olup olmadığını doğrulayın (yani hem anlamlı ses hem de video parçalarına sahip olup olmadığını). Bir video yalnızca ses içeriyorsa veya dekoratif bir video parçasına sahipse, 1.2.3 kapsamı dışındadır.
  3. Videoyu ses açıkken izleyin: Videoyu normal şekilde izleyin ve yalnızca görsel olarak aktarılan, seste betimlenmeyen bilgilere özellikle dikkat edin. Yaygın örnekler şunlardır: ekrandaki metin bindirmeleri, çizilen diyagramlar veya grafikler, fiziksel bir sürecin adım adım gösterimleri, duygusal anlam taşıyan yüz ifadeleri veya beden dili ve ekranda birden fazla kişi göründüğünde konuşmacı tanımlama.
  4. Sesli betimleme parçasını kontrol edin: Video öğesinin işaretlemesinde bir <track kind='descriptions'> öğesi olup olmadığını inceleyin. Varsa, video oynatıcıda betimlemeleri etkinleştirin (veya bunları yüzeye çıkaran bir tarayıcı kullanın) ve videoyu yeniden izleyin. 3. adımda belirlenen her anlamlı görsel olayın, uygun zamanda sesli betimleme parçasında anlatıldığını doğrulayın.
  5. Tam metin alternatifini kontrol edin: Sesli betimleme parçası yoksa, videonun bitişiğinde veya hemen ardından gelen bir transkript veya tam medya alternatifi bağlantısı arayın. Bağlantılı belgenin veya satır içi metnin tüm ses içeriğini (diyalog, anlatım, ilgili ses efektleri) ve tüm görsel içeriği (eylemler, ekrandaki metin, ortam betimlemeleri, konuşmacı tanımlama) betimlediğini doğrulayın.
  6. Ekran okuyucu doğrulaması (NVDA + Firefox): Sayfayı NVDA çalışırken açın. Video öğesine gidin ve NVDA’nın videonun varlığını ve ilişkili kontrolleri bildirdiğini doğrulayın. Bir metin alternatifi satır içinde veya bir bağlantı aracılığıyla sağlanmışsa, ona gidin ve NVDA’nın içeriğin tamamını eksiksiz okuduğunu doğrulayın. Not: NVDA video karelerinin görsel içeriğini okuyamaz; bu da 3. adımdaki insan karşılaştırmasının neden hayati olduğunu vurgular.
  7. Ekran okuyucu doğrulaması (macOS’ta VoiceOver + Safari): VoiceOver’ı etkinleştirin ve videoya gidin. VoiceOver rotorunu kullanarak video öğesini ve ilişkili track veya bağlantı öğelerini bulun. Varsa, betimleme parçasının Safari’nin medya kontrolleri aracılığıyla erişilebilir olduğunu doğrulayın.
  8. Üçüncü taraf oynatıcılar: YouTube gömülü videolarında, videonun bir sesli betimleme sürümü olup olmadığını (genellikle açıklamada bağlantılı ayrı bir video) veya ilişkili bir transkriptin mevcut olup gömme sayfasında bağlantı verilip verilmediğini kontrol edin. Vimeo için videonun erişilebilirlik ayarlarını kontrol edin. Üçüncü taraf oynatıcılar 1.2.3’ü otomatik olarak karşılamaz — sayfa yazarı, bir alternatifin sağlandığından veya bağlantı verildiğinden emin olmaktan sorumludur.

Nasıl Düzeltilir

Senaryo 1: Sesli betimlemesi olmayan HTML5 video — Hatalı

<!-- A product demo video with meaningful visual content but no audio description or text alternative -->
<video controls width='800'>
  <source src='product-demo.mp4' type='video/mp4'>
  <track kind='captions' src='captions-en.vtt' srclang='en' label='English' default>
</video>

Senaryo 1: Sesli betimleme parçası olan HTML5 video — Doğru

<!-- Audio description track added using kind='descriptions'.
     The VTT file contains timed narrations of visual events
     that are not conveyed through the main audio. -->
<video controls width='800'>
  <source src='product-demo.mp4' type='video/mp4'>
  <track kind='captions' src='captions-en.vtt' srclang='en' label='English' default>
  <track kind='descriptions' src='descriptions-en.vtt' srclang='en' label='Audio Descriptions'>
</video>

Senaryo 2: Metin alternatifi olmayan HTML5 video — Hatalı

<!-- Tutorial video with on-screen steps and diagrams; no transcript provided -->
<section>
  <h2>How to Configure Your Router</h2>
  <video controls width='800'>
    <source src='router-setup.mp4' type='video/mp4'>
    <track kind='captions' src='captions-tr.vtt' srclang='tr' label='Turkish' default>
  </video>
</section>

Senaryo 2: Tam medya alternatifi olan HTML5 video — Doğru

<!-- Full media alternative linked immediately after the video.
     The linked page contains both transcript text (all dialogue and narration)
     and descriptions of all visual steps shown in the video. -->
<section>
  <h2>How to Configure Your Router</h2>
  <video controls width='800'>
    <source src='router-setup.mp4' type='video/mp4'>
    <track kind='captions' src='captions-tr.vtt' srclang='tr' label='Turkish' default>
  </video>
  <p>
    <a href='router-setup-full-transcript.html'>
      Full text alternative for this video (includes all dialogue and visual descriptions)
    </a>
  </p>
</section>

Senaryo 3: Ek alternatif olmadan YouTube gömme — Hatalı

<!-- Embedded YouTube video; the video on YouTube has no audio description
     and no transcript is linked on this page -->
<iframe width='560' height='315'
  src='https://www.youtube.com/embed/XXXXXXXXXXX'
  title='Annual Report Highlights 2024'
  allowfullscreen>
</iframe>

Senaryo 3: Bağlantılı metin alternatifi olan YouTube gömme — Doğru

<!-- Embedding page provides a link to a full text alternative.
     The linked document describes all visual content in the video
     (slides, charts, on-screen data) in addition to the spoken content. -->
<figure>
  <iframe width='560' height='315'
    src='https://www.youtube.com/embed/XXXXXXXXXXX'
    title='Annual Report Highlights 2024'
    allowfullscreen>
  </iframe>
  <figcaption>
    <a href='annual-report-2024-full-transcript.html'>
      Read the full text alternative for Annual Report Highlights 2024
    </a>
  </figcaption>
</figure>

Senaryo 4: Sesi zaten tüm görsel içeriği betimleyen video (istisna) — Doğru

<!-- This video features a narrator who explicitly describes every action
     being performed on screen: 'I am now clicking the blue Settings button
     in the top-right corner and selecting Account from the dropdown menu.'
     Because the audio fully conveys all visual information, no separate
     audio description is required under 1.2.3. -->
<video controls width='800'>
  <source src='fully-described-tutorial.mp4' type='video/mp4'>
  <track kind='captions' src='captions-en.vtt' srclang='en' label='English' default>
</video>
<!-- Document the rationale in an internal accessibility conformance note -->

Yaygın Hatalar

  • Sesli betimleme yerine altyazı sağlamak: Altyazılar, işitme engelli kullanıcılar için konuşulan sesi yazıya döker; görme engelli kullanıcılar için görsel bilgiyi betimlemez. Bir <track kind='captions'> öğesi eklemek 1.2.2’yi karşılar ancak 1.2.3’ü karşılamaz. Bunlar, iki farklı engelli grubu ele alan iki ayrı gereksinimdir.
  • Yalnızca diyalogu kapsayan bir transkripte bağlantı vermek: 1.2.3 için bir metin alternatifi, yalnızca konuşulanları değil, tüm anlamlı görsel içeriği — ekrandaki metin, diyagramlar, fiziksel eylemler, konuşmacı tanımlama — betimlemelidir. Yalnızca senaryoyu içeren bir transkript, video görsel-odaklı bilgi içeriyorsa genellikle bu ölçütte başarısız olur.
  • Metin alternatifi bağlantısını videodan çok uzakta konumlandırmak: Tam medya alternatifi dipnotta veya açık, bitişik bir bağlantı olmadan ayrı bir sayfada gömülüyse, kullanıcılar onu bulamayabilir. Bağlantı, ekran okuyucu kullanıcılarının doğal okuma sırası içinde karşılaşabilmesi için video öğesinin hemen öncesinde veya sonrasında görünmelidir.
  • YouTube’un otomatik oluşturulan transkriptinin ölçütü karşıladığını varsaymak: Otomatik oluşturulan YouTube transkriptleri yalnızca konuşulan sesi kapsar. Görsel içeriği betimlemez ve çoğu zaman hatalıdır. 1.2.3 kapsamında yeterli bir tam medya alternatifi oluşturmazlar.
  • Bir <track kind='descriptions'> öğesi kullanıp VTT dosyasını boş veya eksik bırakmak: Track öğesinin varlığı tek başına yeterli değildir; VTT dosyası tüm anlamlı görsel olayların doğru ve zamanlı betimlemelerini içermelidir. Boş veya iskelet halinde bir VTT dosyası ölçütü karşılamaz.
  • Ekrandaki metin bindirmelerini betimlemeyi ihmal etmek: Pazarlama videoları sıklıkla istatistikleri, ürün adlarını veya harekete geçirici mesaj metinlerini animasyonlu bindirmeler olarak gösterir. Bu bindirmeler bir anlatıcı tarafından sesli okunmuyorsa, sesli betimlemede veya metin alternatifinde yer almalıdır — yazarlar bunları sıkça gözden kaçırır.
  • Çok belirsiz sesli betimlemeler yazmak: “Sunucu süreci gösteriyor” gibi betimlemeler yetersizdir. Etkili betimlemeler, belirli eylemleri, arayüz öğelerini, anlamlı olduğu durumlarda renkleri ve mekânsal ilişkileri adlandırır: “Sunucu, araç çubuğunun sağ tarafındaki kırmızı Sil düğmesine tıklıyor, ardından iletişim kutusunda Tamam’ı seçerek onaylıyor.”
  • Bilgi içeren otomatik oynatılan veya arka plan videoları için alternatif sağlamamak: Otomatik oynatılan ve önemli bilgiler gösteren (örneğin, ürün özelliklerini metin bindirmeleriyle gösteren bir kahraman bölümü) bir video, hâlâ eşzamanlı medyadır ve anlamlı içerik iletiyorsa ölçüte uyum gerektirir.
  • Doğrulama yapmadan videoları dekoratif saymak: Ekipler bazen gereksinimden kaçınmak için bir videoyu “dekoratif” olarak etiketler, oysa video gerçekte ürün bilgisi veya öğretici içerik iletiyor olabilir. Dekoratif istisna yalnızca video, bitişik metinde zaten mevcut olanların ötesinde hiçbir anlamlı bilgi eklemediğinde geçerlidir.
  • Video güncellendiğinde sesli betimlemeyi veya metin alternatifini güncellemeyi unutmak: Video içeriği değişirse — örneğin, ürün adımları revize edilirse veya fiyatlandırma verileri güncellenirse — sesli betimleme ve metin alternatifi de buna uygun şekilde güncellenmelidir. Alternatifler başlangıçta doğru olsa bile, güncel olmayan alternatifler bir uyum hatasıdır.

Türkiye’nin Erişilebilirlik Mevzuatıyla İlişkisi

21 Haziran 2025’te 32933 sayılı Resmî Gazete’de yayımlanan Türkiye Cumhurbaşkanlığı Genelgesi 2025/10, Türkiye’de faaliyet gösteren çok çeşitli kamu ve özel sektör kuruluşları için zorunlu web erişilebilirliği standartları belirler. Genelge, uluslararası kabul görmüş erişilebilirlik standartlarına atıfta bulunur ve WCAG 2.2 Seviye A ve Seviye AA, uyum için teknik temel olarak hizmet eder. WCAG 1.2.3 bir Seviye A gereksinimi olduğundan, genelge kapsamındaki en temel yükümlülükler arasındadır — kuruluşların bunu görmezden gelmesine izin veren daha düşük bir uyum seviyesi yoktur.

Genelge, geniş bir kuruluş yelpazesini kapsar. Bakanlıklar, belediyeler, devlet üniversiteleri ve diğer kamu kurumları da dahil olmak üzere kamu kurum ve kuruluşları, genelgenin yayım tarihinden itibaren bir yıl içinde uyumu sağlamak zorundadır. Genelge kapsamındaki özel sektör kuruluşları arasında e-ticaret platformları, bankalar ve finans kuruluşları, hastaneler ve özel sağlık hizmeti sağlayıcıları, 200.000 veya daha fazla abonesi olan telekomünikasyon şirketleri, lisanslı seyahat acenteleri, özel ulaşım şirketleri ve Millî Eğitim Bakanlığı (MoNE) tarafından yetkilendirilmiş özel okullar yer alır. Bu özel sektör kuruluşlarının uyumu sağlamak için yayım tarihinden itibaren iki yılı vardır.

Video içeriği yayımlayan her kapsamdaki kuruluş için — ki bu bugün neredeyse tüm büyük Türk kurum ve işletmelerini içerir — WCAG 1.2.3 somut ve uygulanabilir bir yükümlülük yaratır. Mobil uygulamasının nasıl kullanılacağını açıklayan video eğitimleri yayımlayan bir banka, hasta kayıt süreci için video rehberler paylaşan bir kamu hastanesi, ekranda tarife karşılaştırmaları içeren tanıtım videoları yayımlayan bir telekom sağlayıcısı veya ürün tanıtım videoları içeren bir e-ticaret sitesi, her bir önceden kaydedilmiş eşzamanlı medya varlığının bir sesli betimleme veya tam metin alternatifi ile desteklendiğinden emin olmalıdır.

Genelge gerekliliklerine uyulmaması, düzenleyici inceleme ve itibar kaybının yanı sıra, Türkiye’de dijital erişilebilirlik uygulaması olgunlaştıkça kapsamdaki kuruluşlar için hukuki riskler de doğurabilir. Kuruluşlar WCAG 1.2.3’ü isteğe bağlı bir iyileştirme değil, asgari bir yasal yükümlülük olarak görmelidir. Pratikte bu, tüm video içeriğinin envanterini çıkarmak, hangi videoların yalnızca görsel bilgi içerdiğini değerlendirmek ve bunların her biri için sistematik olarak sesli betimlemeler veya tam metin alternatifleri üretmek anlamına gelir. Yeni video üretim iş akışları, altyazı ve alt yazıların yanında, betimleme senaryoları ve metin alternatiflerini de standart çıktılar olarak içermelidir.