Zasady WCAG istotne dla osób niesłyszących i niedosłyszących

Poniżej przedstawiono kluczowe kryteria sukcesu WCAG na poziomach A, AA i AAA, które mają szczególne znaczenie dla użytkowników głuchych lub słabosłyszących. Dla każdego kryterium wyjaśniono jego cel z perspektywy tych użytkowników oraz podano przykłady prawidłowego zastosowania i błędnej praktyki.

1.2.1 Tylko audio lub tylko wideo (nagranie) – poziom A

Cel: Zapewnienie alternatywy tekstowej dla treści dostępnej wyłącznie w formie audio (lub wyłącznie wideo) tak, aby osoby niesłyszące mogły zrozumieć przekaz. Jeśli strona publikuje np. samo nagranie dźwiękowe (podcast, przemówienie itp.), musi ono mieć transkrypcję tekstową przedstawiającą tę samą treść[1][2]. Tekstowa alternatywa dla materiału audio umożliwia osobom głuchym lub niedosłyszącym zapoznanie się z informacjami, które normalnie byłyby dostępne tylko poprzez słuch. W przypadku nagrań wideo bez dźwięku (np. niemych animacji) to kryterium wymaga dostarczenia opisu (tekstowego lub audio) tego, co widać, choć akurat brak ścieżki dźwiękowej nie stanowi bariery dla osób niesłyszących.

  • Dobry przykład: Na stronie internetowej zamieszczono nagranie audio przemówienia lub podcastu wraz z pełną transkrypcją tekstową dostępną obok odtwarzacza. Transkrypcja wiernie zawiera wszystkie wypowiedzi mówcy i opisuje istotne dźwięki (np. oklaski, śmiech publiczności)[3]. Dzięki temu osoba niesłysząca może przeczytać przemówienie i nie traci żadnych informacji przekazywanych tylko głosem.
  • Zły przykład: Strona publikuje ważne ogłoszenie wyłącznie jako plik audio (np. komunikat prezesa firmy) bez żadnej transkrypcji ani napisów. Osoba głucha nie ma możliwości poznania treści komunikatu – materiał audio jest dla niej niedostępny. Taki brak alternatywy tekstowej stanowi poważną barierę i narusza kryterium 1.2.1.

1.2.2 Napisy rozszerzone (nagranie) – poziom A

Cel: Zapewnienie napisów do wszystkich nagrań wideo z dźwiękiem (treści wcześniej nagranych), aby osoby głuche lub słabosłyszące mogły odbierać zarówno dialogi, jak i istotne informacje dźwiękowe z filmu. Napisy rozszerzone powinny obejmować nie tylko słowa wypowiadane przez postacie, ale też identyfikować kto mówi oraz opisywać ważne dźwięki tła (np. [śmiech], [muzyka], [telefon dzwoni])[4][5]. Dzięki temu osoby niesłyszące mogą śledzić fabułę lub przekaz materiału wideo w pełnym zakresie, mimo że nie słyszą dźwięku.

  • Dobry przykład: Materiał wideo (np. film instruktażowy lub nagranie wykładu) zawiera zamknięte napisy zsynchronizowane z obrazem. Napisy prezentują dokładnie dialogi lektora i bohaterów oraz dodatkowo wskazują istotne sygnały dźwiękowe (np. [rozlegają się fanfary], [głośny wybuch]). Wszystkie ważne informacje audio zostały w nich ujęte[5], więc osoba niesłysząca może w pełni zrozumieć materiał.
  • Zły przykład: Na stronie umieszczono film z wywiadem, bez jakichkolwiek napisów czy tłumaczenia na język migowy. W rezultacie osoby z ubytkiem słuchu są całkowicie wykluczone z odbioru treści wideo – nie mają dostępu do dialogów ani informacji przekazywanych słownie[6]. Taka praktyka narusza podstawowy poziom dostępności (poziom A) i jest poważnym błędem.

1.2.3 Audiodeskrypcja lub alternatywa tekstowa dla mediów (nagranie) – poziom A

Cel: Zapewnienie alternatywy tekstowej dla materiałów multimedialnych (wideo z dźwiękiem) lub audiodeskrypcji, tak aby zarówno informacje dźwiękowe, jak i wizualne były dostępne dla wszystkich. Z punktu widzenia osób niesłyszących kluczowe jest, by do każdego nagrania wideo z warstwą audio dołączono pełny opis tekstowy (transkrypcję), który zawiera zarówno dialogi/lektora, jak i opisy ważnych elementów wizualnych oraz dźwięków tła[7]. Taka transkrypcja stanowi alternatywę dla filmu – można ją przeczytać zamiast oglądać materiał, co zwiększa dostępność dla osób z niepełnosprawnością słuchu (jak również wzroku). Brak jakiejkolwiek formy tekstowej sprawia, że treść multimediów jest dla osób głuchych nieosiągalna.

  • Dobry przykład: Na platformie e-learningowej każdy film edukacyjny posiada dokument z transkrypcją, w którym spisano wszystkie wypowiedzi narratora i rozmów oraz opisano kluczowe zdarzenia wizualne i dźwiękowe. Transkrypcja obejmuje np. opis scen (co widać na ekranie) oraz informacje o odgłosach tła, dzięki czemu jest kompletnym odpowiednikiem treści audiowizualnej[7]. Osoba niesłysząca może albo czytać transkrypcję zamiast oglądać film, albo korzystać z niej równolegle, by niczego nie pominąć.
  • Zły przykład: Film promocyjny na stronie internetowej zawiera narrację słowną opisującą produkt oraz dynamiczne sceny, ale nie oferuje ani napisów, ani transkrypcji tekstowej. Użytkownik niesłyszący może zobaczyć jedynie kolorowe ujęcia, lecz nie pozna przekazywanych werbalnie informacji o produkcie. Brak tej alternatywy tekstowej zubaża doświadczenie osób z uszkodzonym słuchem, które nie są w stanie w pełni zrozumieć przekazu[8].

1.2.4 Napisy rozszerzone (na żywo) – poziom AA

Cel: Zapewnienie napisów dla treści audio na żywo (np. transmisji na żywo z wydarzeń, webinarów, streamingu video), aby osoby z dysfunkcją słuchu mogły w czasie rzeczywistym rozumieć przekaz. Gdy odbywa się transmisja zawierająca warstwę dźwiękową (mówiony komentarz, dialogi itp.), powinna być opatrzona symultanicznymi napisami lub inną formą tekstową, które oddają wypowiedzi i ważne dźwięki. Tylko wtedy osoby niesłyszące mogą na bieżąco śledzić wydarzenie, a nie dopiero po fakcie. Napisy na żywo są dziś uznawane za niezbędne dla pełnego zrozumienia przekazu przez osoby głuche i słabosłyszące[9].

  • Dobry przykład: Podczas konferencji online prelegenci prowadzą dyskusję transmitowaną na żywo. Organizator zapewnił profesjonalny transkrypcyjny przekaz tekstowy na żywo (tzw. napisy na żywo), widoczny pod oknem transmisji. Wypowiedzi uczestników są na bieżąco zapisywane i wyświetlane jako napisy, dzięki czemu osoby niesłyszące mogą pełnoprawnie uczestniczyć w konferencji i od razu rozumieć omawiane treści[9]. Alternatywnie stosowane są rozwiązania z automatycznym rozpoznawaniem mowy i generowaniem napisów, co również częściowo spełnia kryterium (choć jakość może zależeć od technologii).
  • Zły przykład: Webinar szkoleniowy jest nadawany na żywo z wykładowcą mówiącym do kamery, bez żadnych napisów ani tłumacza migowego. Osoby głuche oglądające transmisję nie mają możliwości dowiedzenia się, o czym mówi prelegent – są wykluczone z odbioru treści w momencie jej nadawania. Taka praktyka (brak napisów na żywo) jest poważnym błędem, całkowicie uniemożliwiającym osobom z ubytkami słuchu udział w wydarzeniu[6].

1.2.6 Język migowy (nagranie) – poziom AAA

Cel: Dostarczenie tłumaczenia na język migowy dla treści audio we wcześniej nagranych multimediach, aby osoby Głuche posługujące się głównie językiem migowym mogły w pełni zrozumieć przekaz. Wiele osób głuchych traktuje migowy jako swój pierwszy język, natomiast język pisany (np. polski) bywa dla nich językiem drugim i może sprawiać trudności[10]. Nawet jeśli dostępne są napisy, część Głuchych nie odczytuje z nich informacji tak sprawnie, jak odbiera komunikat migowy. Ponadto tłumaczenie migowe oddaje intonację, emocje i inne niuanse zawarte w ścieżce audio (np. ton głosu), których same napisy nie w pełni przekazują[11]. Zapewnienie tłumacza migowego (np. jako dodatkowego okienka wideo z tłumaczem) gwarantuje bogatszy i bardziej równoważny odbiór treści przez społeczność Głuchych, dla których migowy jest naturalny.

  • Dobry przykład: Na stronie uczelni udostępniono nagranie wykładu akademickiego z fizyki wraz z tłumaczeniem na polski język migowy (PJM). W odtwarzaczu wideo użytkownik może włączyć okienko z nagraniem tłumacza migowego, który synchronizuje się z mową wykładowcy i przekazuje całą treść wykładu w PJM[12]. Dzięki temu student Głuchy może oglądać tłumacza migowego i bez problemu przyswajać materiał, zamiast polegać wyłącznie na czytaniu napisów.
  • Zły przykład: Serwis informacyjny publikuje ważne wypowiedzi premiera w formie nagrań wideo z napisami w języku polskim, ale bez wersji w języku migowym. Dla wielu Głuchych napisy mogą okazać się niewystarczające – język polski (tekstowy) nie jest dla nich w pełni przystępny, co może powodować niepełne zrozumienie przekazu[10]. Brak tłumaczenia na PJM oznacza, że osoby te nie mają dostępu do informacji we własnym, najbardziej zrozumiałym języku, co obniża poziom dostępności (naruszenie kryterium 1.2.6 na poziomie AAA).

1.2.8 Alternatywa dla mediów (nagranie) – poziom AAA

Cel: Zapewnienie pełnej alternatywy tekstowej dla wszystkich synchronizowanych mediów (nagranych materiałów wideo z dźwiękiem), jak również dla samych nagrań wideo bez dźwięku. To kryterium ma na celu umożliwienie odbioru treści osobom z poważnymi ograniczeniami słuchu i wzroku jednocześnie, ale także wspiera osoby tylko niesłyszące – gwarantuje bowiem, że absolutnie cała informacja zawarta w filmie (zarówno audio, jak i wizualna) jest dostępna w formie tekstu[13]. Alternatywa tekstowa na poziomie AAA oznacza przygotowanie rozszerzonej transkrypcji opisowej, która oprócz dialogów zawiera szczegółowe opisy tego, co dzieje się na ekranie oraz wszystkich istotnych dźwięków w tle[14]. Taki dokument tekstowy pozwala osobie niesłyszącej zapoznać się nie tylko z samą narracją filmu, ale także z kontekstem wizualnym, co może być pomocne np. gdy jakieś informacje wynikają z obrazu, a nie zostały wypowiedziane.

  • Dobry przykład: Muzeum udostępnia na swojej stronie film prezentujący wystawę z przewodnikiem audio. Aby materiał był dostępny dla wszystkich, dołączono opisową transkrypcję w PDF obejmującą narrację przewodnika oraz opisy eksponatów pokazywanych w kadrze i odgłosów (np. gwar zwiedzających w tle). Taka transkrypcja jest pełnym odwzorowaniem doświadczenia wideo – zawiera dialogi, wszelkie ważne dźwięki oraz opisy wizualnych zdarzeń scena po scenie[15]. Osoba głuchoniewidoma może ją np. przeczytać na brajlowskim monitorze dotykowym, a osoba tylko niesłysząca – na ekranie, zyskując dostęp do całej zawartości filmu w formie tekstu.
  • Zły przykład: Na portalu szkoleniowym znajduje się seria filmów instruktażowych z pokazem wykonywania ćwiczeń gimnastycznych, gdzie trener omawia ćwiczenia głosowo. Brakuje jednak jakiejkolwiek transkrypcji czy opisu tekstowego tych filmów. Osoba głucha może obserwować ruchy trenera, ale nie słyszy jego wskazówek i komentarzy – przez to nie pozna wszystkich zaleceń dotyczących techniki ćwiczeń. Brak alternatywy tekstowej dla takich materiałów wideo narusza poziom AAA (1.2.8) i ogranicza dostępność treści dla osób z dysfunkcją słuchu oraz dodatkowo wzroku[13].

1.2.9 Tylko audio (na żywo) – poziom AAA

Cel: Zapewnienie alternatywy dla transmisji wyłącznie dźwiękowych na żywo. Innymi słowy, jeżeli w serwisie jest na żywo nadawana treść audio (np. relacja radiowa, strumień audio z wydarzenia), powinien istnieć sposób, by osoba niesłysząca mogła otrzymać te same informacje w formie tekstu (lub ewentualnie poprzez tłumacza migowego). Kryterium 1.2.9 wymaga udostępnienia równoległej transmisji tekstowej przedstawiającej dokładnie to samo, co przekaz audio na żywo[16]. Dla użytkowników głuchych oznacza to np. możliwość przeczytania transkrypcji lub na żywo pisanego sprawozdania, gdy inni słuchają dźwięku.

  • Dobry przykład: Urząd miasta prowadzi internetową transmisję na żywo z obrad rady miejskiej w formie audio (np. radio internetowe). Aby spełnić potrzeby osób niesłyszących, równocześnie publikowany jest na żywo protokół tekstowy – na stronie wyświetlany jest bieżący tekst przemówień radnych (wpisywany przez stenografa w czasie rzeczywistym). Alternatywnie mogłaby to być automatyczna transkrypcja na żywo. W efekcie osoba głucha może czytać wypowiedzi niemal w tym samym momencie, w którym padają, uzyskując dostęp do tych samych informacji co słuchacze.
  • Zły przykład: Stacja radiowa nadaje ważną debatę na żywo wyłącznie przez internetowy strumień audio, bez żadnej wersji tekstowej. Osoby niesłyszące nie mają możliwości uczestniczenia – nie wiedzą, co mówią uczestnicy debaty. Brak zapewnienia alternatywy (np. live bloga z opisem dyskusji lub napisów na żywo) oznacza niespełnienie kryterium 1.2.9[16]. Taka sytuacja pozostawia osoby z niepełnosprawnością słuchu całkowicie poza dostępem do przekazu na żywo.

1.3.3 Właściwości zmysłowe – poziom A

Cel: Zapewnienie, że instrukcje i informacje na stronie nie są przekazywane wyłącznie za pomocą wrażeń słuchowych (ani też wyłącznie wzrokowych). Innymi słowy, nie wolno opierać komunikatów tylko na dźwięku – ponieważ użytkownicy niesłyszący go nie odbiorą[17]. Dla osób głuchych krytyczne jest, by wszelkie sygnały dźwiękowe (alarmy, powiadomienia) czy polecenia typu „usłyszysz dźwięk oznajmiający…” miały swoje odpowiedniki wizualne lub tekstowe. To kryterium uniemożliwia np. sytuację, w której jedynym sposobem zorientowania się w błędzie formularza jest usłyszenie sygnału dźwiękowego – bo osoba głucha by go nie zauważyła[18].

  • Dobry przykład: Aplikacja web umożliwiająca rezerwację terminu wizyty wysyła powiadomienie o powodzeniu rezerwacji poprzez wyskakujące okienko z komunikatem tekstowym „Rezerwacja zapisana pomyślnie” oraz sygnał dźwiękowy „ding”. Nawet jeśli użytkownik nie słyszy dźwięku, zobaczy jednoznaczny komunikat na ekranie, dzięki czemu wie, że akcja się powiodła. Instrukcje w systemie również są formułowane opisowo – np. zamiast „po usłyszeniu dzwonka przejdź do kolejnego etapu” użyto sformułowania „gdy pojawi się komunikat Gotowe, przejdź do kolejnego etapu”.
  • Zły przykład: Strona internetowa informuje o błędzie w formularzu jedynie poprzez odtworzenie dźwięku dzwonka, bez żadnego komunikatu tekstowego czy innego wskaźnika wizualnego. Taka instrukcja („Dźwięk dzwonka oznacza pojawienie się błędu w danych”) jest całkowicie bezużyteczna dla osoby głuchej, która nie ma szans usłyszeć sygnału[18]. Poprawne rozwiązanie powinno dodatkowo zawierać np. czerwony komunikat z opisem błędu przy odpowiednim polu formularza.

1.4.2 Kontrola odtwarzania dźwięku – poziom A

Cel: Zagwarantowanie, że użytkownik ma kontrolę nad odtwarzaniem dźwięku na stronie, szczególnie gdy dźwięk uruchamia się automatycznie. Automatycznie odtwarzające się audio dłuższe niż 3 sekundy musi mieć możliwość wyłączenia, wstrzymania lub ściszenia niezależnie od ustawień systemowych[19]. Choć to kryterium chroni głównie przed zagłuszaniem np. czytników ekranu dla niewidomych, jest istotne również z perspektywy osób słabosłyszących. Głośny, niespodziewany dźwięk może sprawić im dyskomfort (np. przy korzystaniu z aparatu słuchowego) lub zwyczajnie ich rozpraszać. Osoba niesłysząca z kolei może nie zdawać sobie sprawy, że w tle gra audio, co bywa problematyczne, jeśli dźwięk zawiera istotne informacje – powinien wtedy móc go łatwo zatrzymać i skorzystać z alternatywy tekstowej.

  • Dobry przykład: Strona z portfolio artysty ma w tle podkład muzyczny, który startuje automatycznie. Zgodnie z zasadami dostępności umieszczono jednak widoczny przycisk „Wyłącz dźwięk” tuż na górze strony. Dzięki temu użytkownik – w tym osoba z nadwrażliwością słuchu lub korzystająca z czytnika ekranu – może natychmiast zatrzymać muzykę, jeśli mu przeszkadza[19]. Dodatkowo muzyka została zaprogramowana tak, że po 3 sekundach automatycznie się wycisza, jeśli użytkownik nie wejdzie z nią w interakcję.
  • Zły przykład: Na stronie sklepu internetowego automatycznie odtwarzany jest komunikat powitalny lektora bez możliwości pauzy lub wyłączenia. Osoba słabosłysząca może mieć problem ze zrozumieniem tego komunikatu przy pierwszym odtworzeniu (np. przez hałas otoczenia), a nie ma sposobu, by cofnąć lub zatrzymać dźwięk i odczytać go w innym tempie. Brak kontroli nad dźwiękiem narusza kryterium 1.4.2 – treści audio nie powinny grać w tle bez zgody i kontroli użytkownika.

1.4.7 Niska głośność lub bez dźwięków w tle – poziom AAA

Cel: Ułatwienie zrozumienia mowy na nagraniach audio przez osoby z ubytkiem słuchu, poprzez eliminację lub znaczące ściszenie dźwięków tła. Gdy nagranie audio zawiera głównie mowę (np. audiobook, podcast mówiony, wykład), wszelkie muzyczne czy efektowe tło dźwiękowe nie może zagłuszać mówcy. WCAG wymaga, aby dźwięki w tle były co najmniej o 20 decybeli cichsze od głosu lektora[20] – to oznacza, że są cztery razy cichsze od głównej treści mówionej. Alternatywnie, tło powinno dać się wyłączyć, albo w ogóle nie powinno go być. Dla osób słabosłyszących ma to ogromne znaczenie: przy wygłuszonym tle mogą znacznie łatwiej wychwycić i zrozumieć słowa mówiącego.

  • Dobry przykład: Podcast informacyjny został nagrany z bardzo cichym podkładem muzycznym, który nie konkuruje z głosem lektora. Muzyka tła jest ustawiona na poziomie ponad 20 dB niższym niż głos narratora, dzięki czemu nawet słuchacze z aparatami słuchowymi wyraźnie słyszą treść podcastu zamiast szumu w tle[20]. W innym przypadku twórcy audiobooka zdecydowali się w ogóle usunąć wszelkie efekty dźwiękowe podczas czytania tekstu książki – między rozdziałami pojawia się krótka muzyka, ale w trakcie mówienia lektora nie ma żadnych dodatkowych odgłosów. Takie praktyki spełniają kryterium 1.4.7 i czynią nagrania bardziej zrozumiałymi dla osób z wadą słuchu.
  • Zły przykład: Film szkoleniowy zawiera narrację lektora, ale w tle przez cały czas gra głośna muzyka. Dźwięki tła nie zostały wyciszone na czas mówienia – w efekcie nawet osoby o lekkim ubytku słuchu mają trudność ze rozróżnieniem słów lektora od muzyki. Tło zagłusza treść przekazu, co oznacza niespełnienie kryterium 1.4.7 (niska lub zerowa głośność dźwięków w tle). Osoba słabosłysząca może nie zrozumieć instrukcji z filmu, mimo że potencjalnie byłaby w stanie je usłyszeć, gdyby nie konkurencyjny hałas.

Źródła: Powyższe przykłady i opisy opracowano na podstawie wytycznych WCAG 2.1 oraz materiałów źródłowych dotyczących dostępności treści dla osób z niepełnosprawnością słuchu[5][6][17]. Zastosowanie tych kryteriów sukcesu w praktyce pozwala tworzyć strony internetowe i aplikacje w pełni dostępne dla osób niesłyszących i niedosłyszących, zapewniając im równy dostęp do informacji. Przy projektowaniu treści warto zawsze uwzględniać potrzeby tej grupy użytkowników – od napisów i transkrypcji po opcję tłumaczenia migowego – aby eliminować bariery komunikacyjne. Wszystkie opisane kryteria (od poziomu A po AAA) składają się na komplet dobrych praktyk gwarantujących, że treści audio i wideo są percepcyjnie dostępne dla każdego, bez względu na poziom słyszenia. [1][9]

[1] [2] [3] Objaśnienie Kryterium sukcesu 1.2.1: Tylko audio lub tylko wideo (nagranie) | WAI | W3C

https://wcag.irdpl.pl/understanding/tylko-audio-lub-tylko-wideo-nagranie

[4] Objaśnienie Kryterium sukcesu 1.2.2: Napisy rozszerzone (nagranie) | WAI | W3C

https://wcag.irdpl.pl/understanding/napisy-rozszerzone-nagranie

[5] WCAG 2.0 – Wytyczna 1.2 Media zależne od czasu – 1.2.2 Napisy (nagranie) (A)

http://wcag20.widzialni.org/napisy,new,mg,165,170.html,58

[6] WCAG 2.1 – Kryterium 1.2.4 Napisy rozszerzone (na żywo) (poziom AA) – Ivento Interactive Kraków – ivento.pl

https://www.ivento.pl/wcag/wcag-2-1-kryterium-1-2-4-napisy-rozszerzone-na-zywo-poziom-aa/

[7] [8] WCAG 2.1 – Kryterium 1.2.3 Audiodeskrypcja lub alternatywa tekstowa dla mediów (poziom A) – Ivento Interactive Kraków – ivento.pl

https://www.ivento.pl/wcag/wcag-2-1-kryterium-1-2-3-audiodeskrypcja-lub-alternatywa-tekstowa-dla-mediow-poziom-a/

[9] Napisy na żywo – Świat Głuchych

https://swiatgluchych.pl/napisy-na-zywo/

[10] WCAG 2.1 – kryterium 1.2.6 – Język migowy (poziom AAA) – Kinaole

https://kinaole.co/wcag-2-1-kryterium-1-2-6-jezyk-migowy-poziom-aaa/

[11] [12] Objaśnienie kryterium sukcesu 1.2.6: Język migowy (nagranie) | WAI | W3C

https://www.irdpl.pl/objasnienia/WCAG-22_KS-126.html

[13] [14] [15] Kryterium 1.2.8 – Alternatywa dla mediów – nagranie (poziom AAA) – perfekcyjneStrony.pl

https://perfekcyjnestrony.pl/kryterium-1-2-8—alternatywa-dla-mediow-nagranie-poziom-aaa

[16] [PDF] Metoda oceny dostępności cyfrowej strony internetowej zgodnie z …

https://www.widzialni.org/container/metoda-oceny-dostepnosci-cyfrowej-strony-internetowej-zgodnie-z-zasadami-wcag-2.1.pdf

[17] [18] 1-3-3 Właściwości zmysłowe | Pracownia Dostępności Cyfrowej LepszyWeb.pl

https://testy.lepszyweb.pl/1-3-3-Wlasciwosci-zmyslowe

[19] WCAG 2.1 – Skrócony opis wytycznych dla dostępności internetowej.

https://smultron.software/pl/blog/wcag-2-1-skrocony-opis-wytycznych-dla-dostepnosci-internetowej

[20] Wytyczne dla dostępności treści internetowych (WCAG) 2.1

https://www.w3.org/Translations/WCAG21-pl/