Nagrania dźwiękowe, które niosą ze sobą informację, powinny być zaopatrzone w tekst dokładnie transkrybujący zawartość. Nie ma tu mowy o nagraniach w rodzaju utworów muzycznych, ale o przemówieniach, wykładach, audycjach i podobnych.
Kryterium sukcesu 1.2.2 nakazuje, by w nagraniach umieszczać pełną transkrypcję treści dźwiękowej. Obejmuje ona wszystko to, co jest słyszalne: treść wypowiedzi, informacje o osobie wypowiadającej się, a jeżeli to konieczne – także opis odgłosów. Skorzystają na tym:
- użytkownicy niesłyszący, którzy będą mogli śledzić treść audycji;
- użytkownicy, którzy z pewnych powodów nie mogą odsłuchiwać nagrań;
- roboty sieciowe, które będą mogły łatwiej indeksować treści.
Wydawać by się mogło, że SC 1.2.1 powinno już wystarczyć dla zapewnienia dostępności treści dźwiękowych osobom niesłyszącym. Jednak wystarczy sobie wyobrazić, że równocześnie nad nagraniem pracują osoby głuche i słyszące, by zrozumieć dlaczego to rozwiązanie jest ważne. Pierwsi będą śledzić treść za pomocą wzroku, a drudzy – słuchu. Jeżeli zaś trafi się jeszcze osoba głuchoniewidoma, to może dotrzeć do treści przy pomocy monitora brajlowskiego.
Wykonanie takiej transkrypcji jest dosyć czasochłonne, ale technicznie proste. Różne kontenery multimediów na to pozwalają, na przykład Quick Time, Real Media czy Windows Media. Wszystkie tutoriale pochodzą z serwisu WebAim. Tekst można umieszczać także w formatach MP3 czy OGG.
Analogicznie jak w wypadku SC 1.2.1 udostępnianiu nie podlegają nagrania, które same są alternatywą dla innych multimediów. A zatem w szczególności dotyczy to ścieżki audiodeskrypcyjnej.