Tajemniczy tekst odczytywalny maszynowo

Zbliża się do końca czas, w którym podmioty publiczne muszą przygotować raporty z zapewnienia dostępności. Mnożą się pytania, zwłaszcza ze strony ludzi, którzy całkiem niespodziewanie zostali wskazani palcem, że teraz mają zdobyć odpowiednią wiedzę i przygotować raport. Jednym z dość często pojawiających się pytań jest: czym do jasnej jest ten cały tekst odczytywalny maszynowo? Postaram się odpowiedzieć najprościej, jak potrafię.

Podmioty publiczne mają obowiązek opublikować informacje o działalności w trzech postaciach: tekście odczytywalnym maszynowo, przetłumaczone na polski język migowy i w tekście łatwym do czytania (ETRT). Obecność tych informacji trzeba wykazać w raporcie, a tu okazuje się, że nie bardzo wiadomo, co to właściwie jest.

W objaśnieniach do raportu można znaleźć coś takiego:

tekst odczytywalny maszynowo – tekst, który może być odczytany przez syntezator mowy, przy pomocy czytnika ekranu (w telefonie komórkowym i/lub komputerze – np. z wykorzystaniem bezpłatnego oprogramowania NVDA),

To jest bardzo fajna, funkcjonalna definicja. Prosta, ale tylko pod warunkiem, że czytelnik wie, czym jest czytnik ekranu i jak działa. A najczęściej nie wie i zaczyna się zastanawiać, czy musi on być jakoś specjalnie przygotowany. Odpowiedź zaś jest prosta jak drut – to zwykły tekst.

Ten opisowy sposób oznacza w praktyce, że ta informacja nie może być publikowana w postaci grafiki. Tekst odczytywalny maszynowo to taki tekst, który może być odczytany przez oprogramowanie, w tym czytnik ekranu, bez utraty informacji.

Tekst odczytywalny maszynowo pozwala na odczytanie treści, struktury i formatowania, oczywiście o ile takie informacje istnieją. W formacie plain text odczytać można tylko treść, bo nie ma w nim semantyki i formatowania. Jednak większość nośników tekstu (HTML, DOCX, ODT, RTF, PDF) zawierają w sobie komplet informacji do przetwarzania. Czytnik ekranu może odczytać każdy znak, sposób jego formatowania, a także informacje, czy jest to akapit, komórka tabeli, śródtytuł, czy może tekst alternatywny. Zatem każdy spełnia definicję tekstu odczytywalnego maszynowo.

Sam format jednak nie gwarantuje, że umieszczony w nim tekst jest odczytywalny maszynowo. Po pierwsze – można w nich osadzać grafiki z tekstem zamiast tekstu. Po drugie – formatowanie może być tylko wizualne i tekst jest pozbawiony semantyki. W przypadku prostego tekstu napisanego w edytorze treści za pomocą klawiatury takie problemy nie wystąpią.

Na koniec rada praktyczna. Skoro wiele formatów spełnia wymagania, to który najlepiej wybrać? Moim zdaniem – HTML. Jest to język znaczników używany do tworzenia stron internetowych. Jest interpretowany bezpośrednio przez każdą przeglądarkę internetową. W praktyce – najlepiej, jeżeli ten opis jest po prostu podstroną w stronie internetowej.