Sześć powodów, by zrezygnować ze stosowania plików PDF na stronach internetowych

Kiedyś już protestowałem przeciwko stosowaniu plików PDF bez potrzeby,a teraz znalazłem ciekawy tekstdający kolejną porcję argumentów przeciwko temu formatowi. Artykuł opisuje australijskie strony rządowe, które cierpią na podobne schorzenie informacyjne, jak polskie – składają się często z zestawu linków do plików PDF. Autor zaś podaje sześć powodów, by przestać to robić.

  1. Dane nie są otwarte i nie pozwalają na łatwe ekstraktowanie, bo brak w środku semantyki.
  2. Są trudne do ponownego wykorzystania (ang. re-use), co wynika z poprzedniego.
  3. Sprawiają problemy w wyszukiwaniu, przy czym te po polsku są dodatkowo skomplikowane ze względu na różnorodność sposobów osadzania polskich liter.
  4. Problemy z mierzeniem sposobów korzystania z dokumentów przez użytkowników, bo dostępna jest tylko informacja o pobraniu pliku.
  5. Problemy UX (ang. user experience) wynikające z problemów ze znajdowaniem treści, niechcianym pobieraniem plików itp.
  6. Problemy z dostępnością, którą osiągnąć w tym formacie jest znacznie trudniej, niż w takim na przykład HTML.

Zdaję sobie sprawę, że niemal wszystkie powyższe problemy da się rozwiązać stosując odpowiednie narzędzia i dokładając starań. Po to właśnie Adobe opracowała standard PDF/A, a wcześniej tagowanie dokumentów. Jednak niemal nikt nie wie, jak korzystać z tych narzędzi i standardów. Najczęściej proces polega na wrzuceniu do kopiarki sterty papieru i odebranie przez pocztę elektroniczną gotowego pliku PDF, który ma wszystkie wymienione na początku wady. Problem z formatem PDF polega bowiem na tym, że zbyt dobrze imituje informację analogową, czyli dokument papierowy. Tak dobrze, że nikomu nie przychodzi do głowy, że w środku może to być śmieć informacyjny.