Jakiś czas temu pisałem o tym, że Amazon zamierza zwiększać dostępność w tabletach Kindle, gdzie – jako ciekawostkę – podałem, że syntezę mowy dostarczać ma polska firma IVONA Software. Okazuje się jednak, że Amazon przejął firmę wraz z jej produktami. Wydaje się, że właścicielom należy pogratulować, choć mam nadzieję, że się odpowiednio zabezpieczyli przed zmarginalizowaniem ich roli w tak wielkiej korporacji. No i naszło mnie na refleksje, bo z firmą Ivo Software miałem kontakt od samego jej początku.
Trochę się boję, że będę w tym wyglądał jak żaba podstawiająca nogę do podkucia. Jednak byłem jednym z pierwszych testerów syntezatora Spiker, jego orędownikiem wśród osób niewidomych i krytykiem pewnych działań, o czym za chwilę. Jednak dwanaście lat temu Łukasz Osowski przyjeżdżał do mojego domu i na blaszanym PC instalował wersje testowe pierwszego syntezatora Spiker, który był naprawdę słaby. Po dopracowaniu stał się użytecznym narzędziem i znam ludzi, którzy używają go do dzisiaj, chociaż pojawiły się lepsze, bardziej naturalnie brzmiące głosy.
Potem firma zaczęła poszukiwania w różnych kierunkach, niekoniecznie dobrych. Rozwijali algorytmy syntezy, narzędzia do tworzenia korpusów i powstawały coraz lepsze głosy. Wytrzymali konkurencję z syntezatorem Realspeak firmy Scansoft, który był dołączany do programów odczytu ekranu – początkowo za niewielką dopłatą, a potem za darmo. Wytrzymali pojawienie się innych konkurentów jak Acapella i Loquendo. Wytrzymali, bo konsekwentnie rozwijali swój produkt i śrubowali jego jakość. Wreszcie zostali docenieni nagrodą za najlepszy na świecie syntezator, wyprzedzając takich potentatów, jak IBM czy Microsoft.
Zawsze pozostawało dla mnie zagadką, po co wymyślili Intelligent Web Readera – przeglądarkę internetową dla niewidomych. Na rynku były od dawna lepsze rozwiązania – bardziej uniwersalne, bo nie tylko służące przeglądaniu Internetu, ale generalnie do obsługi komputera. JAWS for Windows, Window-Eyes, Hal i kilka innych, które są podstawowym wyposażeniem komputera niewidomego użytkownika. A tu nagle specjalna przeglądarka, która wymagała wyłączenia podstawowego programu, by zaoferować dostęp do kilkunastu lub kilkudziesięciu serwisów internetowych. Na dodatek – program obsługiwało się zupełnie inaczej, niż inne programy, a zatem trzeba było się go nauczyć od podstaw. Nic więc dziwnego, że nikt go nie używał, pomimo że był za darmo. Model biznesowy polegał na sprzedawaniu profili do serwisów internetowych, które były obsługiwane przez tą przeglądarkę. Nieświadomi właściciele serwisów internetowych kupowali to rozwiązanie wierząc, że w ten sposób tworzą dostępność. Pieniądze były wyrzucane w błoto. Rozwiązanie to skrytykowałem na łamach Chipa w 2005 roku, ale niewiele to pomogło.
Rozwinięciem idei przeglądarki było narzędzie o nazwie iWebReader, czyli rozszerzenie instalowane na stronie internetowej. Pozwalało ono na odczytanie wstępnie zdefiniowanej treści po użyciu stosownego skrótu klawiszowego. Nie wymagało to używania specjalnej przeglądarki i działało w każdej powszechnie stosowanej. Niestety – przekaz marketingowy był konstruowany w następujący sposób: to narzędzie pozwala na korzystanie ze stron internetowych osobom niepełnosprawnym. I znowu nieświadomi właściciele serwisów kupowali to rozwiązanie zamiast tworzyć strony w zgodzie ze standardami dostępności. Taka protetyka, która nie działała. Nie pomógł nawet wspólny komunikat podmiotów zajmujących się dostępnością stron internetowych.
Na szczęście firma rozwijała także swój podstawowy produkt, czyli syntezator mowy. Powstawały kolejne głosy w kilkunastu językach. Synteza była na naprawdę wysokim poziomie, o czym świadczy chociażby stosowanie jej na warszawskich dworcach kolejowych i metra. Wielu ludzi nie zdaje sobie sprawy z faktu, że zapowiedzi są odczytywane przez sztuczny głos. Jeden ze znajomych anglistów zachwycał się angielskojęzycznym głosem, który doskonaleakcentował i praktycznie nie miał wad. A tenże anglista zajmuje się także analizą dźwięku, więc jest to szczególnie duża pochwała. I ta wysoka jakość została teraz doceniona zainteresowaniem firmy Amazon. Uważam to za naprawdę duży sukces spółki z Gdyni, bo do wyboru były inne rozwiązania, być może równie interesujące. Gratulując i życząc powodzenia panom Osowskiemu i Kaszczukowi mam nadzieję, że ich produkty będą nadal dostępne. Myślę tu o syntezatorach w standardzie SAPI i IVONA Reader, które są bardzo pomocne dla osób niewidomych.
Przypominając sobie różne rzeczy z przeszłości dotarło do mnie, że napisałem swego czasu spory email do Łukasza Osowskiego na temat kierunków rozwoju technologii dla osób niewidomych. Zrobiłem to na jego życzenie i wskazywałem, gdzie warto zainwestować siły i talenty programistyczne. Niestety – nie mam tego tekstu, czego bardzo żałuję. Pamiętam jednak, że już wtedy zwracałem uwagę na platformy mobilne jako przyszłościowe rozwiązanie. No i proszę – sprawdziło się!