wb01539_.gif (682 octets) OsiDial: intergracja z Microsoft Speech API


Microsoft Speech API (SAPI) jest specyfikacją standardu dla programistów w zakresie tworzenia i dostępu do "silników" syntezy i rozpoznawania mowy. Dzięki temu aplikacje mogą korzystać z dowolnych serwerów OLE rozpoznawania i syntezy mowy, bez wzgledu na to, jak zaimplementowane są poszczególne funkcje. Istnieje pewność, że jeśli aplikacja działa z jednym z silników głosowych, to będzie poprawnie działała z każdym innym silnikiem zgodnym z SAPI. Z drugiej strony producenci silników do przetwarzania mowy mają świadomość, że aplikacje wykorzystujące konkurencyjne silniki, mogą bez żadnego dodatkowego nakładu pracy być potencjalnymi klientami.

W chwili obecnej pakiet OsiDial został zintergrowany z silnikami zgodnymi z SAPI w zakresie przetwarzania tekstu na mowę. Rozpoznawanie mowy zgodne z SAPI nie zostało uwzględnione, gdyż brak jest na rynku dobrych silników rozpoznawających mowę polską. Są natomiast programy, polskie i zagraniczne, generujące mowę polską.

Funkcjonowanie

OsiDial może generować informacje głosowe na podstawie informacji zawartych w plikach tekstowych. Długość tekstu nie jest ograniczona. Przetwarzanie tekstu następuje równocześnie z jego odtwarzaniem przez telefon. Dzwoniący nie musi czekać, aż cały tekst zostanie przetworzony. Podczas przetwarzania dostępne są bez zmian inne typowe funkcje: detekcja klawiszy DTMF, detekcja i rozpoznawanie mowy. Istnieje możliwość dynamicznego doboru rodzaju głosu (męski, żeński), wyboru języka (polski, angielski, niemiecki, francuski, włoski, hiszpański) oraz zmiany parametrów dzwięku (głośność, szybkość).

Typowe zastosowania: