Začetek projekta:
6. 7. 2009
Konec projekta:
30. 9. 2010
Vodja projekta:
Špica International d.o.o.
Partnerji:
Amebis, Institut "Jožef Stefan", Iskratel
Vrednost pogodbe:
444.117,44 EUR
Razvojni program:
OPRR
Instrument:
Javni razpis za spodbujanje raziskovalno razvojnih projektov razvoja e-vsebin in e-storitev v letih 2009 in 2010
Razvoj govornega vmesnika
Izvajalca: Amebis in Inštitut »Jožef Stefan«
Ideja
Govorni vmesnik bo služil kot dodatna možnost sporazumevanja med človekom in napravami. Sestavljen bo iz dveh osnovnih modulov: razpoznave in sinteze govora.
Razpoznava govora
Sistem razpoznave bo uporabnikom ponudil možnost, da ukaze oz. vprašanja ne le vtipkajo, ampak kar izgovorijo. Omenjena možnost bo predstavlja veliko pridobitev za vse kategorije uporabnikov, ne le za slepe in slabovidne, seveda ob predpostavki, da bo tak sistem v praksi zaradi vseh tehnoloških problemov tudi zares uporaben.
Sinteza govora
Za razliko od razpoznave govora, ki bo v projektu bolj eksperimentalne narave, pa bo sinteza govora zanesljivo omogočala povsem realno izboljšavo sistema. V ta namen bomo uporabili sistem Govorec, obstoječi programski paket za sintezo govora, ki omogoča pretvorbo poljubnega slovenskega besedila v zvočni zapis – govor. Sistem Govorec je bil razvit na Institutu Jožef Stefan v Ljubljani, njegovo implementacijo in razvoj pa je prevzelo podjetje Amebis, d. o. o. iz Kamnika. Sistem Govorec bo uporabnikom ponudil možnost, da informacije iz naprav ne le preberejo, ampak tudi slišijo. Omenjena možnost prav tako ne predstavlja samo pridobitve za slepe in slabovidne, ampak tudi za vse druge uporabnike.
Na projektu bomo sistem Govorec še dodatno izboljšali. Na osnovi testiranj smo se odločili, da bomo v omejenem časovnem okviru največ pridobili na kvaliteti z vgradnjo baze naglašenih besednih oblik namesto vgrajenega algoritmičnega naglaševalnika. To bo omogočilo razumljivejši govor kljub nekoliko skromnejšemu slovarju fonemov in uporabi TD-PSOLE kot načinu njihovega sestavljanja v obstoječi verziji.
Napredek na projektu
Pripravili smo novo verzijo Govorca, ki ne naglašuje več s pomočjo za to ustreznega algoritma, ampak s pomočjo v bazi zapisanih naglasov za posamezne besedne oblike. Poleg tega smo v okviru aktivnosti A2a razvili prilagojeno spletno storitev, ki s pomočjo novega Govorca omogoča posredovanje govornega (zvočnega) zapisa ostalim odjemalcem v sistemu UVID.