Začetek projekta:

6. 7. 2009

Konec projekta:

30. 9. 2010

Vodja projekta:

Špica International d.o.o.

Partnerji:

Amebis, Institut "Jožef Stefan", Iskratel

Vrednost pogodbe:

444.117,44 EUR

Razvojni program:

OPRR

Instrument:

Javni razpis za spodbujanje raziskovalno razvojnih projektov razvoja e-vsebin in e-storitev v letih 2009 in 2010

Razvoj govornega vmesnika

Izvajalca: Amebis in Inštitut »Jožef Stefan«

Ideja

Govorni vmesnik bo služil kot dodatna možnost sporazumevanja med človekom in napravami. Sestavljen bo iz dveh osnovnih modulov: razpoznave in sinteze govora.

Razpoznava govora

Sistem razpoznave bo uporabnikom ponudil možnost, da ukaze oz. vprašanja ne le vtipkajo, ampak kar izgovorijo. Omenjena možnost bo predstavlja veliko pridobitev za vse kategorije uporabnikov, ne le za slepe in slabovidne, seveda ob predpostavki, da bo tak sistem v praksi zaradi vseh tehnoloških problemov tudi zares uporaben.

Sinteza govora

Za razliko od razpoznave govora, ki bo v projektu bolj eksperimentalne narave, pa bo sinteza govora zanesljivo omogočala povsem realno izboljšavo sistema. V ta namen bomo uporabili sistem Govorec, obstoječi programski paket za sintezo govora, ki omogoča pretvorbo poljubnega slovenskega besedila v zvočni zapis – govor. Sistem Govorec je bil razvit na Institutu Jožef Stefan v Ljubljani, njegovo implementacijo in razvoj pa je prevzelo podjetje Amebis, d. o. o. iz Kamnika. Sistem Govorec bo uporabnikom ponudil možnost, da informacije iz naprav ne le preberejo, ampak tudi slišijo. Omenjena možnost prav tako ne predstavlja samo pridobitve za slepe in slabovidne, ampak tudi za vse druge uporabnike.

Na projektu bomo sistem Govorec še dodatno izboljšali. Na osnovi testiranj smo se odločili, da bomo v omejenem časovnem okviru največ pridobili na kvaliteti z vgradnjo baze naglašenih besednih oblik namesto vgrajenega algoritmičnega naglaševalnika. To bo omogočilo razumljivejši govor kljub nekoliko skromnejšemu slovarju fonemov in uporabi TD-PSOLE kot načinu njihovega sestavljanja v obstoječi verziji.

Napredek na projektu

Pripravili smo novo verzijo Govorca, ki ne naglašuje več s pomočjo za to ustreznega algoritma, ampak s pomočjo v bazi zapisanih naglasov za posamezne besedne oblike. Poleg tega smo v okviru aktivnosti A2a razvili prilagojeno spletno storitev, ki s pomočjo novega Govorca omogoča posredovanje govornega (zvočnega) zapisa ostalim odjemalcem v sistemu UVID.