“Puhesyntetisaattoreita on ollut pc-koneissa 1980-luvulta alkaen. Ääni on vuosikymmenien saatossa kehittynyt luonnollisemmaksi ja selvemmäksi.
Aalto-yliopiston ja Helsingin yliopiston tutkijaryhmä on edelleen kehittänyt menetelmiä äänenlaadun parantamiseksi.
Tuomo Raitio väittelee kesäkuussa Aalto-yliopistossa puheen äänilähteen mallintamisesta tilastollisessa parametrisessa puhesynteesissä. Raition väitöskirja esittelee kaksi uutta menetelmää äänilähteen käänteissuodatukseen sekä uusia tapoja mallintaa äänihuulten tuottamaa ääntä.
“Yritämme ennustaa ja mallintaa äänen syntymistä glottiksessa eli äänilähteessä.”
Glottis eli äänirako on oikean ja vasemman äänihuulen sekä oikean ja vasemman kannuruston väliin jäävä rako.
Näin Raitio kollegoineen on pystynyt luomaan tietokoneella synteettisiä ääniä, jotka muistuttavat entistä enemmän aitoa ihmisääntä.
“Huomasimme, että näiden uusien äänilähteen mallinnusmenetelmien avulla tietokoneen tuottamaa ääni saadaan kuulostamaan tietyltä ihmiseltä. Usein usein myös ymmärrettävyys paranee”, Raitio selvittää Tivin sisarlehdessä, T&T Päivässä.”