Kompanija „Gugl“ otkrila je svoj novi sistem za prebacivanje teksta u govor koji će omogućiti veštačkoj inteligenciji da govori onako kako to rade ljudi, prenosi Kurir.
Alatka nazvana Takotron 2 uvežbana je na primerima ljudskog dijaloga kako bi njen govor bio što realističniji.
– Takotron 2 je skoro nemoguće razlikovati od ljudskog govora. Reč je o drugoj generaciji tehnologije prebacivanja teksta u govor, a sposobna je da različito čita reči koje se isto pišu a u zavisnosti od konteksta – saopštio je „Gugl“.
Kako se navodi, tehnologija ima dve duboke veštačke nervne mreže. Prva prevodi tekst u spektogram u pdf formatu, što je vizuelni način predstavljanja audio-frekvencija. Taj spektogram se onda ubacuje u Vejv net, sistem iz laboratorije Dip majnd, koja čita tabelu i stvara audio-elemente.
Primeri govora predstavljeni su na internetu i svako ih može poslušati.
– Naš sistem govora zvuči odlično, ali postoji još teškoća na koje nailazimo i koje moramo prevazići. Neke teške reči i dalje umeju da naprave problem i dovode do stvaranja čudnog zvuka – navode tvorci sistema u saopštenju.
Sistem je napravljen tako da govori ženskim glasom. U slučaju da se glas promeni i izabere drugi ženski ili neki muški glas, sistem je potrebno trenirati iz početka.
Poslušajte primere kako Takotron 2 zvuči.
Pratite Krstaricu na www.krstarica.com