Tehnologija prepoznavanja glasa

Verovatno ste čuli da računarom može da se upravlja i glasom. Da, upravo tako, i pri tome vam uopšte nije potrebna neka posebno snažna mašina, već obični prosečni kućni PC. Za komandovanje računarom glasom biće vam potreban odgovarajući softver.

Da biste koristili program za prepoznavanje glasa, diktirali reči i instrukcije u mikrofon, od hardvera će vam biti potebni mikrofon, zvučnici ili slušalice, i zvučna kartica u koju ćete ih priključiti.

Većina programa za prepoznavanje glasa dolazi sa odgovarajućim setom slušalica i mikrofona, koji se uključuju u zvučnu karticu, na vašem PC-ju. Ako je moguće, pri nabavci pokušajte na pronađete set i mikrofon koji poseduje tzv. eliminator šumova, koji umanjuje nepoželjnu buku u pozadini.

Kao nekakav hardverski minimum za korišćenje tehnologije prepoznavanja glasa postavlja se PC sa procesorom Pentium II ili jačim i 32 MB RAM-a. Sve iznad ovoga poboljšaće performanse i uspešnost prepoznavanja vašeg glasa.

Neki od najpoznatijih programa za prepoznavanje glasa su: Dragon Dictate, Naturally Speaking i Point & Speak, a takođe, i nova verzija Microsoft Offica XP, poseduje mogućnosti za prepoznavanje glasa.

Kada nabavite odgovarajući program i instalirate ga na svoj računar, trebaće da „istrenirate“ vaš PC da što bolje prepozna vaš glas. Ovo je obavezan deo koji predstoji korišćenju bilo kog od navedenih programa. Sam softver će vas voditi kroz proces treniranja prepoznavanja vašeg specifičnog izgovora. U diktat-modu, tvrdi se da stepen prepoznavanja obično biva 140 reči u minutu, sa više od 95% tačnosti u prepoznavanju. Mod za komandovanje obično je sporiji od diktata, ali je gotovo sigurno brži od korišćenja miša.

Kada izgovarate reči u mikrofon, zvuk se u PC-ju skladišti kao digitalni zvučni fajl i to često u WAV formatu, te se odmah prosleđuje softveru za prepoznavanje glasa. Potom ovaj softver razlaže zvuke u pojedine delove i pokušava da prepozna pojedine reči.

Nakon prepoznavanja reči uklapa ih u fraze i koristi ugrađene rečnike i gramatička pravila engleskog jezika da bi prepoznao govor. Za sada svi ovi programi prepoznaju samo engleski jezik, uz još poneki, tako da još uvek nemamo program koji podržava srpski jezik.

Softver za prepoznavanje glasa uglavnom vrši tri funkcije:

  • prva je komandna (commands and controls), kada vaš glas aktivira određene operacije u programima, kao što su pokretanje programa, otvaranje fajlova i slično.
  • druga primena je diktat, pri tome govorite manje ili više kontinualno, program prepoznaje govor i ubacuje prepoznati tekst u dokumente.
  • treća funkcija je editovanje, kada koristite svoj glas za ispravljanje grešaka i editovanje dokumenata.

Pratite Krstaricu na www.krstarica.com