Neuronska mreža određuje pol autora po — tekstu

Kolektiv naučnika Nacionalnog istraživačkog nuklearnog univerziteta MIFI, Nacionalnog istraživačkog centra Kurčatovski institut Voronješkog državnog univerziteta razradili su metod koji obučava kompjuter da raspoznaje pol čoveka po napisanom tekstu sa preciznošću do 80 odsto.

Naučna razrada tiče se kompjuterske lingvistike. Istraživanje je sprovedeno zahvaljujući grantu Ruskog naučnog fonda, a rezultati su objavljeni u časopisu Prosidija kompjuter sajens.

Brojna naučna istraživanja pokazuju da pisani tekst neizbežno odražava karakteristike njegovog autora — pol, psihološke osobenosti, nivo obrazovanja. Reč je vredan psihodijagnostički instrument koji koriste stručnjaci kadrovskih službi velikih kompanija, kao i službi bezbednosti.

Na osnovu analize govora mogu se dijagnostikovati neka oboljenja čoveka (demencija, depresija) i sklonost ka suicidu. Potreba za uspostavljanjem karakteristika autora teksta raste kako se razvija internet-komunikacija: kompanijama je važno da znaju kakvim se grupama dopadaju njihova roba i usluge.

Naučnici koji rade u datoj oblasti (lingvisti, psiholozi, eksperti za informacione tehnologije) na osnovu numeričkih značenja raznih parametara teksta grade matematičke modele radi dijagnostifikovanja pojedinih parametara ličnosti.

Kolektiv stručnjaka analizirao je efikasnost različitih tehnologija obuke mašina uz korišćenje neuronskih mreža za analizu tekstova.

U toku istraživanja oni su uporedili tačnost rešavanja zadataka genderne identifikacije tekstova na osnovu dva prilaza modelovanju podataka: s jedne strane algoritam mašinske obuke, s druge strane neuronske mreže dubinske obuke.

„Postigli smo visoke rezultate u određivanju pola autora teksta zahvaljujući naprednim modelima neuronskih mreža u uslovima kada autor ne krije svoj pol. Na redu je zadatak određivanja pola u uslovima njegovog namernog skrivanja“, kaže docent NINU MIFI Aleksandar Zbojev.

Tako u narednim tekstovima koji su objavljeni na sajtu za upoznavanje neuronska mreža bez teškoća nalazi sumnjiva mesta u deset slučajeva od deset mogućih, iako se autor u potpisu namerno određuje kao osoba suprotnog pola.

Tekst čiji je autor devojka: „Ja sam lep, mišićav muškarac 30 godina star. Radim u velikoj petrohemijskoj kompaniji na dobrom mestu sa velikom platom. Živim u svom stanu u Moskvi. Takođe imam malu ali simpatičnu kuću u jednom italijanskom selu. Bavim se sportom, između ostalog fudbalom. Volim da provodim vikend van kuće, ne trpim kućne moljce. Devojka koja bi mi odgovarala mora da bude skromna, lepa i zgodna po savremenim standardima. Ona treba da deli moja interesovanja, ne treba da bude ljubomorna i ne treba da pokušava da izazove ljubomoru kod mene. Ne planiram da izdržavam devojku pošto smatram da u porodici treba oboje da rade. Budžet takođe planiram da vodim odvojeno. Neću oprostiti prevaru“.

Tekst čiji je autor muškarac: „Dobar dan! Ja sam krajnje nezadovoljna, krajnje! Zašto se tako ponašate prema nama?! Mi smo takođe ljudi, svi smo jednaki! Da li ste seksista? Ja više neću to da trpim! Ja ću tvoja kola da polupam, išaram. Čekaj, gade. Sve ima tako da se završi“.

Rezultati ovog istraživanja pokazali su da prilaz zasnovan na korišćenju konvolucionalne neuronske mreže i metoda duboke obuke za raspoznavanje pola autora teksta daje optimalne rezultate.

Sada grupa istraživača rešava zadatak prepoznavanja godina.

(Sputnjik)

Pratite Krstaricu na www.krstarica.com