Model za generisanje velikih video zapisa razvijen u Kini dostupan za globalnu upotrebu

Vidu, model za generisanje velikih video zapisa koji su razvili kineska kompanija za veštačku inteligenciju (AI) ŠengŠu tehnologija i Univerzitet Tsinghua i koji omogućava generisanje videa iz teksta u video i iz slike u video, nedavno je postao dostupan za globalnu upotrebu.

Vidu je sposoban da kreira klipove od četiri sekunde za 30 sekundi i može generisati videa do 32 sekunde u jednom potezu, piše Sinhua.

„Vidu može simulirati stvarni fizički svet, stvarajući detaljne scene koje se pridržavaju fizičkih zakona, poput prirodnog osvetljenja i efekata senki, kao i složenih facijalnih izraza. Pored toga, može generisati nadrealistični sadržaj sa dubinom i složenošću“ rekao je Džu Đun, zamenik direktora Instituta za veštačku inteligenciju Univerziteta Tsinghua.

Džu je dodao da za različite žanrove poput naučne fantastike, romantike i animacije, Vidu može proizvesti scene koje hvataju suštinu svakog stila i može stvoriti visokokvalitetne kinematografske efekte, kao što su dim i refleksije sočiva.

AI model može upravljati raznim tipovima kadrova, uključujući široke kadrove, bliske kadrove i srednje kadrove i može bez napora proizvesti efekte kao što su dugi kadrovi, promene fokusa i glatki prelazi scena.

Korisnici mogu učitati portrete ili prilagođene slike likova i koristiti tekstualne opise da bi usmerili likove da izvode bilo koju radnju u bilo kojoj sceni. Ova funkcija pojednostavljuje proces produkcije videa i poboljšava kreativnu slobodu.

Kompanija je saopštila da je osnovna arhitektura Vidua predložena još 2022. godine.

(Beta)

Pratite Krstaricu na www.krstarica.com