Vest
Stručnjaci za zvuk: Snimak Damira Zobenice gotovo sigurno autentičan
29.11.2024. Stefan Kosanović 021.rs
Audio-snimak na kom se navodno čuje potpredsednik Skupštine Vojvodine Damir Zobenica kako instruira pristalice Srpske napredne stranke da izazivaju incidente tokom petnaestominutnih blokada, objavila je juče potpredsednica Stranke slobode i pravde Marinika Tepić. Samo nekoliko sati kasnije, predsednik Srbije Aleksandar Vučić izjavio je da mu je neko porukom rekao da je snimak njegovog glasa rezultat veštačke inteligencije. Međutim, nekoliko stručnjaka za zvuk za Raskrikavanje tvrde da je to gotovo nemoguće. Tako jedan od njih, Dejan Tomka, tvrdi da je izvesno da je Zobenicin glas autentičan, pošto se na snimku jasno čuju finese govora koje trenutno modeli veštačke inteligencije ne mogu precizno da reprodukuju. Takođe, dodao je da Zobenica nema dovoljno veliku bazu javno dostupnih snimaka koja bi omogućila softveru da generiše govor tako uverljivo. Dva profesora sa Univerziteta u Novom Sadu takođe navode da trenutno ne postoji program pomoću kojega je ovo moguće izvesti toliko kvalitetno na srpskom jeziku.
Na snimku koji je Tepić podelila, tvrdeći da je to glas Damir Zobenice, čuje se kako on govori da se radi o „zadatku od velike važnosti”, koji uključuje vređanje pripadnika i pristalica opozicije, uz obavezno snimanje tih scena. Prema objavljenom materijalu, te snimke bi trebali da urade ljudi „koji nisu prepoznatljivi, koji nisu funkcioneri”, a snimci bi potom bili prosleđeni Zobenici, koji bi ih dalje slao medijima.
„Dakle, nemamo mnogo vremena do sutra do 11 mora da bude organizovano da kada budu blokade odradimo posao kako treba, dakle vređanje opozicije, pobuna zašto se blokira, vređajući opoziciju i sve ostalo, od Bjelogrlića do ne znam kog, snimanje svega toga, dakle, neko da vređa, neko da snima ili onaj koji vređa neka i snima i šalje meni snimak”, čuje se kako žustro u jednom delu snimka priča Zobenica.
Audio-snimak koji je objavila Tepić vrlo brzo je postao viralan, a istog dana na njega je reagovao i predsednik Srbije Aleksandar Vučić, koji je gostovao u Nacionalnom dnevniku na TV Pink.
„Ja nisam hteo ni da ga pitam. Evo, poslao mi je neko poruku da je to veštačka inteligencija, ne znam šta. Baš me briga”, odgovorio je Vučić.
Predsedniku se pridružio i portal Republika, koji je sinoć objavio prilično vulgaran, veštački generisan, audio-snimak predsednika SSP Dragana Đilasa.
„Naglašavamo da je ovaj snimak sa Đilasom u glavnoj ulozi lažan, poput snimka Zobenice koji je objavila Marinika Tepić, u cilju obmanjivanja javnosti”, istaknuto je u tekstu Republike.
Međutim, glas sa ovog snimka liči na Đilasov, ali njegova dinamika govora je drugačija – podseća na „dipfejk” video Dragana Đilasa koji je TV Pink emitovao prošle godine.
021.rs
Inženjer zvuka Dejan Tomka za Raskrikavanje kaže da svi modeli veštačke inteligencije rade tako što se nahrane sa jako mnogo materijala koji je analiziran i od kog se potom pravi model koji kreira glas. Da bi do savršenog modela došlo potrebno je mnogo vremena, znanja i novca, kao i da osoba čiji se glas kopira mnogo sati provede pred mikrofonom.
Tomka kaže da čak i savršeniji programi, koji su na engleskom jeziku, nemaju neke razgovorne odlike govora poput poštapalica, tempa ili greški u govoru: „Nije moguće iz toliko malog uzorka glasa Zobenice da se napravi model koji zvuči tako autentično i da tako fluidno menja glasnoću i emocije”.
Tomka objašnjava da sa dostupnim alatima kreiranje ovakvog glasa nije moguće.
„Nikada ne može da se kaže apsolutno 100% sigurno, ali da bi neko napravio da to tako zvuči, kako zvuči sada Zobenica, to bi moralo da bude specifično naprevljena custom-made tehnologija koja je razvijena mesecima i mesecima ili godinama u prošlosti da bi došlo dotle da toliko autentično zvuči njegov glas”, objašnjava Tomka.
Za Raskrikavanje su snimak analizirali i dvojica profesora sa Univerziteta u Novom Sadu – sa Akademija umetnosti i Fakulteta tehničkih nauka – koji ipak nisu hteli da budu potpisani.
Oni su se u profesionalnoj karijeri bavili i eksperimentima sa veštačkom inteligencijom (AI). Prema njihovim rečima, AI je sposoban da kreira veoma sofisticirane jezičke modele, međutim, to ovde nije slučaj, pošto Zobenica priča na srpskom jeziku. „Nema podrške za srpski jezik voice clone pomoću koga je ovo moguće izvesti”, pojasnili su za Raskrikavanje profesori.
S druge strane, inženjer zvuka Dejan Tomka je pogledao i AI-snimak Đilasa sa portala Republika i napominje da je upravo on dobar primer kako jedan lažan snimak izgleda. „On govori ravno i intonacija je skoro identična, kao i ritam govora. Zvuči bezvoljno i hladno – veštački (...) Đilas nijednom ne udahne, ne čuje se disanje tokom govora”.
Republika
Četiri nedelje i pauza od 15 minuta
Danas je tačno četiri nedelje od pada nadstrešnice na železničkoj stanici u Novom Sadu, koja je usmrtila 15, a teško ranila dve osobe. Od tada su održani brojni protesti sa zahtevima za kažnjavanje odgovornih.
Iz okupljanja u okupljanje, primećeno je da se grupe muškaraca, uglavnom u crnom, u kapuljačama i pod maskama okupljaju, provociraju i vređaju učesnike protesta koji uglavnom blokiraju saobraćaj.
Neki od njih, međutim, nisu skrivali identitet, a korisnici interneta već danima otkrivaju ko su oni – većinom lokalni funkcioneri SNS-a, poput poverenika opštinskog odbora SNS Rakovica Dejana Panovića, predsednika opštine Zemun Gavrila Kovačevića i predsednika opštine Čukarica Nikole Aritonovića.
I danas je oranizovana akcija u kojoj su građani Novog Sada, ali i ostalih mesta u Srbiji, gde god da su se nalazili, stali na 15 minuta u čast stradalih. Kako javlja portal 021, kao i tokom prethodnih mirnih akcija i danas su zabeležene brojne provokacije.