„Drži svoje šape dalje od mog glasa“: Glasovni glumci zabrinuti zbog AI

Inovacije Forbes 5. nov 2023. 10:50 > 13. nov 2023. 15:01
featured image

Produkcijske kuće i obožavaoci sve se više oslanjaju na generativne AI alate, kako bi naterali glasovne glumce da izgovore stvari koje nikada nisu rekli – a njihovi poslovi su ugroženi

5. nov 2023. 10:50 > 13. nov 2023. 15:01

Glasovna glumica Alegra Klark (Allegra Clark) je listala TikTok, kada je naišla na video na kome se pojavljuje Beidu (Beidou), šašavi kapetan broda iz video igrice Genšin Impekt (Genshin Impact) kome je ona pozajmila glas.

Međutim, Beidu je učestvovala u seksualno sugestivnoj sceni i izgovarala je stvari koje Klark nikada nije snimila, iako je grubi glas zvučao baš kao njen. Kreator videa je uzeo Alegrin glas i klonirao ga koristeći generativni AI alat pod nazivom Ileven Labs (ElevenLabs), a odatle su je naterali da kaže šta god su želeli.

Klark, koja je glumila više od 100 likova iz video igara i u desetinama reklama, rekla je da je video protumačila kao šalu, ali da je zabrinuta da bi njen klijent mogao da ga vidi i pomisli da je u tome učestvovala – što bi moglo da bude kršenje njenog ugovora, rekla je ona.

„Ne samo da nas ovo može dovesti u velike probleme, ako ljudi misle da smo rekli (ove stvari), već je, iskreno, uvredljivo čuti sebe kako govorite, kada to zapravo niste vi”, napisala je u mejlu Ileven Labsu, koji je pregledao Forbes.

Zamolila je startap da ukloni postavljeni audio snimak i spreči buduće kloniranje njenog glasa, ali je kompanija rekla da nije utvrdila da je snimak napravljen pomoću njene tehnologije. Rekli su da će preduzeti trenutne mere samo ako je klip „govor mržnje ili klevetnički” i naveli su da nisu odgovorni za bilo koje kršenje autorskih prava. Kompanija se nikada nije javila, niti je preduzela bilo kakvu akciju.

„Loše je što nemamo lično vlasništvo nad svojim glasovima. Sve što možemo da uradimo je da malo pogledamo situaciju“, rekla je Klark za Forbes.

U odgovoru na pitanja o iskustvu Alegre Klark, suosnivač i izvršni direktor Ileven Labsa, Mati Staniševski (Mati Staniszewski) je u mejlu za Forbes izjavio da je njegovim korisnicima potrebna „eksplicitna saglasnost” osobe čiji glas kloniraju, ako bi kreirani sadržaj mogao da bude „štetan ili klevetnički”.

Nekoliko meseci nakon Alegrinog iskustva, kompanija je lansirala alatku Vojs kepča (Voice Captcha) koji zahteva od ljudi da snime nasumično generisanu reč i taj glas mora da odgovara glasu koji pokušavaju da kloniraju.

Kompanija, čija se vrednost procenjuje na oko 100 miliona dolara i koju podržavaju Andrisen Horovic (Andreessen Horowitz) i suosnivač Gugl Dip Majnda (Google DeepMind) Mustafa Sulejman (Mustafa Suleyman), trenutno je jedna od najtraženijih kompanija za glasovnu veštačku inteligenciju.

Njenoj tehnologiji je potrebno samo između 30 sekundi i 10 minuta audio materijala, da bi stvorila glas koji zvuči kao, gotovo identična, replika nečijeg glasa. Zajedno sa sajtovima poput Fejk Ju (FakeYou) i Vojs AI (Voice AI), koji nude besplatnu biblioteku digitalnih glasova, kompanija je takođe u središtu uticaja generativne AI tehnologije za glumce za glas.

Ne postoji zakonska zaštita za glas kao što postoji za vaše lice ili otisak prsta

Dženifer Roberts, glasovna glumica

Intervjui sa 10 glasovnih glumaca otkrili su, ionako nesigurnu, industriju na ivici širokih promena, jer poslodavci počinju da eksperimentišu sa ovim alatima za pretvaranje teksta u govor. Jedna glasovna glumica koja je u razgovoru za Forbes istakla je da joj je poslodavac rekao da je neće angažovati da završi naraciju neke serije audio-knjiga, dan nakon što je objavio partnerstvo sa Ileven Labsom. To je navelo da se uplaši da će je zameniti AI.

Druga je rekla da joj je poslodavac saopštio da žele da koriste AI Ileven Labsa, kako bi ubrzali sesije ponovnog snimanja, što je standardni deo snimanja zvuka, za koji su glasovni glumci plaćeni. Kada je rekla svom poslodavcu da nije saglasna da se njen glas postavlja na bilo koji AI sajt, poslodavac se složio, ali je rekao da nije pozvana da uradi bilo kakve dodatne snimke.

Zajednica glasovnih glumaca prvi put je primetila porast glasova generisanih veštačkom inteligencijom, nekon što je Epl Buks (Apple Books) lansirao digitalnu naraciju audio knjiga sa skupom sopranskih i baritonskih glasova, u januaru 2023. godine, rekao je Tim Fridlender (Tim Fridlander), predsednik NAVA.

Glumci su počeli da otkrivaju hiljade audio datoteka sa poznatim glasovima koje su fanovi postavljali na različite sajtove, rekao je on. Nedavno je slavni glumac Stiven Fraj (Stephen Fry) rekao da je njegov glas uzet iz njegove naracije o knjigama Harija Potera (Harry Potter) i kloniran uz pomoć AI. U razgovoru na festivalu Kog Ex, Fraj je rekao da ga je to iskustvo „šokiralo”.

U javnoj tabeli, stotine glasovnih glumaca zatražile su da se njihovi glasovi uklone iz AI generatora glasa Uberdak (Uberduck) i Fejk ju AI. Oni su saopštili da će ukloniti glasove sa svojih sajtova ukoliko im se vlasnik glasa javi. Dok Fejk Ju i dalje nudi hiljade popularnih glasova poput Džona Sine (John cena) i Kanjea Vesta (Kanye West), koje svako može da koristi, Uberdak je u julu uklonio glasove koje su korisnici dali na svojoj platformi. Ni Uberdak, ni Fejk ju AI nisu odgovorili na višestruke zahteve za komentar.

Jedan od glumaca koji je javno zatražio da se njegov glas ukloni iz generatora za glas je Džim Kamings (Jim Cummings), glas iza likova kao što su Vini Pu i Tasmanijski đavo iz Luni Tunsa (Looney Tunes).

Rekao je za Forbes da bi pristao da korisnici koriste njegov glas samo ako on i njegova porodica dobiju nadoknadu za to. „Držite svoje šape dalje od mog glasa“, rekao je.

Pravna dilema

Kao i filmski glumci koji upozoravaju na dolazak veštačke inteligencije i kako bi ona mogla da utiče na njihove poslove, glasovni glumci na prvoj liniji tehnoloških promena. Međutim, za razliku od kreativnih oblasti, gde autori i umetnici udružuju snage u tužbama, kako bi se suprotstavili tome da se njihov rad zaštićen autorskim pravima koristi za obuku AI modela, glasovni glumci su jedinstveno ranjivi.

Iako su glasovi inherentno prepoznatiljvi, oni nisu zaštićeni kao intelektualna svojina. „Ne postoji zakonska zaštita za glas kao što postoji za vaše lice ili otisak prsta“, rekla je Dženifer Roberts, čiji glas stoji iza nekoliko likova iz video igara. „Ruke su nam vezane“.

Međutim, snimak glasa može da bude zaštićen autorskim pravima, a prema rečima Džin Hamburg (Jeanne Hamburg), advokata advokatske firme Noris MekLaflin (Norris McLaughlin), korišćenje glasa u komercijalne svrhe može da bude zaštićeno „pravom na publicitet“, što sprečava eksploataciju likova poznatih ličnosti.

To je međutim u teoriji: Većina ugovora koje potpisuju glasovni glumci ne sprečava upotrebu snimaka njihovih glasova za obuku AI sistema. Već više od jedne decenije, ugovori su govorili da producenti „imaju zauvek vlasništvo nad snimkom, u celom univerzumu, u svakoj postojećoj tehnologiji ili tehnologiji koja će biti razvijena“, rekla je Sisi Džons (Cissy Jones), glasovna glumica koja je deo osnivačkog tima Nacionalnog udruženja glasovnih glumaca (NAVA), novoformiranog sindikata.

Ti ugovori su uglavnom napisani i potpisani pre pojave AI sistema. „Glasovni glumci nisu dali informisani pristanak za buduću upotrebu audio snimaka i nisu dobili pravičnu nadoknadu za to“, kaže Skot Mortman (Scott Mortman), advokat NAVA. „Zato je značajno da se ojača zaštita u svetlu AI“.

Zato NAVA i sindikat glumaca SAG-AFTERA rade na uklanjanju odredbi iz ugovora koje omogućavaju poslodavcima da koriste glas glumaca za stvaranje „digitalne dvojnice“ ili „sinteza“ njihovog glasa putem mašinskog učenja. Organizacije su takođe razvile novi šablonski jezik za dodavanje u ugovore koji bi zaštitili glumce od gubitka prava na svoj glas.

Bezbroj zloupotreba

Kao i Klark, brojni glumci su doživeli da fanovi manipulišu njihovim glasovima koristeći generativne AI alate kako bi stvorili pornografski, rasistički ili nasilni sadržaj. Čak i kada fanovi koriste glasove veštačke inteligencije za stvaranje bezazlenih mimova ili drugih vrsta sadržaja za obožavaoce, glasovni glumci su se oglasili na društvenim mrežama, zabranjujući ljudima da fabrikuju njihove glasove.

Član NAVA Džons, čiji je glas bio deo Diznijevih emisija (Disney) i Netfliksovih dokumentaraca (Netflix), pronašla je Tiktok video zapise u kojima su fanovi koristili Uberdak da kreiraju klonove njenog glasa koji govore neprikladne stvari.

„Ne samo da moj glas govori nešto što nikada ne bih rekla, nego je taj sadržaj dostupan širom sveta“, rekla je Džons za Forbes. „Ako potencijalni kupci čuju naše glasove kako govore takve stvari, kako će to da utiče na moj budući rad?“ Nakon što im se obratila, Uberdak je uklonio njen glas sa platforme, rekla je Džons.

Glasovi generisani veštačkom inteligencijom takođe su postali novi medij za uznemiravanje. Ebi Vefer (Abbey Veffer), čiji se glas pojavljuje u igricama poput Genšin Impakt i Elder Skrols (The Elder Scrolls), rekla je da ju je oduševio neko ko je klonirao njen glas u februaru.

Osoba je napravila Tviter (Twitter) nalog sa njenom adresom kao korisničkim imenom, generisala AI klon Ebijinog glasa i zatim naterala klona da govori rasističke i nasilne stvari. Anonimni korisnik je direktno poslao snimak Ebi i zakačio ga na vrh Tviter naloga. Tvrdili su da su koristili tehnologiju kompanije Ileven Labs. Iskustvo, rekla je Vefer, bilo je „intenzivno“ i „veoma uznemirujuće“.

Međutim, kada je Vefer zabrinuto kontaktirala Ileven Labs, kompanija je rekla da klon nije kreiran pomoću njihovog softvera i da je bio deo „organizovane kampanje klevetanja“ protiv startapa, prema porukama koje je pregledao Forbes. Tri dana nakon što se Vefer obratila Tviteru, nalog je suspendovan i video je uklonjen, ali je njena kućna adresa ostala na sajtu tri meseca, rekla je ona.

Kontrolisanje načina na koji se koristi naš glas i gde se koristi je veoma važno za nas

Tim Fridlender, predsednik Nacionalnog udruženja glasovnih glumaca

Nakon što je Ileven Labs u januaru predstavio beta verziju svog AI alata za pretvaranje teksta u govor, startap je objavio da se bori sa ljudima koji zloupotrebljavaju njegovu tehnologiju. Dan kasnije, Vajses Maderbord (Vice‘s Motherboard) otkrio je da su anonimni korisnici sa Forčena (4Chan) koristili Ileven Labsov besplatni alat za kloniranje, kako bi generisali rasističke, transfobične i nasilne komentare sa glasovima poznatih ličnosti, poput Džoa Rogana (Joe Rogan) i Eme Votson (Emma Watson).

Sposobnost veštačke inteligencije da precizno oponaša ljudske glasove, takođe je stvorila prilike za prevare. FTC je ove godine izdala upozorenje da kriminalci koriste klonove AI glasova da se predstavljaju kao voljeni ljudi i ubede svoje mete da im pošalju novac. Jedan novinar je čak uspeo da koristi Ileven Labsov alat da stvori AI generisanu verziju svog glasa koja se uspešno prijavila na sopstveni bankovni račun.

Ileven Labs nije komentarisao nijedan od ovih konkretnih slučajeva, ali je izvršni direktor Staniševski naveo u mejlu: „Ako neko koristi naš alat za kloniranje glasova za koje nemaju dozvolu i krše pravila o fer korišćenju, blokiraćemo nalog i sprečićemo pravljanje novih naloga sa istim podacima“.

Osim toga, kompanija je razvila alat Vojs, kako bi se osiguralo da ljudi imaju takvu dozvolu i tvrdi da je razvila i AI klasifikator govora koji sa više od 90% tačnosti može da prepozna da li je audio snimak, koji sadrži AI, napravljen pomoću njegovih alata.

Saglasnost i kontrola

Kao odgovor na zloupotrebu, sajtovi za generisanje glasa dodaju restriktivne mere za kontrolu svojih tehnologija. Spičifaj (Speechify) ne dozvoljava ljudima da postavljaju sadržaj za kreiranje prilagođenih glasova bez aktivnog učešća osobe čiji glas žele da koriste. Slično Ileven Labsu, zahteva se jedinstveni tekst koji korisnik, ili neko ko je fizički prisutan sa njima, mora naglas da pročita sopstvenim glasom.

„Mislim da je kratkovido koristiti skraćenice i moj cilj je da vlasnici sadržaja budu ti koji kontrolišu situaciju“, rekao je osnivač Klif Vajcmen (Cliff Veitzman), koji je prvi pokrenuo Spičifaj, da pretvori svoje udžbenike u audio knjige koristeći mašinsko učenje 2012.

A na Rizembl AI-u (Resemble AI), koji reklamira poslovne klijente kao što su Netfliks i Svetsku banku (World Bank Group), ljudi mogu da kreiraju prilagođeni AI generisani glas, samo nakon što snime izjavu o saglasnosti glasom koji žele da generišu.

Osnivač i izvršni direktor Rizembla, Zohaib Ahmed rekao je da je implementacija bezbednih načina korišćenja tehnologije ključno za njegov startap, jer smatra da odgovornost za sprečavanje zloupotrebe treba da leži na prodavcima koji prave alate, a ne na krajnjim korisnicima.

Loše je što nemamo lično vlasništvo nad našim glasovima

Alegra Klark, glasovna glumica

Ove vrste verifikacionih provera, međutim, ne bave se etičkim pitanjima višeg nivoa u vezi sa saglasnošću. Glumci, na primer, zapravo nemaju kontrolu nad načinom na koji će se njihovi glasovi koristiti nakon njihove smrti.

Glasovni glumci su bili besni kada je kompanija za igrice Haj-Rez Studios (Hi-Rez Studios) dodala klauzulu koja bi im omogućila da kloniraju glas uz pomoć veštačke inteligencije, nakon što je vlasnik glasa preminuo (klauzula je uklonjena nakon pobune).

„Ako glumac umre, bolje je da ga zamenimo drugim čovekom, nego da pravimo neku veštačku predstavu, jer to nisu oni i to ih ne vraća“, rekla je Klark.

Glavna zabrinutost koja lebdi nad svim ovim je da li postoji budućnost za glasovne glumce. Pošto se poslodavci i fanovi okreću sintetizovanim glasovima, mnogi su zabrinuti kako će pronaći svoj sledeći posao ili zadržati one koje već imaju.

„Nama je veoma važno da kontrolišemo kako se naš glas navikava, gde se koristi, i koliko smo plaćeni za to korišćenje“, rekao je Fridlender iz NAVA-e.

Raši Šrivastava, novinarka Forbes