AI platforma oživljava antički Rim i Grčku koristeći naučne izvore

Izgleda kao fotografija stara više od 2.000 godina. Da su tada postojale kamere. Na slici su trojica muškaraca izbrazdanih lica koji se naginju nad improvizovanim stolom u vojnom logoru, igrajući, kako se čini, jednostavnu igru sa kamenčićima ili kockicama. Odeveni su u rimsku odeću. Dvojica nose kožnu ili metalnu pancirnu opremu preko tunike, dok treći ima crveni vuneni plašt koji su u doba Republike i ranog Carstva obično nosili rimski vojnici i oficiri.
Zasluge za ovu živopisnu scenu iz davnina pripadaju projektu Re-Experiencing History, novom AI generatoru slika koji prikazuje prizore iz antičkog Rima i Grčke na osnovu naučnih izvora.
„Ovaj projekat suštinski menja način na koji doživljavamo i prenosimo istoriju“, navodi se u opisu interaktivne platforme. „Umesto pukih rekonstrukcija iz knjiga ili filmova, nudimo alat pomoću kog svako može sam da vizualizuje istorijske prizore“.
Alat ne proizvodi savršene rekonstrukcije
Feliks K. Majer, profesor antičke istorije na Univerzitetu u Cirihu, udružio se sa Filipom Štrobelom, stručnjakom za AI na istom univerzitetu, kako bi stvorili ovaj alat. Njihova vizija je da on bude dragocen za nastavnike, istraživače, dokumentariste i muzeje. Ovo je alat koji ne proizvodi savršene rekonstrukcije niti apsolutne istine, već vizuelne hipoteze koje podstiču dublje razumevanje istorije.
„Ne možemo oživeti rimski trijumf ili grčki festival. Međutim, njihovim vizuelnim modelovanjem pokrećemo dijalog između dokaza i mašte“, rekli su Majer i Štrobel u zajedničkom pisanom odgovoru na pitanja novinara.
„Taj proces nas podseća na praznine, neizvesnosti i pristrasnosti — a svest o njima sama po sebi predstavlja oblik znanja“.

Kako je treniran generator slika?
Kako bi obučili sistem, tim je postojećim AI generatorima slika dao pažljivo odabran skup od gotovo 300 slika i opisa. To uključuje i ilustracije iz naučnih knjiga o rimskoj odeći, oružju i arhitekturi, kao i anotirane materijale o rimskim trijumfalnim procesijama.
„Propuštanjem tog materijala kroz modele pomogli smo im da uoče detalje koje obično zanemaruju. Osim toga, izbegli su se generički klišei u stilu ‘antičkog izgleda’“, objašnjavaju autori.
Zatim su zadali sistemu da dodatno obogati svaki prompt tako što će iz posebno sastavljene baze podataka preuzeti istorijski relevantne informacije. Baza se sastoji od oko 70 naučnih članaka i knjiga o rimskoj kulturi.
„Umesto širokih ili neodređenih instrukcija, precizno formulisani promptovi su jasno opisivali konkretne detalje o odeći, ritualnim radnjama ili okruženju. To je generisane slike učinilo znatno specifičnijima i istorijski uveljivijima“, rekli su Majer i Štrobel.
Koliko modeli nagađaju?
Primeri vizuala koji prikazuju mogućnosti ovog generatora slika uključuju prizor pljačke Rima od strane Vizigota 410. godine n. e, kao i scenu sa dvema mladim ženama sa vencima u kosi koje idu na verski festival. U video-kolažu „najboljih trenutaka“, napravljenom pomoću OpenAI DALL·E 3 i posebno prilagođene verzije Flux Dev modela, smenjuju se prizori sunčanih pijaca na otvorenom, redova vojnika u oklopu koji stoje u stavu mirno, osiromašenih građana na ulicama i vladara koji iz kočija pozdravlja narod.

Za događaje sa obiljem arheoloških dokaza rezultati mogu biti „impresivno bliski“ onome što je poznato iz tekstova i arheologije.
„Kočije iz procesija, lovorovi venci i zbijena arhitektura Foruma pojavljuju se sa prepoznatljivom verodostojnošću“, objašnjavaju oni. Međutim, kada pokušaju da generišu slike scena za koje postoji manje dostupne dokumentacije — poput Luperkalija, pastirskog festivala u antičkom Rimu — „modeli neminovno skliznu u nagađanje“.
Pametni telefoni u antičkom Rimu?
Tu je i problem izobličenja slike. Neki od vizuala iz projekta Re-Experiencing History imaju karakterističan „AI sjaj“, kao i uobičajene greške, poput delova tela koji se delimično gube ili ponovo pojavljuju. Eksperimenti sa platformom dali su i nekoliko naročito komičnih rezultata. Gledaoci na jednoj trijumfalnoj procesiji u Rimu držali su pametne telefone, dok je rimski besednik Ciceron, obraćajući se Senatu, izgledao kao da govori u mikrofon.
„Tehnologija se takođe muči sa prikazivanjem ljudi koji nose tragove starosti, fizičkog rada ili bolesti. Prečesto pribegava idealizovanim, besprekornim figurama“, istakli su istraživači.
Majer i Štrobel priznaju opravdanost široko rasprostranjene zabrinutosti zbog pristrasnosti i mogućih zloupotreba veštačke inteligencije. Autori su se, takođe, suočili s kritikama koje odražavaju širi strah u vezi s razvojem AI tehnologije. Jedan od tih strahova jeste mogućnost da bi sistem poput njihovog mogao oslabiti ljudsku maštu. Oni, međutim, veruju u suprotno i smatraju da se rasprava o veštačkoj inteligenciji ne bi smela svoditi samo na rizike, već i na mogućnosti.
„Pružajući vizualizacije koje teže verodostojnosti“, rekli su, „naša platforma ne zamenjuje maštu — ona je podstiče“.
Platforma Re-Experiencing History trenutno je dostupna samo korisnicima koji imaju imejl adresu Univerziteta u Cirihu. Svi ostali ipak mogu da se registruju i biće obavešteni kada alat postane dostupan široj javnosti.
Lesli Kac, saradnica Forbes