Da li je pojava DeepSeek modela poziv za buđenje Silicijumske doline

Inovacije Forbes 29. jan 2025. 07:00
featured image

DeepSeek tvrdi da je njegov najnoviji AI model jednako dobar kao modeli američkih rivala. Jeftiniji za izgradnju i dostupan besplatno. Šta to znači za američku dominaciju u oblasti veštačke inteligencije?

29. jan 2025. 07:00

Kineska kompanija DeepSeek, koja je nedavno objavila otvoreni kod za veliki jezički model za koji tvrdi da je na nivou najnaprednijih AI sistema kompanije OpenAI, trenutno je u središtu pažnje AI zajednice. Njena tehnologija hvaljena je kao jedan od najboljih otvorenih izazivača vodećim američkim AI modelima. To podstiče zabrinutost zbog kineske snage u sve intenzivnijoj međunarodnoj trci za dominaciju u oblasti AI-a. I tera američke startape da preispitaju svoj rad nakon što je strani rival postigao mnogo sa značajno manje resursa.

Krajem decembra, mala kineska laboratorija iz Hangdžoua lansirala je V3, jezički model sa 671 milijardom parametara. Navodno je treniran dva meseca za samo 5,58 miliona dolara. To je trošak daleko manji od OpenAI GPT-4, većeg modela sa procenjenih 1,8 biliona parametara, izgrađenog uz cenu od 100 miliona dolara. Prošle nedelje, DeepSeek je podigao ulog objavljivanjem modela pod nazivom R-1, za koji tvrdi da je rival OpenAI o1 modelu u „zadacima zaključivanja“, poput kodiranja i rešavanja složenih matematičkih i naučnih problema. OpenAI naplaćuje korisnicima 200 dolara mesečno za takve modele. DeepSeek svoj nudi besplatno.

Preispitivanje cena

Snaga DeepSeek modela i njegova cena već menjaju način na koji američki AI startapi vode svoje poslovanje. To je jeftina i privlačna alternativa ponudama etabliranih igrača poput OpenAI-a, izjavio je Džesi Džang, direktor Decagona, kompanije koja razvija AI agente za korisničku podršku, za Forbes. Novi model kompanije DeepSeek verovatno će naterati američke AI gigante poput OpenAI i Anthropica da preispitaju svoje cene.

Eiso Kant, CTO i suosnivač Poolside AI, jednoroga koji razvija AI za softversko inženjerstvo, rekao je za Forbes da je snaga DeepSeek-a u sposobnosti inženjeringa da postigne više sa manje resursa.

„Ono što DeepSeek pokazuje svetu jeste da, kada se snažno fokusirate na efikasnost računarske obrade tokom obuke, možete postići mnogo“, rekao je on. „Neverovatne stvari se još uvek mogu izvući iz ovih Envidija čipova kako bi bili neverovatno efikasniji“.

S obzirom na to da je OpenAI o1 model navodno nadmašen u određenim merilima, neki startapi su već počeli da prikupljaju podatke za obuku naprednijih sistema, rekao je Manu Šarma, izvršni direktor kompanije za podatke Labelbox, za Forbes. „Mislim da je trka za AGI na neki način resetovana“, rekao je on. „Videćemo mnogo veću konkurenciju na svim nivoima“.

Za i protiv

Aleksandar Vang, milijarder i direktor giganta za obuku podataka Scale AI, nedavno je ovaj model nazvao „revolucionarnim“. Aravind Šrinivas, direktor AI pretraživača Perplexity vrednog devet milijardi dolara, integrisao je model u svoj glavni pretraživački proizvod. AI kompanija za čipove Groq već je dodala DeepSeek R1 model u svoje jezičke procesorske jedinice. (U junu je Forbes poslao Perplexity-u nalog za prekid korišćenja podataka nakon optužbi da je koristio informacije bez dozvole.)

Drugi nisu toliko impresionirani. Mej Habib, direktorka kompanije Writer, izjavila je za Forbes da nije iznenađena što su DeepSeek-ovi modeli, trenirani sa značajno manjim budžetom, uspeli da dostignu najinteligentnije američke modele. U oktobru je Writer lansirao model koji je treniran sa samo 700.000 dolara uloženih u GPU-ove. Dok je OpenAI za izgradnju GPT-4, modela sličnih sposobnosti, navodno potrošio 100 miliona dolara. Writer je koristio sintetičke podatke kako bi smanjio troškove obuke.

„Čak i pre nego što je DeepSeekv model postao popularan, govorili smo da ovi modeli postaju roba. Postaju sve dostupniji“, rekla je Habib.

DeepSeek
REUTERS/Violeta Santos Moura/Illustration

Uzbuna među gigantima

Tokom vikenda, dok je interesovanje za kompaniju raslo, DeepSeek je prestigao ČetGPT na Eplovoj prodavnici aplikacija, zauzevši prvo mesto među besplatnim aplikacijama u SAD. Zatim, u ponedeljak, više američkih tehnoloških akcija je naglo palo usled panike izazvane uspešnim lansiranjem DeepSeek modela. Do kraja dana, tržišna vrednost AI giganta Envidije smanjena je za skoro 600 milijardi dolara.

Bio je to zapanjujući preokret u poretku AI sveta. „Prilično je neverovatno da neko uloži stotine miliona dolara u zatvoreni model,“ rekao je Greg Kamrad, predsednik neprofitne organizacije ARC Prize, koja vrši upoređivanje AI modela, za Forbes. „I onda odjednom imate otvoreni model koji je besplatno dostupan“.

Već nedeljama DeepSeeke modele hvale neka od najistaknutijih imena u AI industriji, uključujući glavnog AI naučnika Mete Jana Lekuna, suosnivača OpenAI-a Andreja Karpatija i višeg istraživača Envidije Džima Fana. Međutim, vest o najnovijem uspehu kompanije izazvala je uzbunu među američkim AI gigantima koji pokušavaju da shvate kako kineska kompanija postiže tako impresivne rezultate uz mnogo manja ulaganja.

Velika promena

„DeepSeek R1 je Sputnjik trenutak za AI“, napisao je milijarder i investitor Mark Andresen na platformi X.

Uprkos pompi i buci oko nedavnih AI inicijativa administracije Donalda Trampa, DeepSeek je pojačao strahove da SAD gube prednost u oblasti AI. Posebno zato što je kompanija postigla ovakav uspeh uprkos strogim američkim izvoznim kontrolama. One joj onemogućavaju korišćenje najnaprednijih Envidija AI čipova. Najnovije dostignuće kompanije predstavlja ozbiljnu kontratežu projektu Stargate. To je zajednički poduhvat OpenAI, Orakla i japanskog tehnološkog konglomerata Softbank. Plan je da se uloži 500 milijardi dolara u AI infrastrukturu.

Uoči sastanka sa republikancima u Floridi u ponedeljak, Tramp je priznao pretnju. „Lansiranje DeepSeek-a trebalo bi da bude signal upozorenja za naše industrije da moramo biti laserski fokusirani na konkurenciju i pobedu“, rekao je.

Ograničenja DeepSeek-a

Ipak, postoje ograničenja u vezi sa najnovijim uspehom DeepSeek-a. Istraživači su otkrili da njegovi AI modeli imaju tendenciju samocenzure kada je reč o temama koje su osetljive za Komunističku partiju Kine (KPK). Bezbednosna istraživačica Džejn Mančun Vong rekla je za Forbes da DeepSeek modeli ne odgovaraju na pitanja o kineskom predsedniku Si Đinpingu i protestima na Trgu Tjenanmen 1989. godine. Pored toga, postoje i zabrinutosti u vezi sa privatnošću. Podaci uneti u DeepSeek modele čuvaju se na serverima u Kini, prema njegovim politikama.

Divjanš Kaušik, potpredsednik firme za nacionalnu bezbednost Beacon Global Strategies, upozorio je za Forbes da ljudi ne koriste DeepSeek bez temeljne provere. „Dok ne budemo imali jasne procene o nacionalnoj bezbednosti i slobodi govora kineskih modela, treba ih tretirati kao propagandne instrumente KPK“, rekao je on. „Treba ih tretirati kao Huavei na steroidima“,

Problem je u vrednosti koju DeepSeek nudi. Najnapredniji AI model koji je besplatan za korišćenje u svetu zatvorenih i komercijalnih AI modela koje razvijaju kompanije poput OpenAI i Antropika. „Mnogo je bolje imati kineski otvoreni model nego američki zatvoreni“, rekao je Šarma iz Labelbox-a.

Raši Šrivastava, novinarka Forbes
Ričard Nieva, novinar Forbes