AI asistenti bi konačno mogli učiniti Siri i Aleksu zaista korisnim
Kada je 2016. novoimenovani izvršni direktor Gugla Sundar Pičai predstavio Gugl Asistenta kao deo svoje nove strategije „AI na prvom mestu“, promovisao ga je kao alat za pomoć ljudima u obavljanju zadataka.
„Gugl Asistent omogućava vam da obavite stvari, donoseći vam potrebne informacije, kada su vam potrebne, gde god da se nalazite“, napisao je tada u blog postu.
Bio je to ambiciozan cilj koji, uglavnom, nije ostvaren. Softver se prečesto zbuni na zahtev korisnika, prebacujući se na pretragu interneta i izvinjavajući se što ne može da pomogne. To je dovelo do toga da korisnici ograniče upotrebu glasovnih asistenata na jednostavne zadatke poput postavljanja tajmera za kuvanje, puštanja muzike ili kontrolisanja osvetljenja. Amazonova Aleksa, predstavljena pre 10 godina, nije prošla mnogo bolje. Siri, najstariji od njih, koji je Epl lansirao 2011. godine, najviše je kritikovan.
Asistenti i napredak tehnologije
Međutim, kako je generativna AI tehnologija postala široko rasprostranjena u poslednje dve godine, otvorila je vrata za AI „agente“. To je softver posebno programiran da preduzima radnje ili obavlja zadatke u ime korisnika. Poput rezervisanja stola u restoranu ili kupovine na internetu. Kako „era agenata“, kako je Pičai naziva, stiže 2025. godine, ova tehnologija ima priliku da učini nešto što do sada nije uspelo velikim tehnološkim platformama. Da glasovni asistenti budu zaista korisni.
To znači da bi Gugl Asistent, Aleksa i Siri konačno mogli ispuniti obećanje da će funkcionisati kao lični asistenti. Umesto da samo izlistava vaš dnevni raspored, kao što GA trenutno može, mogao bi zapravo zakazivati sastanke, kontaktirati ljude i pronalaziti vreme koje odgovara obema stranama. Mogao bi rezervisati letove i hotele za odmor, poput digitalnog turističkog agenta. Sa malo više informacija osim datuma i destinacije putovanja.
Agenti su trenutno u centru pažnje tehnološke industrije, sa više od 470 platformi posvećenih ovoj tehnologiji, prema istraživanju Forestera. To uključuje velike tehnološke gigante, kao i manje startape poput LangChain, CrewAI i Play.ai. Osim potrošačkih funkcija, oni takođe imaju potencijal da transformišu poslovanje, sa agentima za korisničku podršku ili razvoj softvera. Broj poslova povezanih sa startapima AI agenata porastao je više od 81% tokom protekle godine, prema PitchBook-u. U ovu oblast uloženo je više od osam milijardi dolara.
Trka je počela
„Trka je počela“, rekao je Stiv Džang, investitor s liste Forbes Midas i osnivač firme Kindred Ventures. „Startapi će se takmičiti s etabliranim platformama ko može da orkestrira ovo sa mnogo većom preciznošću. I ko može stvoriti mnogo ljudskije i realističnije glasove i razgovore. Kao i pristupiti podacima i radnjama koje svi želimo“.
Veliki tehnološki glasovni asistenti najbolje su pozicionirani za ovakav skok u AI tehnologiji. Gugl ima svoj vodeći model Gemini za poboljšanje glasovnih pretraga. Epl je ranije ove godine najavio partnerstvo s OpenAI za korišćenje ČetGPT-a za pokretanje nekih Siri upita. Tokom prošle godine, Amazon je uložio osam milijardi dolara u Antropik, koji razvija moćni Klod četbot. Gugl je odbio da obezbedi svoje rukovodioce za intervjue. Epl i Amazon nisu odgovorili na zahteve za intervju.
Džang smatra da će prave inovacije biti napravljene u modelima glasovne AI. Za razliku od velikih jezičkih modela, koji stoje iza usluga poput ČetGPT-a, glasovni modeli nisu obučeni na tekstu koji softver potom čita naglas. Umesto toga, glasovni modeli se obučavaju na stvarnim glasovnim snimcima. Mogu da prepoznaju suptilnosti u govoru, poput kadence ili emocionalnih nagoveštaja. Džang je investirao u Play.ai, koji se specijalizuje za glasovne agente. Takmiči se s kompanijama poput ElevenLabs, OpenAI i Gugla, koje sve rade na modelima glasovne AI.
Skeptici
Neki, međutim, nisu uvereni da će AI agenti pomoći da se značajno unaprede veliki glasovni asistenti. Kanđun Kju, osnivačica Imbue, koji razvija agente za kodiranje softvera, smatra da će dodavanje više AI ovim proizvodima samo „inkrementalno“ poboljšati njihovu upotrebu. Ona kaže da nove AI funkcije neće biti dovoljno velike promene da bi ljudi stekli poverenje u njih. „Delegiranje kao koncept je zapravo veoma teško za ljude“, rekla je Kju. „Siri koristim samo za trivijalne stvari za koje znam da neće pogrešiti“.
Međutim, ona veruje da će nedavna poboljšanja u glasovnoj AI, pomoći korisnicima na druge načine. Na primer, predviđa da će se više aplikacija integrisati s glasovnim funkcijama. Sa poboljšanim kašnjenjem i razumevanjem prirodnog jezika, moći ćete da date aplikaciji instrukcije i ona će izvršiti tu radnju. Poput instrukcija aplikaciji za e-trgovinu da želite da vratite par cipela koji vam ne odgovara.
Napredak u AI i glasovnoj tehnologiji takođe bi mogao otključati hardverske ambicije koje Silicijumska dolina pokušava da ostvari godinama. Pre više od decenije, Gugl je neslavno pao kada je predstavio Google Glass, pametne naočare koje su izazvale strahove za privatnost i nisu bile previše korisne. Ranije ovog meseca, kompanija je predstavila novi prototip naočara koje će se koristiti s Project Astra, novom platformom za AI agente. U demonstraciji, naočare, koje se kontrolišu glasom, automatski su prikazale šifru za vrata, koju su „povukle“ iz korisnikovog imejla, u trenutku čim je pogledao tastaturu za unos. Tehnologija bi takođe mogla da prikaže informacije o ruti autobusa ispred njega ili o skulpturi koju je upravo prošao.
Šta vole mladi
U međuvremenu, Fejsbukove Orion naočare, najavljene ranije ove godine, koriste kombinaciju glasovnih i gestova rukama za kontrolu AI alata. Poput prepoznavanja sastojaka u vašoj kuhinji i pronalaženja recepta koji ih koristi.
Inovacije bazirane na glasu takođe čine tehnologiju pristupačnijom. Ne mogu svi da čitaju, pišu ili kucaju, ali veći broj ljudi može da govori, rekao je Džang. Takođe, to je sve popularniji izbor među mladima: 42% mladih od 18 do 29 godina u SAD šalje glasovne poruke u svojim aplikacijama za dopisivanje najmanje jednom nedeljno, prema istraživanju YouGov-a i Vox-a.
Nova dostignuća u AI mogla bi učiniti glasovne alate još šire korišćenim i promeniti način na koji ljudi imaju interakcije sa tehnologijom. „To čini glasovne agente, i sam glas, odličnim novim korisničkim interfejsom koji do sada nije bio dovoljno iskorišćen u računarstvu“, rekao je Džang.
Ričard Nieva, novinar Forbes