Sadržaj[Sakrij][Prikaži]
The 23. Google I/O bilo prilično uzbudljivo! U području umjetne inteligencije predstavili su nekoliko važnih napredaka.
Konkurencija između OpenAI-jevog GPT-4 i Google-ovog Gemini-a bila je jedno od najznačajnijih otkrića. Nakon njihovog postojanja DLAN 2 Gemini je model velikog jezika (LLM) sljedeće generacije.
Google je poboljšao model mašinskog učenja, čineći ga još sofisticiranijim. Kako bi se takmičili s Microsoftovim poboljšanjima Binga, oni također dodaju generativne AI mogućnosti u Android i pojačavaju Google pretraživanje pomoću AI.
Kako bi Google Bard bio konkurentniji s drugima chat botovi poput ChatGPT, najavili su značajno poboljšanje za njega tokom događaja. Bard će na kraju podržavati još 40 jezika, uključujući korejski i japanski. Sa ovim proširenjem, Bard će moći podržati programere bilo gdje.
Osim toga, kako bi poboljšao svoje odgovore na zahtjeve korisnika, Bard će sada nuditi slike, mape i druge grafike. Za sve programere, to će biti od ogromne pomoći. Ovdje ćemo ispitati specifičnosti LLM Gemini.
Šta su Blizanci?
Prema Google, Gemini je od temelja zamišljen da bude multimodalan, vrlo efikasan u smislu povezivanja alata i API-ja, te spreman za buduća unapređenja kao što su memorija i planiranje. Google je u svom blog postu naveo da Gemini već ima izvanredne multimodalne mogućnosti koje prethodni modeli nisu imali.
“Kada fino podesimo i temeljno testiramo Gemini za sigurnost, ponudit ćemo ga u različitim veličinama i mogućnostima, slično kao PaLM 2”, rekao je Google.
Kao rezultat toga, može se implementirati na više proizvoda, aplikacija i uređaja kako bi koristio svima.”
Na konferenciji su predstavili PaLM 2, najsavremeniji jezički model sa proširenim višejezičnim mogućnostima, mogućnostima zaključivanja i kodiranja. Bio je opsežno obučen sa višejezičnim materijalom sa preko 100 jezika.
PaLM 2 može proizvesti i prevesti suptilne sadržaje kao što su idiomi, poezija i zagonetke na različite jezike.
Gemini će vjerovatno pojačati Googleove napore AI i izazvati pionira, OpenAI ChatGPT. Dok se ChatGPT uglavnom koristi za tekstualne razgovore, Gemini je multimodalan, što znači da može odgovoriti i na tekst i na vizuale. Jednom kada se integriše u Google pretragu, ima potencijal da transformiše način na koji potrošači komuniciraju sa popularnim pretraživačem.
Iako daljnji detalji o Gemini-ju još nisu dostupni, on može nadmašiti ChatGPT i Bing AI, što će Google dovesti na čelo AI polja.
Sundar Pichai, izvršni direktor Google-a, primijetio je tokom konferencije: “Nakon sedam godina postojanja kompanije koja je prva u svijetu umjetne inteligencije, nalazimo se na uzbudljivoj prekretnici.”
Blizanci sada prolaze obuku, kaže Pichai, a kreira se multimodalnim pristupom s ciljem da bude izuzetno efikasan i otvori vrata za buduće napretke poput pamćenja i planiranja. Gemini već pokazuje izvanredne multimodalne sposobnosti koje su bile odsutne u ranijim verzijama, prema Pichaiju, čak i ako je još u ranim fazama.
Google daje upute Gemini putem svojih TPU (čipova). Pichai je izjavio da će nakon što Gemini bude optimiziran i prođe sigurnosne inspekcije, biti dostupan u različitim veličinama i kapacitetima, iako nije naveden konkretan datum objavljivanja.
Pichai je jasno stavio do znanja da će svi Googleovi AI modeli uključiti vodeni žig i metapodatke u izlaze, kao što su slike, kako bi se spriječilo širenje netačnih informacija.
Šta čini Blizancima superiornim Chat GPT i BingAI?
Blizanci imaju nekoliko intrigantnih „multimodalnih“ karakteristika. Gemini, za razliku od ChatGPT-a, koji može samo čitati i proizvoditi tekst, zasnovan je na multimodalnoj paradigmi i može razumjeti i proizvesti tekst, kod i slike.
Ova šira raznolikost vještina omogućava brojne mogućnosti. Gemini se, na primjer, može koristiti za stvaranje nove klase AI chat robota koji mogu razumjeti i reagirati na tekst i vizuale.
Međutim, i ChatGPT i Bing pružaju samo komunikaciju zasnovanu na tekstu, pri čemu Bing pruža zasebnu vezu za kreiranje slika, ali nema podršku za slike u ćaskanju.
Blizanci mogu da obrađuju širi spektar proizvoda i aplikacija za razliku od ChatGPT-a. Može se koristiti, na primjer, za nadogradnju Google pretraživanja ili kreiranje vrhunskog virtuelnog asistenta koji koristi AI. Ove karakteristike nedostaju u BingAI i ChatGPT. ChatGPT, međutim, pruža dodatke koji poboljšavaju rezultate.
Gemini takođe poseduje karakteristike poput memorije i planiranja, omogućavajući razvoj aplikacija sa veštačkom inteligencijom koje prevazilaze ono za šta je ChatGPT sposoban.
Uzbudljive mogućnosti se pojavljuju kada razmislite o tome da imate ličnog asistenta kojeg pokreće Gemini koji prati vaše želje i pomaže u svakodnevnom planiranju. Međutim, da bismo vidjeli puni potencijal Blizanaca i istražili mogućnosti koje otvara, prvo moramo nestrpljivo čekati njegovo javno objavljivanje.
zaključak
Gemini, Googleov jezički model sljedeće generacije, pokazao je izvanredne multimodalne karakteristike, čineći ga prilagodljivijim od ChatGPT-a, njegovog rivala samo za tekst.
Gemini stvara nove mogućnosti za chat botove i AI aplikacije omogućavajući im da čitaju i proizvode tekst, kod i grafiku. Ove aplikacije sada mogu upravljati većim rasponom aktivnosti. Za razliku od Geminija, koji podržava i slike i multimodalne interakcije, ChatGPT i BingAI su sposobni samo za interakcije zasnovane na tekstu.
Iako konkretnije informacije u vezi Geminija još nisu objavljene u javnosti, jasno je da je Google posvećen unapređenju AI tehnologije i održavanju vodstva u ovoj oblasti.
Očekujemo da ćemo vidjeti puni potencijal Blizanaca i kreativne mogućnosti koje otvara dok uzbuđeno iščekujemo njegovo formalno lansiranje.
Ostavite odgovor