Pregled sadržaja[Sakriti][Pokazati]
Korištenje električnih romobila ističe 23. Google I/O bilo je prilično uzbudljivo! U području umjetne inteligencije predstavili su nekoliko važnih dostignuća.
Konkurencija između OpenAI-jevog GPT-4 i Googleovog Geminija bila je jedno od najznačajnijih otkrića. Nakon njihovog postojanja DLAN 2 sustava, Gemini je veliki jezični model (LLM) sljedeće generacije.
Google je unaprijedio model strojnog učenja, čineći ga još sofisticiranijim. Kako bi se natjecali s Microsoftovim poboljšanjima Binga, također dodaju generativne AI mogućnosti u Android i jačaju Google pretraživanje s AI.
Kako bi Google Bard bio konkurentniji u odnosu na druge chatbotovi kao što je ChatGPT, najavili su značajno poboljšanje za njega tijekom događaja. Bard će s vremenom podržavati još 40 jezika, uključujući korejski i japanski. S ovim proširenjem, Bard će moći podržati programere bilo gdje.
Osim toga, kako bi poboljšao svoje odgovore na zahtjeve korisnika, Bard će sada nuditi slike, karte i druge grafike. Za sve programere vani, to će biti od goleme pomoći. Ovdje ćemo ispitati specifičnosti LLM Gemini.
Što su Blizanci?
Prema Google, Gemini je od samog početka zamišljen kao multimodalan, vrlo učinkovit u smislu alata za povezivanje i API-ja, te spreman za buduća poboljšanja kao što su memorija i planiranje. Google je u svom postu na blogu naveo da Gemini već ima izvanredne multimodalne mogućnosti koje prethodni modeli nisu imali.
"Nakon što fino prilagodimo i temeljito testiramo sigurnost Geminija, ponudit ćemo ga u različitim veličinama i mogućnostima, slično PaLM 2", rekao je Google.
Kao rezultat toga, može se implementirati na više proizvoda, aplikacija i uređaja kako bi svi imali koristi.”
Na konferenciji su predstavili PaLM 2, vrhunski jezični model s proširenim mogućnostima višejezičnosti, zaključivanja i kodiranja. Bio je opsežno obučen s višejezičnim materijalom s preko 100 jezika.
PaLM 2 može proizvesti i prevesti suptilan sadržaj kao što su idiomi, poezija i zagonetke na raznim jezicima.
Gemini će vjerojatno potaknuti Googleove AI napore i izazvati pionira, OpenAI-jev ChatGPT. Dok se ChatGPT uglavnom koristi za tekstualne razgovore, Gemini je multimodalan, što znači da može odgovoriti i na tekst i na vizualne sadržaje. Nakon integracije s Google pretraživanjem, ima potencijal promijeniti način na koji potrošači komuniciraju s popularnom tražilicom.
Iako daljnji detalji o Geminiju još nisu dostupni, on može nadmašiti ChatGPT i Bing AI, gurajući Google na čelo polja AI.
Sundar Pichai, glavni izvršni direktor Googlea, primijetio je tijekom konferencije: "Nakon što smo sedam godina bili tvrtka na prvom mjestu umjetne inteligencije, nalazimo se na uzbudljivoj prekretnici."
Gemini sada prolazi obuku, prema Pichaiju, a kreiran je s multimodalnim pristupom s ciljem da bude iznimno učinkovit i otvori vrata za budući napredak poput pamćenja i planiranja. Gemini već pokazuje izvanredne multimodalne mogućnosti koje nisu postojale u ranijim verzijama, prema Pichaiju, čak i ako je još uvijek u ranoj fazi.
Google upućuje Gemini putem svojih TPU (čipova). Pichai je izjavio da će Gemini biti dostupan u različitim veličinama i kapacitetima nakon što bude optimiziran i prođe sigurnosne preglede, iako nije spomenut konkretan datum izdavanja.
Pichai je jasno dao do znanja da će svi Googleovi modeli umjetne inteligencije uključivati vodene žigove i metapodatke u rezultate, poput slika, kako bi se spriječilo širenje netočnih informacija.
Ono što čini Blizanca superiornim ChatGPT i BingAI?
Blizanci imaju nekoliko intrigantnih "multimodalnih" karakteristika. Gemini, za razliku od ChatGPT-a, koji može samo čitati i proizvoditi tekst, temelji se na multimodalnoj paradigmi i može razumjeti i proizvoditi tekst, kod i slike.
Brojne prilike omogućene su ovom širokom raznolikošću vještina. Gemini se, na primjer, može koristiti za stvaranje nove klase AI chatbota koji mogu razumjeti i reagirati i na tekst i na slike.
Međutim, i ChatGPT i Bing pružaju samo komunikaciju temeljenu na tekstu, pri čemu Bing pruža zasebnu vezu za stvaranje slika, ali nema podršku za slike u chatu.
Za razliku od ChatGPT-a, Gemini može rukovati širokim spektrom proizvoda i aplikacija. Može se koristiti, primjerice, za nadogradnju Google pretraživanja ili stvaranje vrhunskog virtualnog pomoćnika koji koristi AI. Ove značajke nedostaju u BingAI i ChatGPT. ChatGPT, međutim, nudi dodatke koji poboljšavaju rezultate.
Gemini također posjeduje karakteristike poput memorije i planiranja, omogućujući razvoj aplikacija koje pokreće AI koje nadilaze ono za što je ChatGPT sposoban.
Uzbudljive mogućnosti otvaraju se kada razmislite o osobnom asistentu kojeg pokreće Gemini i koji prati vaše želje i pomaže u dnevnom planiranju. Međutim, da bismo vidjeli puni potencijal Geminija i istražili mogućnosti koje otvara, prvo moramo nestrpljivo čekati njegovo javno objavljivanje.
Zaključak
Gemini, Googleov jezični model sljedeće generacije, pokazao je izvanredne multimodalne značajke, što ga čini prilagodljivijim od ChatGPT-a, njegovog konkurenta samo za tekst.
Gemini stvara nove prilike za chatbotove i AI aplikacije omogućujući im čitanje i proizvodnju teksta, koda i grafike. Ove aplikacije sada mogu upravljati većim rasponom aktivnosti. Za razliku od Geminija, koji podržava i slike i multimodalne interakcije, ChatGPT i BingAI sposobni su samo za interakcije temeljene na tekstu.
Iako konkretnije informacije o Geminiju još nisu objavljene, jasno je da je Google predan unaprjeđenju AI tehnologije i zadržavanju vodećeg položaja na tom području.
Očekujemo da ćemo vidjeti puni potencijal Geminija i kreativne mogućnosti koje otvara dok uzbuđeno iščekujemo njegovo službeno lansiranje.
Ostavi odgovor