Google Gemini – tekmec ChatGPT & Bing AI?

Kazalo[Skrij][Pokaži]

Kaj je Gemini?
Zakaj je Gemini boljši od ChatGPT in BingAI?
zaključek

O 23. Google I/O je bilo prav razburljivo! Na področju umetne inteligence so predstavili več pomembnih dosežkov.

Tekmovanje med GPT-4 OpenAI in Googlovim Geminijem je bilo eno najpomembnejših razkritij. Po njihovem obstoju DLAN 2 Gemini je veliki jezikovni model (LLM) naslednje generacije.

Google IO23

Model strojnega učenja je Google izboljšal in ga naredil še bolj izpopolnjenega. Da bi konkurirali Microsoftovim izboljšavam Binga, v Android dodajajo tudi generativne zmogljivosti umetne inteligence in spodbujajo iskanje Google z umetno inteligenco.

Da bo Google Bard bolj konkurenčen drugim chatboti, kot je ChatGPT, so med dogodkom napovedali znatno izboljšanje zanj. Bard bo sčasoma podpiral še 40 jezikov, vključno s korejščino in japonščino. S to razširitvijo bo Bard lahko podpiral razvijalce kjer koli.

Poleg tega bo Bard zdaj ponudil slike, zemljevide in druge grafike, da bi izboljšal svoje odgovore na zahteve uporabnikov. Vsem razvijalcem bo v veliko pomoč. Tukaj bomo preučili posebnosti LLM Gemini.

Kaj je Gemini?

Glede na google, Gemini je bil od samega začetka načrtovan kot multimodalen, zelo učinkovit v smislu povezovalnih orodij in API-jev ter pripravljen na prihodnji napredek, kot sta spomin in načrtovanje. Google je v svojem blogu navedel, da ima Gemini že izjemne multimodalne zmogljivosti, ki jih prejšnji modeli niso imeli.

"Ko bomo Gemini natančno prilagodili in temeljito preizkusili glede varnosti, ga bomo ponudili v različnih velikostih in zmožnostih, podobno kot PaLM 2," je dejal Google.

Posledično ga je mogoče implementirati v več izdelkov, aplikacij in naprav, kar bo koristilo vsem.«

Na konferenci so predstavili PaLM 2, vrhunski jezikovni model z razširjenimi večjezičnimi zmožnostmi, sposobnostmi sklepanja in kodiranja. Obširno je bil izobražen z večjezičnim gradivom iz več kot 100 jezikov.

PaLM 2 lahko ustvari in prevede subtilno vsebino, kot so idiomi, poezija in uganke, v različnih jezikih.

Gemini bo verjetno spodbudil Googlova prizadevanja na področju umetne inteligence in izzival pionirja, OpenAI-jev ChatGPT. Medtem ko se ChatGPT večinoma uporablja za besedilne pogovore, je Gemini multimodalen, kar pomeni, da se lahko odziva tako na besedilo kot na vizualne elemente. Ko je integriran z Googlovim iskanjem, lahko spremeni način interakcije potrošnikov s priljubljenim iskalnikom.

Čeprav dodatne podrobnosti o Gemini še niso na voljo, lahko preseže ChatGPT in Bing AI, s čimer Google požene na čelo področja AI.

Sundar Pichai, izvršni direktor Googla, je med konferenco pripomnil: "Po sedmih letih, ko smo bili prvo podjetje z umetno inteligenco, smo se znašli na vznemirljivi prelomnici."

Po besedah Pichaija je Gemini zdaj na usposabljanju in nastaja z multimodalnim pristopom s ciljem, da bi bil izjemno učinkovit in odprl vrata za prihodnji napredek, kot sta spomin in načrtovanje. Po besedah Pichaija Gemini že kaže izjemne multimodalne zmogljivosti, ki jih v prejšnjih različicah ni bilo, čeprav je še vedno v zgodnjih fazah.

Google Gemini daje navodila prek svojih TPU (čipov). Pichai je izjavil, da bo po tem, ko bo Gemini optimiziran in bo opravil varnostne preglede, na voljo v različnih velikostih in zmogljivostih, čeprav ni bil omenjen noben konkreten datum izdaje.

Pichai je jasno povedal, da bodo vsi Googlovi modeli AI vključevali vodne žige in metapodatke v izhodih, kot so slike, da bi preprečili širjenje napačnih informacij.

V čem je Dvojček boljši od ChatGPT in BingAI?

Dvojčka ima več zanimivih "multimodalnih" značilnosti. Gemini v nasprotju s ChatGPT, ki lahko samo bere in ustvarja besedilo, temelji na multimodalni paradigmi in lahko razume in proizvaja besedilo, kodo in slike.

Ta večja raznolikost veščin omogoča številne priložnosti. Gemini, na primer, se lahko uporabi za ustvarjanje novega razreda klepetalnih robotov z umetno inteligenco, ki lahko razumejo in se odzivajo na besedilo in slike.

Vendar tako ChatGPT kot Bing zagotavljata le besedilno komunikacijo, pri čemer Bing ponuja ločeno povezavo za ustvarjanje slik, vendar nima podpore za slike v klepetu.

Gemini lahko upravlja večjo paleto izdelkov in aplikacij v nasprotju s ChatGPT. Uporablja se lahko na primer za nadgradnjo Iskanja Google ali ustvarjanje vrhunskega virtualnega pomočnika, ki uporablja AI. Te funkcije manjkajo v BingAI in ChatGPT. ChatGPT pa ponuja vtičnike, ki izboljšajo rezultate.

Gemini ima tudi značilnosti, kot sta pomnilnik in načrtovanje, kar omogoča razvoj aplikacij, ki jih poganja AI in presegajo tisto, česar je sposoben ChatGPT.

Razburljive možnosti se odprejo, ko razmislite o osebnem pomočniku, ki ga poganja Gemini, ki spremlja vaše želje in pomaga pri dnevnem načrtovanju. Da bi videli polni potencial Geminija in raziskali priložnosti, ki jih odpira, moramo najprej nestrpno počakati na njegovo javno objavo.

zaključek

Gemini, Googlov jezikovni model naslednje generacije, je pokazal izjemne multimodalne lastnosti, zaradi česar je bolj prilagodljiv kot ChatGPT, njegov tekmec samo za besedilo.

Gemini ustvarja nove priložnosti za klepetalne robote in aplikacije z umetno inteligenco, saj jim omogoča branje in ustvarjanje besedila, kode in grafike. Te aplikacije zdaj lahko upravljajo večjo paleto dejavnosti. V nasprotju z Geminijem, ki podpira tako slike kot multimodalne interakcije, sta ChatGPT in BingAI sposobna samo interakcij na podlagi besedila.

Čeprav natančnejši podatki o Gemini še niso bili objavljeni, je jasno, da je Google zavezan napredku tehnologije umetne inteligence in ohranjanju vodilnega položaja na tem področju.

Pričakujemo, da bomo videli polni potencial Geminija in ustvarjalne možnosti, ki jih odpira, medtem ko navdušeno čakamo na njegovo uradno predstavitev.