Sisukord[Peida][Näita]
. 23. Google I/O oli päris põnev! Tehisintellekti valdkonnas tegid nad mitmeid olulisi edusamme.
Konkurents OpenAI GPT-4 ja Google'i Gemini vahel oli üks olulisemaid ilminguid. Pärast nende olemasolevat PEALM 2 Gemini on järgmise põlvkonna suur keelemudel (LLM).
Google on masinõppe mudelit täiustanud, muutes selle veelgi keerukamaks. Microsofti Bingi täiustustega konkureerimiseks lisavad nad Androidi ka generatiivseid AI-võimalusi ja täiustavad AI-ga Google'i otsingut.
Et muuta Google Bard teistega võrreldes konkurentsivõimelisemaks vestlusrobotid nagu ChatGPT, teatasid nad ürituse ajal selle olulisest täiustusest. Lõpuks toetab Bard veel 40 keelt, sealhulgas korea ja jaapani keelt. Selle laienduse abil saab Bard toetada arendajaid kõikjal.
Lisaks pakub Bard nüüd pilte, kaarte ja muud graafikat, et parandada oma vastuseid kasutajate päringutele. Kõigile seal olevatele arendajatele on see tohutult abiks. Siin uurime LLM Gemini eripärasid.
Mis on Kaksikud?
Järgi Google, Gemini oli algusest peale mõeldud multimodaalseks, väga tõhusaks tööriistade ja API-de ühendamiseks ning valmis tulevasteks edusammudeks, nagu mälu ja planeerimine. Google märkis oma ajaveebi postituses, et Geminil on juba silmapaistvad multimodaalsed võimalused, mida varasematel mudelitel polnud.
"Kui oleme Gemini ohutuse tagamiseks peenhäälestanud ja põhjalikult testinud, pakume seda erineva suuruse ja võimekusega sarnaselt PaLM 2-le," ütles Google.
Selle tulemusena saab seda rakendada paljudes toodetes, rakendustes ja seadmetes, et kõik oleks kasulikud.
Konverentsil esitlesid nad PaLM 2 – tipptasemel keelemudelit, millel on laiendatud mitmekeelsus-, arutlus- ja kodeerimisvõimalused. Seda koolitati põhjalikult mitmekeelse materjaliga enam kui 100 keelest.
PaLM 2 suudab toota ja tõlkida peent sisu, nagu idioome, luulet ja mõistatusi erinevates keeltes.
Gemini suurendab tõenäoliselt Google'i tehisintellekti jõupingutusi ja esitab väljakutse pioneerile, OpenAI ChatGPT-le. Kui ChatGPT-d kasutatakse enamasti tekstipõhiste vestluste jaoks, siis Gemini on multimodaalne, mis tähendab, et see suudab reageerida nii tekstile kui ka visuaalidele. Pärast Google'i otsinguga integreerimist võib see muuta seda, kuidas tarbijad populaarse otsingumootoriga suhtlevad.
Kuigi Gemini kohta pole täiendavaid üksikasju veel saadaval, võib see edestada ChatGPT-d ja Bing AI-d, tõstes Google'i tehisintellekti valdkonna juhiks.
Google'i tegevjuht Sundar Pichai märkis konverentsil: "Pärast seitset aastat tehisintellektiga esikohale asumist leiame end põnevas pöördepunktis."
Kaksikud läbivad Pichai sõnul nüüd koolitust ja see luuakse multimodaalse lähenemisviisiga eesmärgiga olla äärmiselt tõhus ja avada uks tulevasteks edusammudeks, nagu mälu ja planeerimine. Kaksikud näitavad Pichai sõnul juba silmapaistvaid multimodaalseid võimeid, mis varasemates versioonides puudusid, isegi kui see on alles algfaasis.
Google juhendab Geminit oma TPU (kiipide) kaudu. Pichai teatas, et pärast Gemini optimeerimist ja ohutuskontrolli läbimist on see saadaval mitmesugustes suurustes ja võimsustes, kuigi konkreetset väljalaskekuupäeva ei mainitud.
Pichai tegi selgeks, et kõik Google'i AI mudelid sisaldavad vesimärke ja metaandmeid väljunditesse, nagu pildid, et vältida vale teabe levikut.
Mille poolest Kaksikud on paremad kui ChatGPT ja BingAI?
Kaksikutel on mitmeid intrigeerivaid "multimodaalseid" omadusi. Kaksikud, erinevalt ChatGPT-st, mis suudab ainult teksti lugeda ja toota, põhineb multimodaalsel paradigmal ning suudab mõista ja toota teksti, koodi ja pilte.
See oskuste laiem valik teeb võimalikuks arvukad võimalused. Näiteks Geminit saab kasutada uudse tehisintellekti vestlusrobotite klassi loomiseks, mis mõistavad nii teksti kui ka visuaale ja reageerivad sellele.
Kuid nii ChatGPT kui ka Bing pakuvad ainult tekstipõhist suhtlust, kusjuures Bing pakub piltide loomiseks eraldi linki, kuid puudub vestlusesisene piltide tugi.
Erinevalt ChatGPT-st saavad Gemini hakkama laiema valikuga toodete ja rakendustega. Seda saab kasutada näiteks Google'i otsingu uuendamiseks või tehisintellekti kasutava tipptasemel virtuaalse assistendi loomiseks. Need funktsioonid puuduvad BingAI-s ja ChatGPT-s. ChatGPT pakub aga pistikprogramme, mis parandavad tulemusi.
Kaksikutel on ka sellised omadused nagu mälu ja planeerimine, mis võimaldab arendada AI-toega rakendusi, mis lähevad kaugemale sellest, milleks ChatGPT on võimeline.
Põnevad võimalused avanevad, kui kaalute Gemini abil töötava isikliku abistaja kasutamist, mis jälgib teie eelistusi ja aitab igapäevasel planeerimisel. Kaksikute täieliku potentsiaali nägemiseks ja nende avanevate võimaluste uurimiseks peame aga kõigepealt kannatamatult ootama selle avalikku avaldamist.
Järeldus
Gemini, Google'i järgmise põlvkonna keelemudel, on näidanud silmapaistvaid multimodaalseid funktsioone, muutes selle kohanemisvõimelisemaks kui ChatGPT, selle ainult tekstipõhine rivaal.
Gemini loob uusi võimalusi vestlusrobotite ja AI-rakenduste jaoks, võimaldades neil lugeda ja toota teksti, koodi ja graafikat. Need rakendused saavad nüüd hallata suuremat hulka tegevusi. Erinevalt Geminist, mis toetab nii pilte kui ka multimodaalset suhtlust, on ChatGPT ja BingAI võimelised ainult tekstipõhiseks suhtluseks.
Kuigi täpsemat teavet Gemini kohta pole veel avalikustatud, on selge, et Google on pühendunud tehisintellekti tehnoloogia edendamisele ja oma juhtpositsiooni säilitamisele selles valdkonnas.
Me ootame, et näeme Kaksikute täielikku potentsiaali ja loovaid võimalusi, mida see avab, kui ootame põnevusega selle ametlikku käivitamist.
Jäta vastus