Saturs[Paslēpt][Rādīt]
Jūsu darbs IR Klientu apkalpošana 23. Google I/O bija diezgan satriecoši! Mākslīgā intelekta jomā viņi sniedza vairākus svarīgus sasniegumus.
Konkurence starp OpenAI GPT-4 un Google Gemini bija viens no nozīmīgākajiem atklājumiem. Pēc viņu esošās PLAMA 2 sistēma, Gemini ir nākamās paaudzes lielās valodas modelis (LLM).
Google ir uzlabojis mašīnmācīšanās modeli, padarot to vēl sarežģītāku. Lai konkurētu ar Microsoft Bing uzlabojumiem, viņi arī pievieno ģenerējošas AI iespējas Android ierīcēm un uzlabo Google meklēšanu ar AI.
Lai padarītu Google Bard konkurētspējīgāku ar citiem tērzēšanas roboti, piemēram, ChatGPT, viņi pasākuma laikā paziņoja par būtisku tā uzlabojumu. Bard galu galā atbalstīs vēl 40 valodas, tostarp korejiešu un japāņu valodu. Izmantojot šo paplašinājumu, Bard varēs atbalstīt izstrādātājus jebkur.
Turklāt, lai uzlabotu atbildes uz lietotāju pieprasījumiem, Bard tagad piedāvās attēlus, kartes un citus grafikus. Visiem izstrādātājiem tas būs milzīgs atbalsts. Šeit mēs izskatīsim LLM Gemini specifiku.
Kas ir Gemini?
Saskaņā ar google, Gemini jau no paša sākuma bija paredzēts kā multimodāls, ļoti efektīvs rīku un API savienošanas ziņā un gatavs turpmākiem uzlabojumiem, piemēram, atmiņai un plānošanai. Google savā emuāra ziņojumā norādīja, ka Gemini jau ir izcilas multimodālās iespējas, kuru iepriekšējiem modeļiem nebija.
"Kad mēs precīzi noregulēsim un rūpīgi pārbaudīsim Gemini drošību, mēs to piedāvāsim dažādos izmēros un iespējās, līdzīgi kā PaLM 2," sacīja Google.
Rezultātā to var ieviest vairākos produktos, lietotnēs un ierīcēs, lai sniegtu labumu ikvienam.
Viņi konferencē prezentēja PaLM 2 — visprogresīvāko valodas modeli ar paplašinātām daudzvalodu, argumentācijas un kodēšanas iespējām. Tas tika plaši apmācīts, izmantojot daudzvalodu materiālu no vairāk nekā 100 valodām.
PaLM 2 var radīt un tulkot smalku saturu, piemēram, idiomas, dzeju un mīklas dažādās valodās.
Gemini, visticamāk, veicinās Google AI centienus un izaicinās pionieri, OpenAI ChatGPT. Lai gan ChatGPT galvenokārt tiek izmantots teksta sarunām, Gemini ir multimodāls, kas nozīmē, ka tas var reaģēt gan uz tekstu, gan uz vizuāliem materiāliem. Kad tas ir integrēts ar Google meklēšanu, tas var mainīt to, kā patērētāji mijiedarbojas ar populāro meklētājprogrammu.
Lai gan sīkāka informācija par Gemini vēl nav pieejama, tas var pārspēt ChatGPT un Bing AI, virzot Google uz AI jomas vadītāju.
Google izpilddirektors Sundars Pichai konferences laikā atzīmēja: "Pēc septiņiem AI uzņēmuma darbības gadiem mēs atrodamies aizraujošā pagrieziena punktā."
Pēc Pichai teiktā, Dvīņi tagad tiek apmācīti, un tie tiek veidoti, izmantojot multimodālu pieeju, lai būtu ārkārtīgi efektīvi un atvērtu durvis nākotnes sasniegumiem, piemēram, atmiņai un plānošanai. Pēc Pichai domām, Gemini jau demonstrē izcilas multimodālās iespējas, kas nebija pieejamas iepriekšējās versijās, pat ja tas joprojām ir agrīnā stadijā.
Google dod norādījumus Gemini, izmantojot savu TPU (mikroshēmas). Pichai paziņoja, ka pēc tam, kad Gemini ir optimizēts un izturējis drošības pārbaudes, tas būs pieejams dažādos izmēros un ietilpībās, lai gan konkrēts izlaišanas datums netika minēts.
Pichai skaidri norādīja, ka visos Google AI modeļos izvados, piemēram, attēlos, tiks iekļauta ūdenszīme un metadati, lai novērstu nepareizas informācijas izplatīšanos.
Ar ko Dvīņi ir pārāki par ChatGPT un BingAI?
Dvīņiem ir vairākas intriģējošas “multimodālas” īpašības. Gemini atšķirībā no ChatGPT, kas var tikai lasīt un radīt tekstu, ir balstīts uz multimodālu paradigmu un spēj saprast un radīt tekstu, kodu un attēlus.
Pateicoties šai prasmju daudzveidībai, ir pieejamas daudzas iespējas. Piemēram, Gemini var izmantot, lai izveidotu jaunu AI tērzēšanas robotu klasi, kas var saprast un reaģēt gan uz tekstu, gan uz vizuālajiem materiāliem.
Tomēr gan ChatGPT, gan Bing nodrošina tikai uz tekstu balstītu saziņu, un Bing nodrošina atsevišķu saiti attēlu izveidei, taču trūkst tērzēšanas attēlu atbalsta.
Atšķirībā no ChatGPT Gemini var apstrādāt plašāku produktu un lietojumprogrammu klāstu. To var izmantot, piemēram, lai jauninātu Google meklēšanu vai izveidotu modernu virtuālo palīgu, kas izmanto AI. Šo funkciju trūkst BingAI un ChatGPT. Tomēr ChatGPT nodrošina spraudņus, kas uzlabo rezultātus.
Gemini piemīt arī tādas īpašības kā atmiņa un plānošana, kas ļauj izstrādāt ar AI darbināmas lietotnes, kas pārsniedz ChatGPT iespējas.
Aizraujošas iespējas rodas, ja apsverat iespēju izmantot personīgo palīgu, ko darbina Gemini, kas seko līdzi jūsu vēlmēm un palīdz ikdienas plānošanā. Tomēr, lai redzētu visu Dvīņu potenciālu un izpētītu iespējas, ko tas paver, mums vispirms ar nepacietību jāgaida tā publiskošana.
Secinājumi
Gemini, Google nākamās paaudzes valodas modelis, ir parādījis izcilas multimodālas funkcijas, padarot to pielāgojamāku nekā ChatGPT, tikai teksta konkurentu.
Gemini rada jaunas iespējas tērzēšanas robotiem un AI lietotnēm, ļaujot tiem lasīt un izveidot tekstu, kodu un grafiku. Šīs lietojumprogrammas tagad var pārvaldīt lielāku darbību klāstu. Atšķirībā no Gemini, kas atbalsta gan attēlus, gan multimodālu mijiedarbību, ChatGPT un BingAI spēj veikt tikai teksta mijiedarbību.
Lai gan konkrētāka informācija par Gemini vēl nav publiskota, ir skaidrs, ka Google ir apņēmies attīstīt AI tehnoloģiju un saglabāt savu vadošo lomu šajā jomā.
Mēs paredzam, ka mēs redzēsim visu Dvīņu potenciālu un radošās iespējas, ko tas paver, satraukti gaidot tā oficiālo palaišanu.
Atstāj atbildi