Enhavtabelo[Kaŝi][Montri]
la 23-a Google I/O estis sufiĉe ekscita! En la areo de artefarita inteligenteco, ili prezentis plurajn gravajn progresojn.
La konkurado inter la GPT-4 de OpenAI kaj la Gemini de Google estis unu el la plej signifaj malkaŝoj. Post ilia ekzistado PALM 2 sistemo, Ĝemelo estas la granda lingvomodelo (LLM) de la sekva generacio.
La maŝinlernada modelo estis plibonigita de Google, igante ĝin eĉ pli kompleksa. Por konkuri kun la plibonigoj de Bing de Mikrosofto, ili ankaŭ aldonas generajn AI-kapablojn al Android kaj plifortigas Google Search per AI.
Por fari Google Bard pli konkurenciva kun aliaj babilrotoj kiel ChatGPT, ili anoncis gravan plibonigon por ĝi dum la evento. Bard finfine subtenos 40 pliajn lingvojn, inkluzive de la korea kaj la japana. Kun ĉi tiu etendo, Bard povos subteni devs ie ajn.
Aldone, por plibonigi siajn respondojn al uzantpetoj, Bard nun proponos bildojn, mapojn kaj aliajn grafikaĵojn. Por ĉiuj programistoj tie, ĝi estos de grandega helpo. Ĉi tie ni ekzamenos la specifaĵojn de LLM Gemini.
Kio estas Gemini?
Laŭ google, Ĝemelo estis celita de la grundo por esti multimodala, tre efika laŭ konekto de iloj kaj APIoj, kaj preta por estontaj progresoj kiel memoro kaj planado. Google deklaris en sia blogo, ke Gemini jam havas elstarajn multmodalajn kapablojn, kiujn antaŭaj modeloj ne havis.
"Post kiam ni agordas kaj ĝisfunde testas Gemini por sekureco, ni ofertos ĝin en diversaj grandecoj kaj kapabloj, simile al PaLM 2," diris Google.
Kiel rezulto, ĝi povas esti efektivigita tra pluraj produktoj, aplikaĵoj kaj aparatoj por profitigi ĉiujn."
Ili prezentis PaLM 2, avangardan lingvan modelon kun vastigitaj multlingvaj, rezonado kaj kodigkapabloj, ĉe la konferenco. Ĝi estis vaste trejnita per multlingva materialo el pli ol 100 lingvoj.
PaLM 2 povas produkti kaj traduki subtilan enhavon kiel idiomaĵoj, poezio kaj enigmoj en diversaj lingvoj.
Ĝemelo verŝajne akcelos la AI-klopodojn de Google kaj defios la pioniron, ChatGPT de OpenAI. Dum ChatGPT estas plejparte uzata por tekst-bazitaj konversacioj, Gemini estas multmodala, kio signifas, ke ĝi povas respondi al teksto kaj bildoj. Fojo integrita kun Google Search, ĝi havas la eblecon transformi kiel konsumantoj interagas kun la populara serĉilo.
Kvankam pliaj detaloj pri Gemini ankoraŭ ne haveblas, ĝi povas superi ChatGPT kaj Bing AI, propulsante Guglon al la estro de la AI-kampo.
Sundar Pichai, Ĉefoficisto de Google, rimarkis dum la konferenco, "Post sep jaroj de esti AI-unua firmao, ni trovas nin ĉe ekscita turnopunkto."
Ĝemeloj nun spertas trejnadon, laŭ Pichai, kaj ĝi estas kreita kun multmodala aliro kun la celo esti ekstreme efika kaj malfermi la pordon por estontaj progresoj kiel memoro kaj planado. Ĝemelo jam montras elstarajn multmodalajn kapablojn, kiuj forestis de pli fruaj versioj, laŭ Pichai, eĉ se ĝi ankoraŭ estas en siaj fruaj fazoj.
Google instruas Gemini per sia TPU (blatoj). Pichai deklaris, ke post kiam Ĝemelo estis optimumigita kaj pasigis sekurecajn inspektadojn, ĝi estus alirebla en gamo da grandecoj kaj kapacitoj, kvankam neniu specifa eldondato estis menciita.
Pichai klarigis, ke ĉiuj AI-modeloj de Google inkludos akvomarkon kaj metadatenojn en eliroj, kiel bildoj, por malhelpi la disvastigon de malĝustaj informoj.
Kio faras Ĝemelojn superajn Babilado GPT kaj BingAI?
Ĝemelo havas plurajn interesajn "multimodalajn" trajtojn. Gemini, kontraste al ChatGPT, kiu povas nur legi kaj produkti tekston, baziĝas sur multmodala paradigmo kaj povas kompreni kaj produkti tekston, kodon kaj bildojn.
Multaj ŝancoj estas ebligitaj per ĉi tiu pli vasta vario de kapabloj. Ĝemeloj, ekzemple, povas esti uzataj por krei novan klason de AI-babilrotoj, kiuj povas kompreni kaj reagi al ambaŭ tekstoj kaj bildoj.
Tamen, kaj ChatGPT kaj Bing nur disponigas tekst-bazitan komunikadon, kie Bing disponigas apartan ligon por kreado de bildoj sed malhavas en-babilan bildosubtenon.
Ĝemelo povas pritrakti pli larĝan gamon da produktoj kaj aplikoj kontraste al ChatGPT. Ĝi povas esti uzata, ekzemple, por ĝisdatigi Google Search aŭ krei avangardan virtualan asistanton, kiu uzas AI. Ĉi tiuj funkcioj mankas en BingAI kaj ChatGPT. ChatGPT tamen provizas kromaĵojn, kiuj plibonigas la rezultojn.
Ĝemelo ankaŭ posedas karakterizaĵojn kiel memoro kaj planado, permesante la disvolviĝon de AI-funkciigitaj apoj, kiuj iras preter tio, kion ChatGPT kapablas.
Ekscitigaj eblecoj aperas kiam vi pripensas havi personan asistanton funkciigitan de Gemini, kiu konservas viajn preferojn kaj helpas en ĉiutaga planado. Por vidi la plenan potencialon de Gemini kaj esplori la ŝancojn kiujn ĝi malfermas, tamen, ni unue devas atendi senpacience ĝian publikan liberigon.
konkludo
Gemini, la venontgeneracia lingvomodelo de Guglo, montris elstarajn multmodalajn funkciojn, igante ĝin pli adaptebla ol ChatGPT, ĝia nur-teksta rivalo.
Ĝemelo kreas novajn ŝancojn por babilrotoj kaj AI-aplikoj ebligante ilin legi kaj produkti tekston, kodon kaj grafikojn. Ĉi tiuj aplikoj nun povas administri pli grandan gamon da agadoj. Male al Gemini, kiu subtenas kaj bildojn kaj multmodalajn interagojn, ChatGPT kaj BingAI nur kapablas tekst-bazitajn interagojn.
Kvankam pli specifaj informoj pri Gemini ankoraŭ ne estas publikigitaj, estas klare, ke Google kompromitas antaŭenigi AI-teknologion kaj konservi sian antaŭecon en la kampo.
Ni antaŭvidas vidi la plenan potencialon de Gemini kaj la kreajn eblecojn kiujn ĝi malfermas dum ni ekscitite atendas ĝian formalan lanĉon.
Lasi Respondon