Orodha ya Yaliyomo[Ficha][Onyesha]
The 23 Google I/O ilisisimua sana! Katika eneo la akili ya bandia, waliwasilisha maendeleo kadhaa muhimu.
Ushindani kati ya OpenAI's GPT-4 na Gemini ya Google ulikuwa moja ya ufunuo muhimu zaidi. Baada ya kuwepo kwao PALM 2 mfumo, Gemini ni kielelezo kikubwa cha lugha (LLM) cha kizazi kijacho.
Mtindo wa kujifunza mashine umeimarishwa na Google, na kuifanya kuwa ya kisasa zaidi. Ili kushindana na maboresho ya Bing ya Microsoft, pia wanaongeza uwezo wa kuzalisha wa AI kwenye Android na kukuza Utafutaji wa Google ukitumia AI.
Ili kufanya Google Bard ishinde zaidi na wengine chatbots kama ChatGPT, walitangaza uboreshaji mkubwa kwake wakati wa hafla hiyo. Bard hatimaye ataweza kutumia lugha 40 zaidi, zikiwemo Kikorea na Kijapani. Kwa kiendelezi hiki, Bard ataweza kutumia watengenezaji popote pale.
Zaidi ya hayo, ili kuboresha majibu yake kwa maombi ya watumiaji, Bard sasa itatoa picha, ramani na michoro mingine. Kwa watengenezaji wote huko nje, itakuwa ya msaada mkubwa. Hapa, tutachunguza maelezo mahususi ya LLM Gemini.
Gemini ni nini?
Kulingana na google, Gemini ilikusudiwa kuanzia mwanzo kuwa ya aina nyingi, yenye ufanisi mkubwa katika suala la kuunganisha zana na API, na iko tayari kwa maendeleo ya siku zijazo kama vile kumbukumbu na kupanga. Google ilisema katika chapisho lao la blogi kwamba Gemini tayari ina uwezo bora wa multimodal ambao mifano ya hapo awali haikuwa nayo.
"Tunaporekebisha vizuri na kuijaribu Gemini kwa uhakika kwa usalama, tutaitoa kwa ukubwa na uwezo mbalimbali, sawa na PaLM 2," Google ilisema.
Kwa hivyo, inaweza kutekelezwa kwenye bidhaa, programu na vifaa vingi ili kufaidi kila mtu.
Waliwasilisha PaLM 2, modeli ya kisasa ya lugha iliyo na uwezo uliopanuliwa wa lugha nyingi, hoja, na usimbaji, katika mkutano huo. Ilifundishwa kwa kina kwa nyenzo za lugha nyingi kutoka zaidi ya lugha 100.
PaLM 2 inaweza kutoa na kutafsiri maudhui fiche kama vile nahau, ushairi na mafumbo katika lugha mbalimbali.
Gemini ina uwezekano wa kuongeza juhudi za AI za Google na kutoa changamoto kwa waanzilishi, ChatGPT ya OpenAI. Ingawa ChatGPT hutumiwa zaidi kwa mazungumzo yanayotegemea maandishi, Gemini ni ya aina nyingi, kumaanisha kuwa inaweza kujibu maandishi na taswira. Baada ya kuunganishwa na Utafutaji wa Google, ina uwezo wa kubadilisha jinsi watumiaji wanavyoingiliana na injini ya utafutaji maarufu.
Ingawa maelezo zaidi kuhusu Gemini bado hayapatikani, inaweza kuwa bora zaidi kuliko ChatGPT na Bing AI, ikisogeza Google kwa mkuu wa uga wa AI.
Sundar Pichai, Mkurugenzi Mtendaji wa Google, alisema wakati wa mkutano huo, "Baada ya miaka saba ya kuwa kampuni ya kwanza ya AI, tunajikuta katika hatua ya kufurahisha."
Gemini sasa inaendelea na mafunzo, kulingana na Pichai, na inaundwa kwa mbinu ya aina nyingi kwa lengo la kuwa na ufanisi mkubwa na kufungua mlango kwa maendeleo ya baadaye kama kumbukumbu na kupanga. Gemini tayari inaonyesha uwezo bora wa multimodal ambao haukuwepo kwenye matoleo ya awali, kulingana na Pichai, hata ikiwa bado iko katika awamu zake za awali.
Google inaelekeza Gemini kupitia TPU (chips) zake. Pichai alisema kuwa baada ya Gemini kuboreshwa na kupitisha ukaguzi wa usalama, inaweza kupatikana katika ukubwa na uwezo mbalimbali, ingawa hakuna tarehe maalum ya kutolewa iliyotajwa.
Pichai aliweka wazi kuwa miundo yote ya AI ya Google itajumuisha alama za maji na metadata katika matokeo, kama vile picha, ili kuzuia kuenea kwa taarifa zisizo sahihi.
Ni nini kinachofanya Gemini kuwa bora kuliko GumzoGPT na BingaI?
Gemini ina sifa kadhaa za kuvutia za "multimodal". Gemini, tofauti na ChatGPT, ambayo inaweza tu kusoma na kutoa maandishi, inategemea dhana ya aina nyingi na inaweza kuelewa na kutoa maandishi, msimbo, na picha.
Fursa nyingi zinawezeshwa na aina hii pana ya ujuzi. Gemini, kwa mfano, inaweza kutumika kuunda darasa jipya la chatbots za AI ambazo zinaweza kuelewa na kuguswa na maandishi na taswira.
Hata hivyo, ChatGPT na Bing hutoa tu mawasiliano yanayotegemea maandishi, huku Bing ikitoa kiungo tofauti cha kuunda picha lakini haina usaidizi wa picha ya ndani ya gumzo.
Gemini inaweza kushughulikia aina mbalimbali za bidhaa na programu tofauti na ChatGPT. Inaweza kutumika, kwa mfano, kuboresha Utafutaji wa Google au kuunda msaidizi pepe wa kisasa anayetumia AI. Vipengele hivi havipo katika BingaI na ChatGPT. ChatGPT, hata hivyo, hutoa programu-jalizi zinazoboresha matokeo.
Gemini pia ina sifa kama vile kumbukumbu na upangaji, inayoruhusu uundaji wa programu zinazoendeshwa na AI ambazo huenda zaidi ya kile ambacho ChatGPT inaweza kufanya.
Uwezekano wa kusisimua hutokea unapofikiria kuwa na msaidizi wa kibinafsi anayeendeshwa na Gemini ambaye hufuatilia mapendeleo yako na usaidizi katika kupanga kila siku. Ili kuona uwezo kamili wa Gemini na kuchunguza fursa inazofungua, hata hivyo, ni lazima kwanza tusubiri kwa hamu kutolewa kwake kwa umma.
Hitimisho
Gemini, modeli ya lugha ya kizazi kijacho ya Google, imeonyesha vipengele bora vya moduli nyingi, na kuifanya iweze kubadilika zaidi kuliko ChatGPT, mpinzani wake wa maandishi pekee.
Gemini huunda fursa mpya za chatbots na programu za AI kwa kuziwezesha kusoma na kutoa maandishi, msimbo na michoro. Programu hizi sasa zinaweza kudhibiti anuwai kubwa ya shughuli. Kinyume na Gemini, ambayo inasaidia picha zote mbili na mwingiliano wa multimodal, ChatGPT na BingAI zinaweza tu kuingiliana kulingana na maandishi.
Ingawa maelezo mahususi zaidi kuhusu Gemini bado hayajawekwa wazi kwa umma, ni wazi kwamba Google imejitolea kuendeleza teknolojia ya AI na kudumisha uongozi wake katika nyanja hiyo.
Tunatarajia kuona uwezo kamili wa Gemini na uwezekano wa ubunifu inaofungua tunaposubiri uzinduzi wake rasmi.
Acha Reply