Turinys[Slėpti][Rodyti]
Šios 23-ioji Google I/O buvo gana jaudinantis! Dirbtinio intelekto srityje jie padarė keletą svarbių pažangų.
Konkurencija tarp OpenAI GPT-4 ir Google Gemini buvo vienas reikšmingiausių atskleidimų. Po jų esamų 2 palmė sistema, Dvyniai yra kitos kartos didžiosios kalbos modelis (LLM).
„Google“ patobulino mašininio mokymosi modelį, todėl jis tapo dar sudėtingesnis. Siekdami konkuruoti su „Microsoft“ „Bing“ patobulinimais, jie taip pat prideda generatyvių AI galimybių į „Android“ ir tobulina „Google“ paiešką naudodami AI.
Kad „Google Bard“ būtų konkurencingesnis su kitais pokalbių robotai, tokie kaip „ChatGPT“., jie paskelbė apie reikšmingą jo patobulinimą renginio metu. „Bard“ galiausiai palaikys dar 40 kalbų, įskaitant korėjiečių ir japonų kalbas. Su šiuo plėtiniu „Bard“ galės palaikyti kūrėjus bet kur.
Be to, siekdama pagerinti savo atsakymus į vartotojų užklausas, „Bard“ dabar pasiūlys paveikslėlius, žemėlapius ir kitą grafiką. Visiems kūrėjams tai bus didžiulė pagalba. Čia mes išnagrinėsime LLM Dvynių specifiką.
Kas yra Dvyniai?
Pagal "Google", Gemini nuo pat pradžių buvo numatyta kaip daugiarūšis, labai efektyvus jungiantis įrankius ir API ir paruoštas būsimiems patobulinimams, tokiems kaip atmintis ir planavimas. „Google“ savo tinklaraščio įraše nurodė, kad „Gemini“ jau turi puikių daugiarūšių galimybių, kurių ankstesni modeliai neturėjo.
„Kai sureguliuosime ir kruopščiai išbandysime Gemini saugumą, pasiūlysime jį įvairių dydžių ir galimybių, panašių į PaLM 2“, – teigė „Google“.
Todėl jį galima įdiegti keliuose produktuose, programose ir įrenginiuose, kad būtų naudinga visiems.
Konferencijoje jie pristatė PaLM 2 – pažangiausią kalbos modelį su išplėstomis daugiakalbystės, samprotavimo ir kodavimo galimybėmis. Jis buvo plačiai apmokytas naudojant daugiakalbę medžiagą iš daugiau nei 100 kalbų.
PaLM 2 gali sukurti ir išversti subtilų turinį, pvz., idiomas, poeziją ir mįsles, įvairiomis kalbomis.
Tikėtina, kad Gemini paskatins „Google“ dirbtinio intelekto pastangas ir mesti iššūkį pradininkui „OpenAI ChatGPT“. Nors „ChatGPT“ dažniausiai naudojamas tekstiniams pokalbiams, „Gemini“ yra daugiarūšis, tai reiškia, kad jis gali reaguoti ir į tekstą, ir į vaizdinius elementus. Integruota su „Google“ paieška, ji gali pakeisti vartotojų sąveiką su populiaria paieškos sistema.
Nors daugiau informacijos apie Gemini dar nėra, ji gali pranokti „ChatGPT“ ir „Bing AI“, todėl „Google“ taps AI srities lydere.
Sundaras Pichai, „Google“ generalinis direktorius, konferencijos metu pažymėjo: „Po septynerių metų, kai įmonė buvo pirmoji dirbtinio intelekto įmonė, atsidūrėme įdomiame lūžio taške.
Anot Pichai, Dvyniai šiuo metu mokomi ir kuriami taikant multimodalinį metodą, siekiant būti itin veiksmingi ir atverti duris ateities pažangai, tokiai kaip atmintis ir planavimas. Anot Pichai, Dvyniai jau demonstruoja išskirtines daugiarūšio transporto galimybes, kurių nebuvo ankstesnėse versijose, net jei ji vis dar yra ankstyvoje stadijoje.
„Google“ nurodo Dvynius per savo TPU (lustus). Pichai teigė, kad po to, kai Gemini bus optimizuotas ir atliks saugos patikrinimus, jis bus prieinamas įvairių dydžių ir pajėgumų, nors nebuvo paminėta konkreti išleidimo data.
Pichai aiškiai pasakė, kad visuose „Google“ AI modeliuose bus vandens ženklai ir metaduomenys išvestyje, pavyzdžiui, nuotraukose, kad būtų išvengta neteisingos informacijos plitimo.
Kuo Dvyniai pranašesni už ChatGPT ir BingAI?
Dvyniai turi keletą intriguojančių „multimodalinių“ savybių. Dvyniai, priešingai nei ChatGPT, galintys tik skaityti ir kurti tekstą, yra paremti multimodaline paradigma ir gali suprasti bei sukurti tekstą, kodą ir paveikslėlius.
Dėl šios didesnės įgūdžių įvairovės atsiveria daugybė galimybių. Pavyzdžiui, Dvyniai gali būti naudojami kuriant naują AI pokalbių robotų klasę, kuri gali suprasti ir reaguoti į tekstą ir vaizdus.
Tačiau ir „ChatGPT“, ir „Bing“ teikia tik tekstinį ryšį, o „Bing“ teikia atskirą nuorodą vaizdams kurti, tačiau neturi vaizdo palaikymo pokalbyje.
Priešingai nei ChatGPT, Dvyniai gali valdyti įvairesnius produktus ir programas. Jis gali būti naudojamas, pavyzdžiui, norint atnaujinti „Google“ paiešką arba sukurti pažangiausią virtualų asistentą, kuris naudoja AI. Šių funkcijų trūksta BingAI ir ChatGPT. Tačiau „ChatGPT“ teikia papildinius, kurie pagerina rezultatus.
Dvyniai taip pat turi tokias ypatybes kaip atmintis ir planavimas, leidžiančios kurti dirbtinio intelekto programas, kurios viršija ChatGPT galimybes.
Įspūdingos galimybės atsiranda, kai svarstote apie asmeninį Dvynių asistentą, kuris sektų jūsų pageidavimus ir padėtų kasdien planuoti. Tačiau norėdami pamatyti visą Dvynių potencialą ir ištirti jo atveriamas galimybes, pirmiausia turime nekantriai laukti jo viešo išleidimo.
Išvada
„Gemini“, naujos kartos „Google“ kalbų modelis, pasižymi išskirtinėmis daugiarūšėmis ypatybėmis, todėl yra labiau pritaikomas nei „ChatGPT“, tik teksto varžovas.
Gemini sukuria naujas galimybes pokalbių robotams ir AI programoms, leisdamas jiems skaityti ir kurti tekstą, kodą ir grafiką. Šios programos dabar gali valdyti didesnį veiklos spektrą. Priešingai nei Gemini, kuris palaiko ir vaizdus, ir daugiarūšes sąveikas, „ChatGPT“ ir „BingAI“ gali sąveikauti tik tekstu.
Nors konkretesnė informacija apie Gemini dar nepaskelbta, akivaizdu, kad „Google“ yra įsipareigojusi tobulinti AI technologiją ir išlaikyti savo lyderystę šioje srityje.
Tikimės, kad pamatysime visą Dvynių potencialą ir kūrybines galimybes, kurias jis atvers, kai su nekantrumu laukiame jo oficialaus pristatymo.
Palikti atsakymą