Преглед садржаја[Сакрити][Прикажи]
23. Гоогле И/О је било прилично узбудљиво! У области вештачке интелигенције представили су неколико важних напредака.
Конкуренција између ОпенАИ-јевог ГПТ-4 и Гоогле-овог Геминија била је једно од најзначајнијих открића. Након њиховог постојања ПаЛМ 2 система, Гемини је модел великог језика (ЛЛМ) следеће генерације.
Модел машинског учења је побољшао Гоогле, чинећи га још софистициранијим. Да би се такмичили са Мицрософтовим Бинг побољшањима, они такође додају генеративне АИ могућности у Андроид и појачавају Гоогле претрагу помоћу вештачке интелигенције.
Да би Гоогле Бард био конкурентнији са другима цхат ботови као што је ЦхатГПТ, најавили су значајно побољшање за то током догађаја. Бард ће на крају подржавати још 40 језика, укључујући корејски и јапански. Са овим проширењем, Бард ће моћи да подржи програмере било где.
Поред тога, да би побољшао своје одговоре на захтеве корисника, Бард ће сада нудити слике, мапе и другу графику. За све програмере, то ће бити од огромне помоћи. Овде ћемо испитати специфичности ЛЛМ Гемини.
Шта су Близанци?
Према гоогле, Гемини је замишљен од самог почетка да буде мултимодалан, веома ефикасан у смислу повезивања алата и АПИ-ја, и спреман за будућа унапређења као што су меморија и планирање. Гоогле је у свом блог посту навео да Гемини већ има изванредне мултимодалне могућности које претходни модели нису имали.
„Када фино подесимо и темељно тестирамо Гемини за безбедност, понудићемо га у различитим величинама и могућностима, слично као код ПаЛМ 2“, рекао је Гугл.
Као резултат тога, може се применити на више производа, апликација и уређаја како би свима био од користи.“
На конференцији су представили ПаЛМ 2, најсавременији језички модел са проширеним вишејезичним могућностима, резоновањем и кодирањем. Био је опсежно обучен са вишејезичним материјалом са преко 100 језика.
ПаЛМ 2 може произвести и превести суптилне садржаје као што су идиоми, поезија и загонетке на различите језике.
Гемини ће вероватно појачати Гооглеове напоре АИ и изазвати пионира, ОпенАИ ЦхатГПТ. Док се ЦхатГПТ углавном користи за текстуалне разговоре, Гемини је мултимодалан, што значи да може да реагује и на текст и на визуелне приказе. Једном интегрисан са Гоогле претрагом, има потенцијал да трансформише начин на који потрошачи комуницирају са популарним претраживачем.
Иако даљи детаљи о Гемини-ју још нису доступни, он може надмашити ЦхатГПТ и Бинг АИ, што ће Гуглу довести на чело области АИ.
Сундар Пицхаи, извршни директор Гоогле-а, приметио је током конференције: „Након седам година постојања компаније која је прва у области вештачке интелигенције, налазимо се на узбудљивој прекретници.
Близанци сада пролазе обуку, према Пицхаију, и креира се са мултимодалним приступом са циљем да буде изузетно ефикасан и отвори врата за будући напредак попут памћења и планирања. Гемини већ показује изванредне мултимодалне могућности које су биле одсутне у ранијим верзијама, према Пицхаију, чак и ако је још у раним фазама.
Гугл даје упутства Близанцима преко својих ТПУ (чипова). Пицхаи је навео да ће након што Гемини буде оптимизован и прође безбедносне инспекције, бити доступан у низу величина и капацитета, иако није помињан конкретан датум објављивања.
Пицхаи је јасно ставио до знања да ће сви Гоогле-ови АИ модели укључити водени жиг и метаподатке у излазе, као што су слике, како би се спречило ширење нетачних информација.
Оно што Близанци чини супериорнијим ЦхатГПТ и БингАИ?
Близанци имају неколико интригантних „мултимодалних“ карактеристика. Гемини, за разлику од ЦхатГПТ-а, који може само да чита и производи текст, заснован је на мултимодалној парадигми и може да разуме и производи текст, код и слике.
Бројне могућности су омогућене овим ширим спектром вештина. Близанци, на пример, могу да се користе за стварање нове класе АИ цхат робота који могу да разумеју и реагују на текст и визуелне елементе.
Међутим, и ЦхатГПТ и Бинг пружају само комуникацију засновану на тексту, при чему Бинг обезбеђује засебну везу за креирање слика, али нема подршку за слике у ћаскању.
Близанци могу да обрађују шири спектар производа и апликација за разлику од ЦхатГПТ-а. Може се користити, на пример, за надоградњу Гоогле претраге или креирање врхунског виртуелног асистента који користи вештачку интелигенцију. Ове функције недостају у БингАИ-у и ЦхатГПТ-у. ЦхатГПТ, међутим, пружа додатке који побољшавају резултате.
Гемини такође поседује карактеристике као што су меморија и планирање, омогућавајући развој апликација са вештачком интелигенцијом које превазилазе оно за шта је ЦхатГПТ способан.
Узбудљиве могућности се појављују када размислите о томе да имате личног асистента који покреће Близанци који прати ваше жеље и помаже у свакодневном планирању. Међутим, да бисмо видели пун потенцијал Близанаца и истражили могућности које отвара, прво морамо нестрпљиво чекати његово јавно објављивање.
Zakljucak
Гемини, Гоогле-ов језички модел следеће генерације, показао је изванредне мултимодалне карактеристике, чинећи га прилагодљивијим од ЦхатГПТ-а, његовог ривала само за текст.
Гемини ствара нове могућности за цхат ботове и АИ апликације омогућавајући им да читају и производе текст, код и графику. Ове апликације сада могу управљати већим спектром активности. За разлику од Геминија, који подржава и слике и мултимодалне интеракције, ЦхатГПТ и БингАИ су способни само за интеракције засноване на тексту.
Иако конкретније информације о Близанцима још нису објављене у јавности, јасно је да је Гугл посвећен унапређењу АИ технологије и одржавању водеће позиције у овој области.
Очекујемо да ћемо видети пун потенцијал Близанаца и креативне могућности које отвара док узбуђено ишчекујемо његово званично лансирање.
Ostavite komentar