Змест[Схаваць][Паказаць]
,en 23-я I/O Google было вельмі захапляльна! У галіне штучнага інтэлекту яны прадставілі некалькі важных дасягненняў.
Канкурэнцыя паміж GPT-4 ад OpenAI і Gemini ад Google стала адным з самых значных адкрыццяў. Пасля іх існавання ДАЛОНЬ 2 Gemini - гэта вялікая моўная мадэль (LLM) наступнага пакалення.
Google удасканаліў мадэль машыннага навучання, зрабіўшы яе яшчэ больш складанай. Каб канкурыраваць з паляпшэннямі Bing ад Microsoft, яны таксама дадаюць генератыўныя магчымасці штучнага інтэлекту ў Android і пашыраюць пошук Google з дапамогай штучнага інтэлекту.
Каб зрабіць Google Bard больш канкурэнтаздольным з іншымі чат-боты, такія як ChatGPT, падчас мерапрыемства яны абвясцілі аб значным паляпшэнні. У рэшце рэшт Bard будзе падтрымліваць яшчэ 40 моў, у тым ліку карэйскую і японскую. Дзякуючы гэтаму пашырэнню Bard зможа падтрымліваць распрацоўшчыкаў дзе заўгодна.
Акрамя таго, каб палепшыць свае адказы на запыты карыстальнікаў, Bard цяпер прапануе выявы, карты і іншую графіку. Для ўсіх распрацоўшчыкаў гэта будзе велізарнай дапамогай. Тут мы разгледзім спецыфіку LLM Gemini.
Што такое Двайняты?
па Google, Gemini з нуля быў задуманы як мультымадальны, вельмі эфектыўны з пункту гледжання падключэння інструментаў і API і гатовы да будучых удасканаленняў, такіх як памяць і планаванне. Google заявіў у сваім паведамленні ў блогу, што Gemini ўжо мае выдатныя мультымадальныя магчымасці, якіх не было ў папярэдніх мадэляў.
«Пасля таго як мы наладзім і старанна праверым Gemini на бяспеку, мы будзем прапаноўваць яго ў розных памерах і магчымасцях, падобных да PaLM 2», - сказаў Google.
У выніку гэта можа быць рэалізавана ў розных прадуктах, праграмах і прыладах, каб прынесці карысць усім».
На канферэнцыі яны прадставілі PaLM 2, перадавую моўную мадэль з пашыранымі шматмоўнымі магчымасцямі, магчымасцямі мыслення і кадавання. Ён праходзіў інтэнсіўнае навучанне з дапамогай шматмоўнага матэрыялу з больш чым 100 моў.
PaLM 2 можа ствараць і перакладаць тонкае змесціва, такое як ідыёмы, вершы і загадкі, на розныя мовы.
Gemini, хутчэй за ўсё, паспрыяе намаганням Google у галіне штучнага інтэлекту і кіне выклік першапраходцу, ChatGPT ад OpenAI. У той час як ChatGPT у асноўным выкарыстоўваецца для тэкставых размоў, Gemini з'яўляецца мультымадальным, што азначае, што ён можа рэагаваць як на тэкст, так і на візуальныя элементы. Пасля інтэграцыі з Google Search ён можа змяніць тое, як спажыўцы ўзаемадзейнічаюць з папулярнай пошукавай сістэмай.
Хаця дадатковыя падрабязнасці аб Gemini пакуль недаступныя, ён можа перасягнуць ChatGPT і Bing AI, вывеўшы Google на лідзіруючае месца ў галіне штучнага інтэлекту.
Сундар Пічаі, генеральны дырэктар Google, заўважыў падчас канферэнцыі: «Пасля сямі гадоў таго, як мы былі кампаніяй, у першую чаргу AI, мы апынуліся ў захапляльным паваротным пункце».
Па словах Пічаі, Gemini зараз праходзіць навучанне, і ён ствараецца з выкарыстаннем мультымадальнага падыходу з мэтай быць надзвычай эфектыўным і адкрываць дзверы для будучых дасягненняў, такіх як памяць і планаванне. Па словах Пічаі, Gemini ужо дэманструе выдатныя мультымадальныя магчымасці, якіх не было ў больш ранніх версіях, нават калі ён усё яшчэ знаходзіцца на ранніх стадыях.
Google інструктуе Gemini праз свой TPU (чыпы). Пічаі заявіў, што пасля таго, як Gemini будзе аптымізаваны і пройдзе праверку бяспекі, ён будзе даступны ў розных памерах і ёмістасцях, хоць канкрэтная дата выпуску не згадваецца.
Пічаі даў зразумець, што ўсе мадэлі штучнага інтэлекту Google будуць уключаць вадзяныя знакі і метададзеныя ў выходных дадзеных, такіх як выявы, каб прадухіліць распаўсюджванне няправільнай інфармацыі.
Чым Блізняты пераўзыходзяць Чат GPT і BingAI?
Двайняты маюць некалькі інтрыгуючых «мультымадальных» характарыстык. Gemini, у адрозненне ад ChatGPT, які можа толькі чытаць і ствараць тэкст, заснаваны на мультымадальнай парадыгме і можа разумець і ствараць тэкст, код і выявы.
Шматлікія магчымасці адкрываюцца дзякуючы гэтаму шырокаму спектру навыкаў. Gemini, напрыклад, можна выкарыстоўваць для стварэння новага класа чат-ботаў штучнага інтэлекту, якія могуць разумець і рэагаваць як на тэкст, так і на візуальныя элементы.
Тым не менш, і ChatGPT, і Bing забяспечваюць толькі тэкставую сувязь, пры гэтым Bing забяспечвае асобную спасылку для стварэння малюнкаў, але не мае падтрымкі малюнкаў у чаце.
Gemini можа працаваць з больш шырокім спектрам прадуктаў і прыкладанняў у адрозненне ад ChatGPT. Яго можна выкарыстоўваць, напрыклад, для абнаўлення Google Search або для стварэння сучаснага віртуальнага памочніка, які выкарыстоўвае штучны інтэлект. Гэтыя функцыі адсутнічаюць у BingAI і ChatGPT. ChatGPT, аднак, забяспечвае плагіны, якія паляпшаюць вынікі.
Gemini таксама валодае такімі характарыстыкамі, як памяць і планаванне, што дазваляе распрацоўваць прыкладанні на аснове штучнага інтэлекту, якія выходзяць за рамкі таго, на што здольны ChatGPT.
Захапляльныя магчымасці адкрываюцца, калі вы разглядаеце магчымасць мець асабістага памочніка на базе Gemini, які адсочвае вашы перавагі і дапамагае ў штодзённым планаванні. Аднак, каб убачыць увесь патэнцыял Gemini і даследаваць магчымасці, якія ён адкрывае, мы павінны спачатку з нецярпеннем дачакацца яго публічнага выпуску.
заключэнне
Gemini, моўная мадэль наступнага пакалення Google, прадэманстравала выдатныя мультымадальныя функцыі, што робіць яе больш адаптыўнай, чым ChatGPT, яе канкурэнт толькі для тэксту.
Gemini стварае новыя магчымасці для чат-ботаў і праграм AI, дазваляючы ім чытаць і ствараць тэкст, код і графіку. Цяпер гэтыя прыкладанні могуць кіраваць больш шырокім спектрам дзеянняў. У адрозненне ад Gemini, які падтрымлівае як выявы, так і шматмадальнае ўзаемадзеянне, ChatGPT і BingAI здольныя ўзаемадзейнічаць толькі на аснове тэксту.
Хаця больш канкрэтная інфармацыя аб Gemini яшчэ не была апублікаваная, відавочна, што Google імкнецца развіваць тэхналогію штучнага інтэлекту і захоўваць лідэрства ў гэтай галіне.
Мы спадзяемся ўбачыць увесь патэнцыял Gemini і творчыя магчымасці, якія ён адкрывае, калі мы з хваляваннем чакаем яго афіцыйнага запуску.
Пакінуць каментар