Google baqgħet b'mod konsistenti minn ta' quddiem fir-riċerka tal-IA, u uża r-riżorsi vasti tagħha u impjega numru sostanzjali ta' inġiniera tal-aqwa talent. Madankollu, f'termini ta 'mudelli lingwistiċi, l-isforzi ta' Google kienu tard fil-logħba.
Bil-ġgant teknoloġiku Microsoft diġà qed jibbenefika minn sħubija produttiva ma 'OpenAI, Google ma kellhiex għażla ħlief li tlaħħaq.
Fil-konferenza Google I/O ta 'din is-sena, il-kumpanija ħabbret it-tweġiba tagħha għat-tellieqa għall-armi AI ġenerattiva: PaLM 2. Dan il-mudell il-ġdid se jkejjel fil-prestazzjoni flimkien mal-GPT-4 ta' OpenAI?
X'inhu PaLM 2?
Google jiddeskrivi PALM 2 bħala mudell lingwistiku avvanzat li jtejjeb il-mudell eżistenti PaLM tagħhom imħabbra għall-ewwel darba fl-2022. Simili għal mudelli lingwistiċi oħra, PaLM 2 huwa kapaċi jwettaq diversi kompiti ta 'ġenerazzjoni ta' test bħal PaLM huwa kapaċi għal firxa wiesgħa ta 'kompiti , inkluż it-tweġib tal-mistoqsijiet, it-traduzzjoni tat-test, jiġġenera kodiċi, U ħafna aktar.
It-testijiet wrew li l-PaLM 2 diġà juri titjib sinifikanti, li jaqbeż il-mudell PaLM filwaqt li juża numru ferm inqas ta 'parametri.
PaLM 2 hija Familja ta' Mudelli
Bħal mudelli lingwistiċi oħra, il-proġett PaLM 2 huwa fil-fatt familja ta 'mudelli li jvarjaw fid-daqs. Google se tipprovdi l-mudell PaLM 2 f'erba' daqsijiet: Gecko, Otter, Bison, u Unicorn.
Il-varjetà fid-daqsijiet tagħmilha faċli biex jintuża PaLM 2 f'diversi każijiet ta' użu. Pereżempju, il-mudell Gecko huwa ħafif biżżejjed li l-mudell kollu jista 'jiffittja f'apparat mobbli u anke jaħdem offline.
Sett tad-Data tat-Taħriġ tal-PaLM 2
Wieħed mill-aktar aspetti importanti ta’ mudell lingwistiku ta’ suċċess huwa l- dataset tat-taħriġ. Is-sett tad-dejta tat-taħriġ għandu jkun divers biżżejjed biex jippermetti li l-mudell ikollu fehim profond tas-suġġett li huwa ddisinjat għalih.
Għal mudelli tal-lingwa kbira (LLMs), tipikament ma jkun hemm l-ebda suġġett speċifiku li l-mudell irid jitħarreġ fuqu. L-LLMs huma minflok mibnija biex ikunu mudelli għal skopijiet ġenerali li jridu jkunu tajbin biex iwettqu numru wiesa' ta' kompiti. Dawn il-mudelli jużaw settijiet ta' dejta testwali kbar li jaqbdu porzjon kbir tal-web kif ukoll materjal ta' referenza ppubblikati, letteratura, u anke kodiċi tas-sors.
Id-differenza ewlenija bejn is-sett tad-dejta tat-taħriġ ta 'PaLM 2 u mudelli oħra hija l-inklużjoni ta' persentaġġ ogħla ta 'dejta mhux bl-Ingliż. Skond tagħhom rapport tekniku, l-espansjoni tas-sett tad-dejta biex tinkludi testi mhux Ingliżi tesponi l-mudell għal varjetà usa 'ta' lingwi u kulturi.
Il-mudell PaLM 2 ġie mħarreġ ukoll fuq data multilingwi parallela biex jgħin lill-mudell jikseb il-kapaċità li jittraduċi minn lingwa għal oħra. Id-dejta tinkludi pari ta’ testi fejn daħla waħda tkun bl-Ingliż u l-oħra hija test ekwivalenti f’lingwa oħra.
It-tabella ta’ hawn fuq turi d-distribuzzjoni lingwistika tad-dokumenti tal-web multilingwi użati għat-taħriġ tal-PaLM 2.
PaLM 2 Karatteristiċi Ewlenin
Hawn huma xi wħud mill-oqsma ewlenin li PaLM 2 jeċċella fihom meta mqabbel ma 'mudelli lingwistiċi oħra.
Raġunament
Is-sett tad-dejta tal-PaLM 2 jinkludi sorsi bħal karti xjentifiċi u kontenut tal-web b'espressjonijiet matematiċi. Dan jagħti lill-mudell kapaċitajiet imtejba fil-matematika, ir-raġunament tas-sens komun, u l-loġika.
Ir-riċerkaturi ttestjaw l-abbiltajiet ta 'raġunament matematiku tal-mudell fuq mistoqsijiet tal-matematika tal-iskola grad u sekondarja fejn juri riżultati komparabbli mal-kapaċitajiet tal-matematika ta' GPT-4.
Kodifikazzjoni
Id-dejta tat-taħriġ ta 'PaLM 2 tagħtiha wkoll il-kapaċità li tiġġenera kodiċi f'varjetà ta' lingwi ta 'programmar. It-tim PALM 2 ħoloq mudell PaLM 2 speċifiku għall-kodifikazzjoni msejjaħ PaLM 2-S* li kien imħarreġ fuq dataset multilingwi b'ħafna kodiċi.
Mhux biss il-mudell huwa kapaċi jiġġenera kodiċi, iżda huwa wkoll kapaċi jimmaniġġja ħidmiet li jinvolvu lingwi multipli. Pereżempju, tista 'titlob lil PaLM 2 biex toħloq funzjoni ta' għażla Python li żżid kummenti linja b'linja bl-Ispanjol.
Multilingwalità
Peress li l-mudell ġie mħarreġ fuq dataset li jinkludi aktar minn 100 lingwa, PaLM 2 juri profiċjenza fil-fehim, il-ġenerazzjoni u t-traduzzjoni ta’ test f’diversi lingwi.
Biex jittestjaw il-multilingwiżmu, ir-riċerkaturi ttestjaw il-mudell fuq diversi testijiet tal-profiċjenza tal-lingwa f'lingwi differenti. Ir-riżultati juru li mhux biss il-PaLM 2 jissupera lill-PaLM iżda wkoll kiseb grad ta' tgħaddi għal kull lingwa evalwata.
PaLM 2 juri wkoll il-kapaċitajiet multilingwi tiegħu bil-kapaċità tiegħu li jifhem idjomi f'lingwi differenti, jispjega ċajt, jiffissa typos, u jista 'saħansitra jitgħallmu kif jikkonverti test formali għal chat kolokwali.
PaLM 2 Jagħti s-setgħa lill-Prodotti Google
Google diġà qed tieħu vantaġġ mill-avvanzi ta 'PaLM 2 billi tintegra l-mudell ma' prodotti oħra.
Bard
Il-kapaċità tal-mudell li jimmaniġġja kompiti multilingwi issa qed iħaddem lil Google Bard esperiment hekk kif jespandi għal aktar minn 180 pajjiż u territorju.
Bard issa qed juża wkoll il-kapaċitajiet ta' kodifikazzjoni ta' PaLM 2 biex jassisti f'ħidmiet ta' programmazzjoni u żvilupp ta' softwer bħall-ġenerazzjoni tal-kodiċi u d-debugging tal-kodiċi.
Duet AI għal Google Workspace
Google qed tippjana wkoll li żżid karatteristiċi AI ġenerattivi mal-grupp ta 'applikazzjonijiet Google Workspace tagħha. Gmail u Docs dalwaqt se jinkludu karatteristika msejħa Duet AI li se jgħin lill-utent jabbozza t-tweġibiet u l-kitba tiegħu billi juża prompts.
Duet AI se jippermetti wkoll lill-utenti joħolqu pjanijiet personalizzati f'Google Sheets għal kompiti u proġetti bbażati fuq prompts mogħtija mill-utent.
konklużjoni
Google żgur qed tittama li tnaqqas id-distakk fis-suq tal-għodod tal-lingwa AI bil-mudell tal-lingwa PaLM 2 tagħhom. Filwaqt li l-API tal-mudell għadu mhux disponibbli pubblikament, ir-riżultati mir-riċerka tagħhom juru li l-mudell huwa kompetittiv biżżejjed biex jaqbel mal-prestazzjoni tal-GPT-4.
Bil-bażi ta 'utenti eżistenti ta' Google, ċertament għandhom il-vantaġġ ta 'adattament massiv jekk l-AI tagħhom tiġi integrata fis-servizzi tagħhom bħall-magna tat-tiftix tagħhom jew is-sett ta' għodod ta 'produttività tagħhom.
Ħalli Irrispondi