PaLM 2 – Næsta kynslóðar tungumálalíkan Google

Efnisyfirlit[Fela][Sýna]

Hvað er PaLM 2?+-
- PaLM 2 er fyrirsætafjölskylda
- Þjálfunargagnasett PaLM 2
PaLM 2 Helstu eiginleikar+-
PaLM 2 knýr Google vörur+-
- Bard
- Duet AI fyrir Google Workspace
Niðurstaða

Google hefur stöðugt verið í fararbroddi í rannsóknum á gervigreindum, nýtt mikla auðlindir sínar og ráðið til sín umtalsverðan fjölda hæfileikaríkra verkfræðinga. Hins vegar, hvað varðar tungumálalíkön, komu tilraunir Google seint til leiks.

Þar sem tæknirisinn Microsoft hefur þegar notið góðs af frjósömu samstarfi við OpenAI, átti Google ekkert val en að ná þessu.

Á Google I/O ráðstefnunni í ár tilkynnti fyrirtækið svar sitt við vígbúnaðarkapphlaupi gervigreindar: PaLM 2. Mun þetta nýja líkan mælast í frammistöðu við hlið OpenAI GPT-4?

Hvað er PaLM 2?

Google lýsir PALM 2 sem háþróað tungumálalíkan sem bætir núverandi PaLM líkan þeirra sem fyrst var tilkynnt árið 2022. Líkt og önnur tungumálalíkön er PaLM 2 fær um að framkvæma ýmis textagerð eins og PaLM er fær um að sinna margs konar verkefnum , þar á meðal að svara spurningum, þýða texta, búa til kóða, Og mikið meira.

Prófanir hafa sýnt að PaLM 2 sýnir nú þegar verulegar umbætur, sem er betri en PaLM líkanið en notar mun lægri fjölda breytu.

PaLM 2 er fyrirsætafjölskylda

Eins og önnur tungumálalíkön er PaLM 2 verkefnið í raun fjölskylda módela sem eru í stærð. Google mun útvega PaLM 2 líkanið í fjórum stærðum: Gecko, Otter, Bison og Unicorn.

Fjölbreytnin í stærðum gerir það auðvelt að nota PaLM 2 í ýmsum notkunartilfellum. Til dæmis er Gecko líkanið nógu létt til að allt líkanið geti passað í farsíma og jafnvel keyrt án nettengingar.

Þjálfunargagnasett PaLM 2

Einn mikilvægasti þátturinn í farsælu tungumálamódeli er þjálfunargagnasett. Þjálfunargagnagrunnurinn verður að vera nógu fjölbreyttur til að gera líkaninu kleift að hafa djúpan skilning á efninu sem það er hannað fyrir.

Fyrir stór tungumálalíkön (LLM) er venjulega ekkert sérstakt efni sem líkanið verður að þjálfa í. LLM eru þess í stað byggð til að vera almennar módel sem verða að vera hæf til að framkvæma fjölda verkefna. Þessi líkön nota stór textagagnasöfn sem fanga stóran hluta vefsins ásamt útgefnu viðmiðunarefni, bókmenntum og jafnvel frumkóða.

Helsti munurinn á þjálfunargagnagrunni PaLM 2 og öðrum gerðum er að hærra hlutfall af gögnum sem ekki eru á ensku eru tekin inn. Samkvæmt þeirra tæknileg skýrsla, með því að stækka gagnasafnið til að innihalda texta sem ekki eru á ensku, afhjúpar líkanið fjölbreyttari tungumál og menningu.

PaLM 2 líkanið var einnig þjálfað á samhliða fjöltyngdum gögnum til að hjálpa líkaninu að öðlast getu til að þýða frá einu tungumáli yfir á annað. Gögnin innihalda pör af texta þar sem önnur færslan er á ensku og hin er sambærilegur texti á öðru tungumáli.

Google notaði fjöltyngt gagnasafn

Taflan hér að ofan sýnir tungumáladreifingu fjöltyngdu vefskjala sem notuð eru til að þjálfa PaLM 2.

PaLM 2 Helstu eiginleikar

Hér eru nokkur af helstu sviðum sem PaLM 2 skarar fram úr í samanburði við önnur tungumálalíkön.

Rökstuðningur

Gagnapakki PaLM 2 inniheldur heimildir eins og vísindagreinar og vefefni með stærðfræðilegum tjáningum. Þetta gefur líkaninu aukna getu í stærðfræði, skynsemi og rökfræði.

Vísindamenn prófuðu stærðfræðilega rökhugsunarhæfileika líkansins á stærðfræðispurningum í grunnskóla og framhaldsskóla þar sem það sýnir sambærilegar niðurstöður og stærðfræðigetu GPT-4.

Kóðun

Þjálfunargögn PaLM 2 gefa því einnig möguleika á að búa til kóða á ýmsum forritunarmálum. PALM 2 teymið bjó til kóðunarsértækt PaLM 2 líkan sem kallast PaLM 2-S* sem var þjálfað á kóðaþungu fjöltyngdu gagnasafni.

kóða vefsíðu með PaLM 2

Líkanið er ekki aðeins fær um að búa til kóða heldur er það einnig fær um að takast á við verkefni sem fela í sér mörg tungumál. Til dæmis geturðu beðið PaLM 2 um að búa til Python flokkunaraðgerð sem bætir við línu fyrir línu athugasemdir á spænsku.

Fjöltyngi

Þar sem líkanið var þjálfað á gagnasafni sem inniheldur yfir 100 tungumál sýnir PaLM 2 færni í að skilja, búa til og þýða texta á mörgum tungumálum.

Til að prófa fjöltyngið prófuðu rannsakendur líkanið á ýmsum tungumálakunnáttuprófum á mismunandi tungumálum. Niðurstöðurnar sýna að PaLM 2 er ekki aðeins betri en PaLM heldur náði hún einnig lokaeinkunn fyrir hvert metið tungumál.

PaLM 2 árangur með tungumálakunnáttuprófum

PaLM 2 sýnir einnig fjöltyngda getu sína með hæfileika sínum til að skilja orðatiltæki á mismunandi tungumálum, útskýra brandara, laga innsláttarvillur og getur jafnvel lært hvernig á að breyta formlegum texta í talmálsspjall.

PaLM 2 knýr Google vörur

Google er nú þegar að nýta sér framfarir PaLM 2 með því að samþætta líkanið við aðrar vörur.

Bard

Geta líkansins til að takast á við fjöltyngd verkefni er nú að knýja Google Bárðartilraun þar sem það stækkar til yfir 180 landa og svæða.

Bárður knúinn af PaLM 2

Bard notar nú einnig kóðunargetu PaLM 2 til að aðstoða við forritunar- og hugbúnaðarþróunarverkefni eins og kóðagerð og kóðakembiforrit.

Duet AI fyrir Google Workspace

Google ætlar einnig að bæta við skapandi gervigreindum eiginleikum við Google Workspace forritahópinn sinn. Gmail og Docs munu brátt innihalda eiginleika sem kallast Duet AI sem mun hjálpa notandanum að leggja drög að svörum sínum og skrifum með leiðbeiningum.

PaLM 2 samþætt við Duet AI

Duet AI mun einnig gera notendum kleift að búa til sérsniðnar áætlanir í Google Sheets fyrir verkefni og verkefni byggð á leiðbeiningum frá notanda.

Niðurstaða

Google er örugglega að vonast til að loka bilinu á markaði gervigreindar tungumálatækja með PaLM 2 tungumálalíkani sínu. Þó að API líkansins sé ekki enn aðgengilegt opinberlega, sýna niðurstöður rannsókna þeirra að líkanið er nógu samkeppnishæft til að passa við frammistöðu GPT-4.

Með núverandi notendahópi Google hafa þeir vissulega þann kost að aðlagast gríðarlega ef gervigreind þeirra verður samþætt þjónustu þeirra eins og leitarvélina eða framleiðniverkfærin.

PaLM 2 – Googles Next Gener Language Model

PaLM 2 – Næsta kynslóð tungumálalíkans Google