Google geus konsistén tetep di forefront panalungtikan AI, leveraging sumberdaya vast sarta employing sajumlah badag insinyur top-bakat. Nanging, dina hal modél basa, usaha Google telat dugi ka buruan.
Kalayan raksasa téknologi Microsoft parantos nyandak kauntungan tina kerjasama anu suksés sareng OpenAI, Google henteu gaduh pilihan tapi nyusul.
Dina konferensi Google I/O taun ieu, pausahaan ngumumkeun jawaban na kana balapan leungeun AI generatif: PaLM 2. Naha modél anyar ieu bakal ngukur prestasi sareng OpenAI's GPT-4?
Naon PaLM 2?
Google ngajelaskeun PaLM 2 salaku modél basa canggih anu ningkatkeun modél PaLM anu tos aya anu mimiti diumumkeun dina taun 2022. Sarupa sareng modél basa anu sanés, PaLM 2 tiasa ngalaksanakeun rupa-rupa pancén ngahasilkeun téks sapertos PaLM mampuh sababaraha pancén. , kaasup ngajawab patarosan, narjamahkeun téks, kode ngahasilkeun, Sarta leuwih.
Tés geus ditémbongkeun yén PaLM 2 geus nembongkeun perbaikan signifikan, outperforming model PaLM bari ngagunakeun jumlah leuwih handap parameter.
PaLM 2 mangrupikeun Kulawarga Model
Sapertos model basa anu sanés, proyék PaLM 2 saleresna mangrupikeun kulawarga modél anu ukuranana. Google bakal nyayogikeun modél PaLM 2 dina opat ukuran: Gecko, Otter, Bison, sareng Unicorn.
Rupa-rupa ukuran ngagampangkeun nyebarkeun PaLM 2 dina sababaraha kasus pamakean. Contona, model Gecko cukup lightweight yén sakabéh modél bisa pas dina alat mobile na malah ngajalankeun offline.
Dataset Pelatihan PaLM 2
Salah sahiji aspék anu paling penting tina modél basa anu suksés nyaéta susunan data latihan. Setét latihan kedah cukup rupa-rupa pikeun ngamungkinkeun modél gaduh pamahaman anu jero ngeunaan topik anu dirarancang.
Pikeun modél basa ageung (LLM), biasana henteu aya topik khusus anu kedah dilatih pikeun modél. LLM didamel janten modél tujuan umum anu kedah pas pikeun ngalaksanakeun sababaraha pancén. Modél ieu ngagunakeun set data tékstual anu ageung anu nyandak sabagian ageung wéb ogé bahan rujukan anu diterbitkeun, literatur, sareng bahkan kode sumber.
Beda utama antara set data latihan PaLM 2 sareng model anu sanés nyaéta kalebet persentase data non-Inggris anu langkung luhur. Numutkeun maranéhna laporan teknis, ngalegaan dataset ka ngawengku téks non-Inggris ngalaan model ka rupa-rupa lega tina basa jeung budaya.
Model PaLM 2 ogé dilatih dina data multibasa paralel pikeun mantuan modél mangtaun kamampuhan pikeun narjamahkeun tina hiji basa ka nu sejen. Datana kalebet pasangan téks dimana hiji éntri dina basa Inggris sareng anu sanésna mangrupikeun téks anu sami dina basa sanés.
Tabél di luhur nunjukkeun distribusi basa tina dokumén wéb multibasa anu digunakeun pikeun ngalatih PaLM 2.
PaLM 2 Fitur konci
Di dieu aya sababaraha wewengkon utama nu PaLM 2 unggul dina dibandingkeun model basa séjén.
Alesanna
Dataset PaLM 2 kalebet sumber sapertos makalah ilmiah sareng eusi wéb kalayan ekspresi matematik. Hal ieu méré modél kamampuhan ningkat dina matematika, akal sehat, jeung logika.
Panaliti nguji kamampuan nalar matematika modél dina patarosan matematika SMA sareng SMA dimana éta nunjukkeun hasil anu sarimbag sareng kamampuan matematika GPT-4.
coding
Data latihan PaLM 2 ogé masihan kamampuan pikeun ngahasilkeun kode dina sababaraha basa program. Tim PALM 2 nyiptakeun modél PaLM 2 khusus coding anu disebut PaLM 2-S* anu dilatih dina set data multibasa anu beurat kode.
Henteu ngan éta modél sanggup ngahasilkeun kode, tapi ogé tiasa ngadamel tugas anu ngalibetkeun sababaraha basa. Salaku conto, anjeun tiasa naroskeun PaLM 2 pikeun nyiptakeun fungsi asihan Python anu nambihan koméntar baris-demi-garis dina basa Spanyol.
Multilinguality
Kusabab model ieu dilatih dina susunan data nu ngawengku leuwih 100 basa, PaLM 2 nembongkeun kamahéran dina pamahaman, generating, jeung narjamahkeun téks sakuliah sababaraha basa.
Pikeun nguji multibasa, panalungtik nguji modél dina sababaraha tés kamahéran basa dina basa anu béda. Hasilna nunjukkeun yén PaLM 2 henteu ngan ukur ngaunggulan PaLM tapi ogé ngahontal peunteun lulus pikeun unggal basa anu dievaluasi.
PaLM 2 ogé nunjukkeun kamampuan multibasana ku kamampuan ngartos idiom dina basa anu béda-béda, ngajelaskeun guyonan, ngalereskeun typo, bahkan tiasa diajar kumaha ngarobih téks formal kana obrolan sapopoe.
PaLM 2 Powers Produk Google
Google parantos ngamangpaatkeun kamajuan PaLM 2 ku ngahijikeun modél sareng produk sanés.
Bard
Kamampuh modél pikeun nanganan tugas multibasa ayeuna ngawasa Google percobaan Bard sakumaha eta expands ka leuwih 180 nagara jeung wewengkon.
Bard ayeuna ogé ngagunakeun kamampuan coding PaLM 2 pikeun ngabantosan tugas pemrograman sareng pamekaran parangkat lunak sapertos generasi kode sareng debugging kode.
Duet AI pikeun Google Workspace
Google ogé ngarencanakeun pikeun nambihan fitur AI generatif kana grup aplikasi Google Workspace na. Gmail sareng Docs bakal enggal kalebet fitur anu disebut Duet AI anu bakal ngabantosan pangguna nyusun balesan sareng nyeratna nganggo pituduh.
Duet AI ogé bakal ngamungkinkeun para pangguna nyiptakeun rencana khusus dina Google Sheets pikeun tugas sareng proyék dumasar kana pituduh anu dipasihkeun ku pangguna.
kacindekan
Google pasti ngaharepkeun pikeun nutup celah di pasar alat basa AI sareng modél basa PaLM 2 na. Sanaos model'sAPI henteu acan sayogi pikeun umum, hasil tina panalungtikanana nunjukkeun yén modél éta cukup kompetitif pikeun cocog sareng kinerja GPT-4.
Kalayan basis pangguna Google anu tos aya, aranjeunna pasti gaduh kauntungan tina adaptasi anu ageung upami AI na diintegrasikeun kana jasa sapertos mesin pencari atanapi suite alat produktivitasna.
Leave a Reply