Google terus-terusan tetep ana ing ngarep riset AI, nggunakake sumber daya sing akeh lan nggunakake akeh insinyur sing duwe bakat. Nanging, babagan model basa, upaya Google wis telat ing game kasebut.
Kanthi raksasa teknologi Microsoft sing wis entuk manfaat saka kemitraan sing apik karo OpenAI, Google ora duwe pilihan kajaba kanggo nggayuh.
Ing konferensi Google I/O taun iki, perusahaan ngumumake jawaban kanggo balapan senjata generatif AI: PaLM 2. Apa model anyar iki bakal ngukur kinerja bebarengan karo OpenAI's GPT-4?
Apa PaLM 2?
Google nerangake PALM 2 minangka model basa paling canggih sing nambah model PaLM sing wis ana sing pisanan diumumake ing 2022. Kaya model basa liyane, PaLM 2 bisa nindakake macem-macem tugas nggawe teks kayata PaLM sing bisa nindakake macem-macem tugas. , kalebu mangsuli pitakon, nerjemahake teks, kode ngasilaken, lan akeh liyane.
Tes wis nuduhake yen PaLM 2 wis nuduhake dandan sing signifikan, ngluwihi model PaLM nalika nggunakake paramèter sing luwih murah.
PaLM 2 minangka Kulawarga Model
Kaya model basa liyane, proyek PaLM 2 sejatine minangka kulawarga model sing ukurane. Google bakal nyedhiyakake model PaLM 2 ing papat ukuran: Gecko, Otter, Bison, lan Unicorn.
Macem-macem ukuran nggampangake nyebarake PaLM 2 ing macem-macem kasus panggunaan. Contone, model Gecko cukup entheng supaya kabeh model bisa pas ing piranti seluler lan malah mbukak offline.
Dataset Pelatihan PaLM 2
Salah sawijining aspek sing paling penting saka model basa sing sukses yaiku training dataset. Dataset latihan kudu cukup maneka warna supaya model nduweni pangerten sing jero babagan subyek sing dirancang.
Kanggo model basa gedhe (LLM), biasane ora ana topik tartamtu sing model kudu dilatih. LLM malah dibangun dadi model tujuan umum sing kudu pas kanggo nindakake macem-macem tugas. Model kasebut nggunakake set data teks gedhe sing njupuk bagean gedhe saka web uga materi referensi, literatur, lan malah kode sumber sing diterbitake.
Bentenane utama antarane dataset latihan PaLM 2 lan model liyane yaiku kalebu persentase data non-Inggris sing luwih dhuwur. Miturut wong-wong mau laporan teknis, ngembangaken dataset kanggo nyakup teks non-Inggris mbabarake model kanggo macem-macem basa lan budaya luwih akeh.
Model PaLM 2 uga dilatih babagan data multibasa paralel kanggo mbantu model entuk kemampuan nerjemahake saka basa siji menyang basa liyane. Data kasebut kalebu pasangan teks sing siji entri ing basa Inggris lan liyane minangka teks sing padha ing basa liyane.
Tabel ing ndhuwur nuduhake distribusi basa saka dokumen web multibasa sing digunakake kanggo nglatih PaLM 2.
Fitur Utama PaLM 2
Kene sawetara saka wilayah utama sing PaLM 2 unggul ing dibandhingake model basa liyane.
Alesan
Dataset PaLM 2 kalebu sumber kayata makalah ilmiah lan konten web kanthi ekspresi matematika. Iki menehi model kabisan sing luwih apik ing matematika, nalar akal sehat, lan logika.
Peneliti nguji kabisan penalaran matématika model ing pitakonan matématika sekolah kelas lan sekolah menengah sing nuduhaké asil sing bisa dibandhingake karo kabisan matématika GPT-4.
Coding
Data latihan PaLM 2 uga menehi kemampuan kanggo ngasilake kode ing macem-macem basa program. Tim PALM 2 nggawe model PaLM 2 khusus coding sing diarani PaLM 2-S* sing dilatih ing set data multibasa sing akeh kode.
Ora mung model sing bisa nggawe kode, nanging uga bisa nangani tugas sing kalebu macem-macem basa. Contone, sampeyan bisa takon PaLM 2 nggawe fungsi ngurutake Python sing nambah komentar baris-by-line ing Spanyol.
Multilinguality
Wiwit model kasebut dilatih ing set data sing kalebu luwih saka 100 basa, PaLM 2 nuduhake keahlian babagan pemahaman, ngasilake, lan nerjemahake teks ing pirang-pirang basa.
Kanggo nguji multibasa, para panaliti nguji model kasebut ing macem-macem tes kemampuan basa ing macem-macem basa. Asil kasebut nuduhake yen PaLM 2 ora mung ngluwihi PaLM nanging uga entuk biji kanggo saben basa sing dievaluasi.
PaLM 2 uga nuduhake kemampuan multibasa kanthi kemampuan kanggo mangerteni idiom ing basa sing beda-beda, njelasake lelucon, ndandani kesalahan ketik, lan malah bisa sinau carane ngowahi teks resmi dadi obrolan sehari-hari.
PaLM 2 Powers Produk Google
Google wis njupuk kauntungan saka kemajuan PaLM 2 kanthi nggabungake model kasebut karo produk liyane.
Bard
Kemampuan model kanggo nangani tugas multibasa saiki nguwasani Google Eksperimen Bard amarga ngembangake luwih saka 180 negara lan wilayah.
Bard saiki uga nggunakake kapabilitas coding PaLM 2 kanggo mbantu tugas pemrograman lan pangembangan piranti lunak kayata nggawe kode lan debugging kode.
Duet AI kanggo Google Workspace
Google uga ngrancang nambah fitur AI generatif menyang grup aplikasi Google Workspace. Gmail lan Docs bakal enggal kalebu fitur sing diarani Duet AI sing bakal mbantu pangguna ngrancang balesan lan nulis kanthi nggunakake pituduh.
Duet AI uga bakal ngidini pangguna nggawe rencana khusus ing Google Sheets kanggo tugas lan proyek adhedhasar pituduh sing diwenehake dening pangguna.
kesimpulan
Google mesthi ngarep-arep kanggo nutup celah ing pasar alat basa AI kanthi model basa PaLM 2. Nalika model'sAPI durung kasedhiya kanggo umum, asil riset nuduhake manawa model kasebut cukup kompetitif kanggo cocog karo kinerja GPT-4.
Kanthi basis pangguna Google sing wis ana, mesthine duwe kaluwihan adaptasi gedhe yen AI digabungake menyang layanan kayata mesin telusur utawa piranti produktivitas.
Ninggalake a Reply