Google secara konsisten kekal di barisan hadapan dalam penyelidikan AI, memanfaatkan sumbernya yang luas dan menggunakan sejumlah besar jurutera berbakat tinggi. Walau bagaimanapun, dari segi model bahasa, usaha Google terlambat untuk permainan.
Dengan gergasi teknologi Microsoft yang telah mendapat manfaat daripada perkongsian yang bermanfaat dengan OpenAI, Google tidak mempunyai pilihan selain mengejarnya.
Pada persidangan Google I/O tahun ini, syarikat itu mengumumkan jawapannya kepada perlumbaan senjata AI generatif: PaLM 2. Adakah model baharu ini akan mengukur prestasi bersama GPT-4 OpenAI?
Apakah PaLM 2?
Google menerangkan PaLM 2 sebagai model bahasa tercanggih yang menambah baik pada model PaLM sedia ada mereka yang pertama kali diumumkan pada 2022. Sama seperti model bahasa lain, PaLM 2 mampu melaksanakan pelbagai tugas penjanaan teks seperti PaLM mampu melakukan pelbagai tugas , termasuk menjawab soalan, menterjemah teks, menjana kod, dan banyak lagi.
Ujian telah menunjukkan bahawa PaLM 2 telah menunjukkan peningkatan yang ketara, mengatasi prestasi model PaLM sambil menggunakan bilangan parameter yang jauh lebih rendah.
PaLM 2 ialah Keluarga Model
Seperti model bahasa lain, projek PaLM 2 sebenarnya adalah keluarga model yang mempunyai julat saiz. Google akan menyediakan model PaLM 2 dalam empat saiz: Gecko, Otter, Bison dan Unicorn.
Kepelbagaian saiz menjadikannya mudah untuk menggunakan PaLM 2 dalam pelbagai kes penggunaan. Sebagai contoh, model Gecko cukup ringan sehingga keseluruhan model boleh dimuatkan dalam peranti mudah alih dan juga dijalankan di luar talian.
Set Data Latihan PaLM 2
Salah satu aspek terpenting dalam model bahasa yang berjaya ialah set data latihan. Set data latihan mestilah cukup pelbagai untuk membolehkan model mempunyai pemahaman yang mendalam tentang perkara yang direka bentuk untuknya.
Untuk model bahasa besar (LLM), biasanya tiada topik khusus yang mesti dilatih oleh model. LLM sebaliknya dibina untuk menjadi model tujuan umum yang mesti sesuai untuk melaksanakan pelbagai tugas. Model ini menggunakan set data teks yang besar yang menangkap sebahagian besar web serta bahan rujukan yang diterbitkan, kesusasteraan dan juga kod sumber.
Perbezaan utama antara set data latihan PaLM 2 dan model lain ialah kemasukan peratusan data bukan bahasa Inggeris yang lebih tinggi. Menurut mereka laporan teknikal, mengembangkan set data untuk memasukkan teks bukan bahasa Inggeris mendedahkan model kepada pelbagai bahasa dan budaya yang lebih luas.
Model PaLM 2 juga dilatih mengenai data berbilang bahasa selari untuk membantu model memperoleh keupayaan untuk menterjemah daripada satu bahasa ke bahasa lain. Data termasuk pasangan teks di mana satu entri adalah dalam bahasa Inggeris dan satu lagi adalah teks yang setara dalam bahasa lain.
Jadual di atas menunjukkan taburan bahasa bagi dokumen web berbilang bahasa yang digunakan untuk melatih PaLM 2.
Ciri Utama PaLM 2
Berikut adalah beberapa bidang utama yang PaLM 2 cemerlang berbanding model bahasa lain.
Penaakulan
Set data PaLM 2 termasuk sumber seperti kertas saintifik dan kandungan web dengan ungkapan matematik. Ini memberikan model keupayaan yang lebih baik dalam matematik, penaakulan akal dan logik.
Penyelidik menguji kebolehan penaakulan matematik model pada soalan matematik sekolah rendah dan sekolah menengah di mana ia menunjukkan hasil yang setanding dengan keupayaan matematik GPT-4.
Pengekodan
Data latihan PaLM 2 juga memberikannya keupayaan untuk menjana kod dalam pelbagai bahasa pengaturcaraan. Pasukan PALM 2 mencipta model PaLM 2 khusus pengekodan yang dipanggil PaLM 2-S* yang dilatih pada set data berbilang bahasa yang berat kod.
Model ini bukan sahaja mampu menghasilkan kod, tetapi ia juga mampu mengendalikan tugas yang melibatkan pelbagai bahasa. Sebagai contoh, anda boleh meminta PaLM 2 untuk mencipta fungsi pengisihan Python yang menambah komen baris demi baris dalam bahasa Sepanyol.
Kepelbagaian bahasa
Memandangkan model itu dilatih pada set data yang merangkumi lebih 100 bahasa, PaLM 2 menunjukkan kecekapan dalam memahami, menjana dan menterjemah teks merentas berbilang bahasa.
Untuk menguji kepelbagaian bahasa, para penyelidik menguji model pada pelbagai ujian kecekapan bahasa dalam bahasa yang berbeza. Keputusan menunjukkan bahawa PaLM 2 bukan sahaja mengatasi prestasi PaLM tetapi juga mencapai gred lulus untuk setiap bahasa yang dinilai.
PaLM 2 juga menunjukkan keupayaan berbilang bahasa dengan keupayaannya untuk memahami simpulan bahasa dalam bahasa yang berbeza, menerangkan jenaka, membetulkan kesilapan silap, dan juga boleh belajar cara menukar teks formal kepada sembang sehari-hari.
PaLM 2 Memperkasakan Produk Google
Google sudah pun mengambil kesempatan daripada kemajuan PaLM 2 dengan menyepadukan model dengan produk lain.
Bard
Keupayaan model untuk mengendalikan tugasan berbilang bahasa kini memberi kuasa kepada Google Percubaan Bard kerana ia berkembang ke lebih 180 negara dan wilayah.
Bard kini juga menggunakan keupayaan pengekodan PaLM 2 untuk membantu dalam pengaturcaraan dan tugas pembangunan perisian seperti penjanaan kod dan penyahpepijatan kod.
Duet AI untuk Google Workspace
Google juga merancang untuk menambahkan ciri AI generatif pada kumpulan aplikasi Google Workspacenya. Gmail dan Dokumen tidak lama lagi akan menyertakan ciri yang dipanggil Duet AI yang akan membantu pengguna merangka balasan dan menulis mereka menggunakan gesaan.
Duet AI juga akan membenarkan pengguna membuat rancangan tersuai dalam Helaian Google untuk tugasan dan projek berdasarkan gesaan yang diberikan oleh pengguna.
Kesimpulan
Google pastinya berharap dapat merapatkan jurang dalam pasaran alat bahasa AI dengan model bahasa PaLM 2 mereka. Walaupun model'sAPI belum tersedia secara umum, hasil daripada penyelidikan mereka menunjukkan bahawa model itu cukup kompetitif untuk menyamai prestasi GPT-4.
Dengan pangkalan pengguna sedia ada Google, mereka pastinya mempunyai kelebihan penyesuaian besar-besaran jika AI mereka disepadukan ke dalam perkhidmatan mereka seperti enjin carian mereka atau set alat produktiviti mereka.
Sila tinggalkan balasan anda