Daftar Isi[Bersembunyi][Menunjukkan]
Model bahasa besar adalah beberapa perkembangan terbaru yang paling mengesankan di bidang pemrograman bahasa alami dan jaringan saraf.
GPT-3 OpenAI menonjol sebagai salah satu model berperforma terbaik di luar sana. Keluaran model sering kali tidak dapat dibedakan dari teks yang berasal dari manusia.
Namun, GPT-3 masih merupakan model sumber tertutup. Meskipun sangat kuat, ada batasan tertentu yang mungkin membuatnya tidak cocok untuk kasus penggunaan tertentu.
Pada artikel ini, kita akan membahas beberapa besar model bahasa yang dapat bersaing dengan kinerja mentah GPT-3.
Mengapa Mencari Alternatif OpenAI GPT-3?
Model GPT-3 OpenAI menggunakan tingkat lanjut belajar mendalam model untuk menghasilkan teks seperti manusia. Ini adalah model prediksi bahasa generasi ketiga dari laboratorium penelitian OpenAI.
Model ini awalnya dirilis sebagai beta tertutup sebelum OpenAI akhirnya membuka API untuk umum pada akhir tahun 2021.
Saat ini, GPT-3 memiliki empat model dasar untuk Anda pilih. Ada, model termurah dan tercepat hanya berharga $0.0004 per 1000 token. Model OpenAI yang paling kuat, Davinci, berharga $0.02 per 1000 token, atau sekitar 50 kali lebih mahal.
OpenAI juga mengharuskan pengembang untuk mengikuti milik mereka sendiri pedoman penggunaan. Pengembang juga akan memberikan kuota penggunaan terbatas yang dapat ditingkatkan setelah aplikasi pengembang disetujui melalui proses peninjauan manual.
Meskipun keluaran GPT-3 terkenal dengan keluaran berkualitas tinggi, ini bukan satu-satunya model prediksi bahasa yang tersedia untuk Anda gunakan.
Mari membahas beberapa model pesaing yang dapat Anda gunakan sebagai alternatif untuk GPT-3.
1.GPT-J
GPT-J adalah model bahasa sumber terbuka oleh grup AI Eleuther.
Performa zero-shot kira-kira setara dengan GPT-3 dan performanya jauh lebih dekat daripada banyak implementasi GPT lainnya.
Model generasi teks autoregressive parameter 6-miliar telah dilatih pada kumpulan data yang dikenal sebagai "The Pile".
Tumpukan sebenarnya adalah kombinasi dari 22 kumpulan data yang lebih kecil yang digabungkan menjadi satu. Ini memiliki ukuran file gabungan 825 GiB dan telah diamati memiliki penekanan lebih besar pada sumber akademik dan profesional.
Anda dapat menguji sendiri modelnya melalui ini aplikasi web gratis.
Saya dapat menguji model dengan prompt sederhana. GPT-J berhasil menyebutkan “cara terbaik untuk belajar bahasa baru hari ini”.
Namun, kinerjanya agak tidak stabil ketika saya mencoba memintanya menjelaskan apa itu model pembuatan teks autoregresif.
Sementara outputnya masuk akal, itu tidak benar-benar menjawab prompt dengan cara yang berarti.
Harga
Karena GPT-J adalah model sumber terbuka, Anda sebenarnya dapat menjalankan instance Anda sendiri. Menurut repositori resmi, model ini dirancang untuk berjalan pada unit pemrosesan tensor (TPU). Meskipun optimal, ini mungkin bukan pilihan yang paling hemat biaya karena yang termurah dari Google biaya cloud TPU sekitar $4.50/jam.
Mungkin lebih murah dalam jangka panjang untuk menggunakan GPU Anda sendiri atau menyewa server GPU khusus melalui layanan seperti luas.ai or Tumpukan Cairan.
2. Jurasik-1
Jurassic-1 adalah model bahasa yang dirilis oleh AI21 Labs, sebuah perusahaan AI Israel yang berspesialisasi dalam NLP. Seperti OpenAI, mereka juga menawarkan API yang memungkinkan Anda mengakses model bahasa mereka.
Anda dapat membuat akun di mereka situs web untuk mengakses aplikasi web taman bermain untuk menguji model sendiri.
Studio AI21 juga menyertakan fitur di mana Anda dapat melatih dan menanyakan versi kustom Anda sendiri dari model Jurassic-1 mereka. Menurut an pos blog resmi, model khusus dengan sedikitnya lima puluh contoh dapat mengungguli rekayasa cepat menggunakan model asli.
Harga
Mereka menawarkan harga berbasis penggunaan yang fleksibel untuk masing-masing dari tiga model dasar mereka. Misalnya, mereka mengenakan biaya $0.25 untuk setiap 1000 token yang dihasilkan oleh model. Rata-rata, setiap token sekitar 1 kata atau enam karakter.
Ini berarti Anda dapat menggunakan model terbaik AI21 untuk membuat dokumen 4000 kata hanya dengan $1. Namun satu hal yang perlu Anda ingat adalah Anda masih harus membayar minimal $29 setiap bulan untuk menggunakan model tersebut.
3. TeksSynth
TextSynth adalah layanan web NLP lain yang dapat Anda gunakan untuk menghasilkan teks. Berbeda dengan dua contoh sebelumnya, TextSynth bukanlah model yang berdiri sendiri. Layanan ini bekerja dengan memberi pengguna akses ke berbagai model bahasa besar sumber terbuka lainnya seperti GPT-NeoX, M2M100, dan bahkan GPT-J.
Pengembang dapat menggunakan SISA API untuk mengintegrasikan model bahasa ke dalam aplikasi mereka sendiri. Anda dapat mencoba memeriksanya secara gratis halaman taman bermain untuk melihat kinerja setiap model yang tersedia.
Harga
Paket gratis mereka memberi Anda akses ke semua model bahasa mereka dengan beberapa batasan tarif. Layanan ini membatasi setiap permintaan hingga 200 token.
Paket standar menghilangkan batasan jumlah token yang dihasilkan. Model penetapan harga berbasis kredit untuk menghindari pengeluaran tak terduga. Jumlah minimum kredit untuk membeli adalah $20. Kredit yang tidak digunakan tidak valid setelah satu tahun.
Harga setiap permintaan didasarkan pada jumlah input dan token yang dihasilkan. Berdasarkan tabel di situs web resmi mereka, Anda dapat mengharapkan untuk membayar sekitar $0.75 hingga $1.25 untuk menggunakan model mereka yang lebih murah.
Kesimpulan
Semoga artikel ini dapat membantu Anda menemukan model bahasa yang terjangkau dan efektif yang dapat Anda gunakan sebagai Alternatif OpenAI GPT-3.
Model bahasa besar sangat kuat dan dapat digunakan untuk berbagai tugas. Mereka dapat digunakan untuk menghasilkan teks, menerjemahkan antar bahasa, dan memahami serta menanggapi bahasa alami.
Berdasarkan penelitian saya di luar angkasa dan pengujian yang telah saya lakukan, GPT-3 masih mengungguli yang lain model bahasa besar Saya sudah mencoba. Namun, hal ini dapat berubah di masa mendatang karena peneliti mengembangkan dan merilis model baru.
Para peneliti di Google, Facebook, dan laboratorium AI lainnya masih akan terus bekerja untuk memajukan LMM mereka sendiri. Sangat mungkin bahwa salah satu tim AI ini akan keluar dengan model yang lebih unggul dari GPT-3.
Tinggalkan Balasan