Jadual Kandungan[Sembunyi][Tunjukkan]
Model bahasa besar adalah beberapa perkembangan terkini yang paling mengagumkan dalam bidang pengaturcaraan bahasa semula jadi dan rangkaian saraf.
GPT-3 OpenAI menonjol sebagai salah satu model berprestasi terbaik di luar sana. Output model sering kali tidak dapat dibezakan daripada teks yang datang daripada manusia.
Walau bagaimanapun, GPT-3 masih merupakan model sumber tertutup. Walaupun sangat berkuasa, terdapat batasan tertentu yang mungkin menjadikannya tidak sesuai untuk kes penggunaan tertentu.
Dalam artikel ini, kita akan membincangkan beberapa besar model bahasa yang boleh bersaing dengan prestasi mentah GPT-3.
Mengapa Mencari Alternatif OpenAI GPT-3?
Model GPT-3 OpenAI menggunakan lanjutan pembelajaran mendalam model untuk menghasilkan teks seperti manusia. Ia adalah model ramalan bahasa generasi ketiga daripada makmal penyelidikan OpenAI.
Model ini pada mulanya dikeluarkan sebagai beta tertutup sebelum OpenAI akhirnya membuka API kepada orang ramai pada akhir 2021.
Pada masa ini, GPT-3 mempunyai empat model asas untuk anda pilih. Ada, model termurah dan terpantas berharga hanya $0.0004 setiap 1000 token. Model OpenAI yang paling berkuasa, Davinci, berharga $0.02 setiap 1000 token, atau kira-kira 50 kali lebih mahal.
OpenAI juga memerlukan pembangun untuk mengikuti mereka sendiri garis panduan penggunaan. Pembangun juga akan menyediakan kuota penggunaan terhad yang boleh ditambah sebaik sahaja permohonan pembangun diluluskan melalui proses semakan manual.
Walaupun output GPT-3 terkenal dengan output berkualiti tinggi, ia bukan satu-satunya model ramalan bahasa yang tersedia untuk anda gunakan.
Mari kita lihat beberapa model bersaing yang boleh anda gunakan sebagai alternatif kepada GPT-3.
1. GPT-J
GPT-J ialah model bahasa sumber terbuka oleh kumpulan AI Eleuther.
Prestasi sifar pukulan adalah kira-kira setanding dengan GPT-3 dan jauh lebih hampir dalam prestasi daripada banyak pelaksanaan GPT yang lain.
Model penjanaan teks autoregresif parameter 6 bilion telah dilatih pada set data yang dikenali sebagai "The Pile".
The Pile sebenarnya adalah gabungan 22 set data yang lebih kecil digabungkan bersama. Ia mempunyai saiz fail gabungan 825 GiB dan telah diperhatikan mempunyai penekanan yang lebih besar pada sumber akademik dan profesional.
Anda boleh menguji model itu sendiri melalui ini aplikasi web percuma.
Saya dapat menguji model dengan gesaan mudah. GPT-J berjaya menyenaraikan "cara terbaik untuk mempelajari bahasa baharu hari ini".
Walau bagaimanapun, prestasinya agak tidak jelas apabila saya cuba memintanya untuk menerangkan apakah model penjanaan teks autoregresif.
Walaupun output masuk akal, ia sebenarnya tidak menjawab gesaan dengan cara yang bermakna.
Harga
Memandangkan GPT-J ialah model sumber terbuka, anda sebenarnya boleh menjalankan contoh anda sendiri. Mengikut repositori rasmi, model ini direka bentuk untuk dijalankan pada unit pemprosesan tensor (TPU). Walaupun optimum, ini mungkin bukan pilihan yang paling kos efektif sejak Google yang paling murah kos TPU awan kira-kira $4.50/jam.
Ia mungkin lebih murah dalam jangka masa panjang untuk menggunakan GPU anda sendiri atau menyewa pelayan GPU khusus melalui perkhidmatan seperti Vast.ai or FluidStack.
2. Jurassic-1
Jurassic-1 ialah model bahasa yang dikeluarkan oleh AI21 Labs, sebuah syarikat AI Israel yang pakar dalam NLP. Seperti OpenAI, mereka juga menawarkan API yang membolehkan anda mengakses model bahasa mereka.
Anda boleh membuat akaun di mereka laman web untuk mengakses apl web taman permainan untuk menguji model itu sendiri.
AI21 Studio juga termasuk ciri yang membolehkan anda melatih dan bertanya versi tersuai anda sendiri bagi model Jurassic-1 mereka. Menurut an pos blog rasmi, model tersuai dengan sekurang-kurangnya lima puluh contoh boleh mengatasi prestasi kejuruteraan segera menggunakan model asal.
Harga
Mereka menawarkan harga berasaskan penggunaan yang fleksibel untuk setiap tiga model asas mereka. Sebagai contoh, mereka mengenakan bayaran $0.25 untuk setiap 1000 token yang dijana oleh model. Secara purata, setiap token adalah lebih kurang 1 perkataan atau enam aksara.
Ini bermakna anda boleh menggunakan model terbaik AI21 untuk mencipta dokumen 4000 perkataan dengan hanya $1. Walau bagaimanapun, satu perkara yang perlu anda ingat ialah anda masih perlu membayar minimum $29 setiap bulan untuk menggunakan model tersebut.
3. TextSynth
TextSynth ialah perkhidmatan web NLP lain yang boleh anda gunakan untuk menjana teks. Tidak seperti dua contoh sebelumnya, TextSynth bukanlah model kendiri. Perkhidmatan ini berfungsi dengan memberikan pengguna akses kepada pelbagai model bahasa besar sumber terbuka lain seperti GPT-NeoX, M2M100 dan juga GPT-J.
Pemaju boleh menggunakan mereka REST API untuk mengintegrasikan model bahasa ke dalam aplikasi mereka sendiri. Anda boleh cuba menyemak percuma mereka halaman taman permainan untuk melihat prestasi setiap model yang tersedia.
Harga
Pelan percuma mereka memberi anda akses kepada semua model bahasa mereka dengan beberapa had kadar. Perkhidmatan ini mengehadkan setiap permintaan kepada panjang 200 token.
Pelan standard mengalih keluar had bilangan token yang dijana. Model penetapan harga adalah berasaskan kredit untuk mengelakkan perbelanjaan yang tidak dijangka. Bilangan kredit minimum untuk dibeli ialah $20. Kredit yang tidak digunakan adalah tidak sah selepas setahun.
Harga setiap permintaan adalah berdasarkan bilangan input dan token yang dijana. Berdasarkan jadual di tapak web rasmi mereka, anda boleh mengharapkan untuk membayar kira-kira $0.75 hingga $1.25 untuk menggunakan model mereka yang lebih murah.
Kesimpulan
Semoga artikel ini dapat membantu anda mencari model bahasa yang berpatutan dan berkesan yang boleh anda gunakan sebagai Alternatif OpenAI GPT-3.
Model bahasa yang besar sangat berkuasa dan boleh digunakan untuk pelbagai tugas. Ia boleh digunakan untuk menjana teks, menterjemah antara bahasa dan memahami serta bertindak balas kepada bahasa semula jadi.
Berdasarkan penyelidikan saya dalam ruang dan ujian yang saya jalankan, GPT-3 masih mengatasi prestasi yang lain model bahasa yang besar Saya telah cuba. Walau bagaimanapun, ini boleh berubah pada masa hadapan apabila penyelidik membangunkan dan mengeluarkan model baharu.
Penyelidik di Google, Facebook dan makmal AI lain akan terus berusaha memajukan LMM mereka sendiri. Sudah tentu mungkin salah satu daripada pasukan AI ini akan keluar dengan model yang lebih baik daripada GPT-3.
Sila tinggalkan balasan anda