Daptar eusi[Sumputkeun][Témbongkeun]
Modél basa ageung mangrupikeun sababaraha kamajuan panganyarna anu paling narik dina widang pemrograman basa alami sareng jaringan saraf.
OpenAI urang GPT-3 nangtung kaluar salaku salah sahiji model pangalusna-ngajalankeun kaluar dinya. Kaluaran model sering kali teu bisa dibédakeun tina téks asalna ti manusa.
Sanajan kitu, GPT-3 masih model closed-source. Sanaos luar biasa kuat, aya watesan anu tangtu anu tiasa ngajantenkeun henteu cocog pikeun kasus pamakean anu tangtu.
Dina artikel ieu, urang bakal balik leuwih sababaraha badag modél basa nu bisa bersaing jeung kinerja atah GPT-3 urang.
Naha Milarian Alternatif OpenAI GPT-3?
Modél GPT-3 OpenAI ngagunakeun canggih learning jero model pikeun ngahasilkeun téks kawas manusa. Éta modél prediksi basa generasi katilu ti laboratorium panalungtikan OpenAI.
Modél ieu mimitina dileupaskeun salaku béta katutup sateuacan OpenAI tungtungna muka API ka umum dina ahir 2021.
Ayeuna, GPT-3 ngagaduhan opat modél dasar pikeun anjeun pilih. Aya, model cheapest tur panggancangna waragad ukur $0.0004 per 1000 tokens. Modél pangkuatna OpenAI, Davinci, hargana $0.02 per 1000 token, atanapi sakitar 50 kali langkung mahal.
OpenAI ogé meryogikeun pamekar pikeun nuturkeun sorangan padoman panggunaan. Pamekar ogé bakal nyayogikeun kuota pamakean kawates anu tiasa dironjatkeun saatos aplikasi pamekar disatujuan ngaliwatan prosés tinjauan manual.
Bari kaluaran GPT-3 geus well-dipikawanoh pikeun kaluaran kualitas luhur na, teu hijina model prediksi basa sadia pikeun anjeun ngagunakeun.
Hayu urang balik leuwih sababaraha model competing Anjeun bisa make salaku alternatif pikeun GPT-3.
1. GPT-J
GPT-J nyaéta modél basa open-source ku grup Eleuther AI.
Kinerja nol-shot kasarna sami sareng GPT-3 sareng langkung caket dina pagelaran tibatan seueur palaksanaan GPT anu sanés.
Model generasi téks autoregressive parameter 6-miliar parantos dilatih dina set data anu katelah "The Pile".
The Tihang sabenerna ngarupakeun kombinasi 22 datasets leutik digabungkeun babarengan. Mibanda ukuran file gabungan 825 GiB sarta geus katalungtik boga tekenan gede dina sumber akademik sarta profésional.
Anjeun tiasa nguji model sorangan ngaliwatan ieu aplikasi wéb gratis.
Kuring bisa nguji kaluar model ku ajakan basajan. GPT-J junun enumerating "cara pangalusna pikeun neuleuman basa anyar kiwari".
Sanajan kitu, kinerja rada jerawatan nalika kuring nyoba nanya ka ngajelaskeun naon model generasi téks autoregressive éta.
Bari kaluaran asup akal, éta teu sabenerna ngajawab ajakan dina cara bermakna.
bedah
Kusabab GPT-J mangrupikeun modél open-source, anjeun tiasa leres-leres ngajalankeun instansi anjeun nyalira. Nurutkeun kana gudang resmi, model dirancang pikeun ngajalankeun dina Unit processing tensor (TPU). Sanaos optimal, ieu panginten sanés pilihan anu paling murah saprak pangmurahna Google ongkos TPUs awan ngeunaan $4.50 / jam.
Bisa jadi kirang mahal dina jangka panjang ngagunakeun GPU sorangan atawa nyéwa server GPU dedicated ngaliwatan jasa kawas Vast.ai or FluidStack.
2. Jurasik-1
Jurassic-1 mangrupikeun modél basa anu dikaluarkeun ku AI21 Labs, perusahaan AI Israél anu khusus dina NLP. Sapertos OpenAI, aranjeunna ogé nawiskeun API anu ngamungkinkeun anjeun ngaksés modél basana.
Anjeun tiasa nyieun hiji akun on maranéhna website pikeun ngakses aplikasi wéb tempat kaulinan pikeun nguji modél pikeun diri anjeun.
AI21 Studio ogé kalebet fitur dimana anjeun tiasa ngalatih sareng naroskeun versi khusus anjeun tina modél Jurassic-1 na. Numutkeun an pos blog resmi, Modél custom kalawan sakumaha saeutik lima puluh conto bisa outperform rékayasa ajakan ngagunakeun model aslina.
bedah
Aranjeunna nawiskeun harga dumasar-pamakéan anu fleksibel pikeun tiap tina tilu modél dasarna. Contona, aranjeunna ngecas $ 0.25 keur unggal 1000 tokens dihasilkeun ku model. Rata-rata, unggal token sakitar 1 kecap atanapi genep karakter.
Ieu ngandung harti yén anjeun tiasa nganggo modél pangsaéna AI21 pikeun nyiptakeun dokumén 4000 kecap ngan ukur $1. Hiji hal anu anjeun kedah émut nyaéta yén anjeun masih kedah mayar minimum $ 29 unggal bulan pikeun ngagunakeun modél éta.
3. TextSynth
TextSynth mangrupikeun jasa wéb NLP sanés anu anjeun tiasa dianggo pikeun ngahasilkeun téks. Beda sareng dua conto sateuacana, TextSynth sanés modél mandiri. Ladenan éta jalanna ku cara méré aksés ka pamaké kana rupa-rupa modél basa badag open-source séjénna kawas GPT-NeoX, M2M100 komo GPT-J.
Pamekar tiasa nganggo aranjeunna sesa API pikeun ngahijikeun modél basa kana aplikasina sorangan. Anjeun tiasa nyobian pariksa kaluar maranéhna gratis halaman tempat kaulinan pikeun nempo kumaha unggal model sadia nedunan.
bedah
Rencana gratisna masihan anjeun aksés ka sadaya modél basana kalayan sababaraha wates laju. Ladenan ngabatesan unggal pamundut panjangna 200 token.
Rencana standar ngaleungitkeun watesan dina jumlah token anu dihasilkeun. Modél harga dumasar kana kiridit pikeun ngahindarkeun biaya anu teu kaduga. Jumlah minimum sks pikeun mésér nyaéta $20. Sks anu henteu dianggo henteu sah saatos sataun.
Harga unggal pamundut dumasar kana jumlah input sarta tokens dihasilkeun. Dumasar kana tabél dina situs wéb resmina, anjeun tiasa ngarepkeun mayar sakitar $0.75 dugi ka $1.25 pikeun ngagunakeun modél anu langkung mirah.
kacindekan
Mudah-mudahan, tulisan ieu tiasa ngabantosan anjeun mendakan modél basa anu murah sareng efektif anu anjeun tiasa dianggo OpenAI GPT-3 alternatif.
Modél basa badag pisan kuat sarta bisa dipaké pikeun rupa-rupa tugas. Éta tiasa dianggo pikeun ngahasilkeun téks, narjamahkeun antara basa, sareng ngartos sareng ngaréspon kana basa alami.
Dumasar kana panilitian kuring di rohangan sareng tes anu kuring lakukeun, GPT-3 masih langkung unggul model basa badag Kuring geus diusahakeun. Nanging, ieu tiasa robih ka hareup nalika panaliti ngembangkeun sareng ngaleupaskeun modél énggal.
Panaliti di Google, Facebook, sareng laboratorium AI anu sanés bakal teras-terasan ngerjakeun kamajuan LMM sorangan. Pasti kamungkinan salah sahiji tim AI ieu bakal kaluar sareng modél anu langkung luhur tibatan GPT-3.
Leave a Reply