Talaan ng nilalaman[Tago][Ipakita]
Ang malalaking modelo ng wika ay ilan sa mga pinakakahanga-hangang kamakailang mga pag-unlad sa larangan ng natural na language programming at neural network.
Ang GPT-3 ng OpenAI ay namumukod-tangi bilang isa sa mga pinakamahusay na gumaganap na modelo doon. Ang output ng modelo ay madalas na hindi nakikilala mula sa teksto na nagmumula sa mga tao.
Gayunpaman, ang GPT-3 ay isa pa ring closed-source na modelo. Bagama't napakalakas, may ilang partikular na limitasyon na maaaring gawin itong hindi angkop para sa ilang partikular na kaso ng paggamit.
Sa artikulong ito, tatalakayin natin ang ilang malalaking mga modelo ng wika na maaaring makipagkumpitensya sa hilaw na pagganap ng GPT-3.
Bakit Maghanap ng isang Alternatibong OpenAI GPT-3?
Ang modelo ng GPT-3 ng OpenAI ay gumagamit ng advanced malalim na pag-aaral mga modelo upang makabuo ng tekstong tulad ng tao. Ito ang ikatlong henerasyong modelo ng hula ng wika mula sa laboratoryo ng pananaliksik ng OpenAI.
Ang modelo ay unang inilabas bilang closed beta bago tuluyang binuksan ng OpenAI ang API sa publiko noong huling bahagi ng 2021.
Sa kasalukuyan, may apat na batayang modelo ang GPT-3 na mapagpipilian mo. Ada, ang pinakamurang at pinakamabilis na modelo ay nagkakahalaga lamang ng $0.0004 bawat 1000 token. Ang pinakamakapangyarihang modelo ng OpenAI, si Davinci, ay nagkakahalaga ng $0.02 bawat 1000 token, o humigit-kumulang 50 beses na mas mahal.
Kinakailangan din ng OpenAI na sundin ng developer ang kanilang sarili mga alituntunin sa paggamit. Magbibigay din ang developer ng limitadong quota sa paggamit na maaaring tumaas kapag naaprubahan ang aplikasyon ng developer sa pamamagitan ng manu-manong proseso ng pagsusuri.
Bagama't kilala ang GPT-3 na output para sa mataas na kalidad na output nito, hindi lang ito ang modelo ng hula sa wika na magagamit mo.
Tingnan natin ang ilang nakikipagkumpitensyang modelo na magagamit mo bilang alternatibo sa GPT-3.
1. GPT-J
Ang GPT-J ay isang open-source na modelo ng wika ng Eleuther AI group.
Ang pagganap ng zero-shot ay halos kapareho ng GPT-3 at mas malapit sa pagganap kaysa sa maraming iba pang mga pagpapatupad ng GPT.
Ang 6-bilyong parameter na autoregressive text generation model ay sinanay sa isang set ng data na kilala bilang "The Pile".
Ang Pile ay talagang kumbinasyon ng 22 mas maliliit na dataset na pinagsama-sama. Ito ay may pinagsamang laki ng file na 825 GiB at napagmasdan na may mas malaking diin sa akademiko at propesyonal na mga mapagkukunan.
Maaari mong subukan ang modelo sa iyong sarili sa pamamagitan nito libreng web application.
Nasubukan ko ang modelo gamit ang isang simpleng prompt. Nagtagumpay ang GPT-J sa paglista ng "pinakamahusay na paraan upang matuto ng bagong wika ngayon".
Gayunpaman, ang pagganap ay medyo batik-batik noong sinubukan kong hilingin dito na ipaliwanag kung ano ang isang autoregressive na modelo ng pagbuo ng teksto.
Bagama't may katuturan ang output, hindi talaga nito sinagot ang prompt sa isang makabuluhang paraan.
pagpepresyo
Dahil ang GPT-J ay isang open-source na modelo, maaari mo talagang patakbuhin ang sarili mong instance. Ayon sa opisyal na imbakan, ang modelo ay idinisenyo upang tumakbo sa isang tensor processing unit (TPU). Bagama't pinakamainam, maaaring hindi ito ang pinaka-cost-effective na opsyon dahil ang pinakamura ng Google gastos ng mga cloud TPU humigit-kumulang $4.50/oras.
Maaaring mas mura sa katagalan ang paggamit ng sarili mong GPU o pagrenta ng dedikadong GPU server sa pamamagitan ng mga serbisyo tulad ng Vast.ai or FluidStack.
2. Jurassic-1
Ang Jurassic-1 ay isang modelo ng wika na inilabas ng AI21 Labs, isang Israeli AI company na dalubhasa sa NLP. Tulad ng OpenAI, nag-aalok din sila ng API na nagbibigay-daan sa iyong ma-access ang kanilang modelo ng wika.
Maaari kang lumikha ng isang account sa kanilang website upang ma-access ang isang playground web app upang subukan ang modelo para sa iyong sarili.
Kasama rin sa AI21 Studio ang isang feature kung saan maaari mong sanayin at i-query ang sarili mong mga custom na bersyon ng kanilang mga modelong Jurassic-1. Ayon sa isang opisyal na blog post, ang mga custom na modelo na may kasing-kaunti sa limampung halimbawa ay maaaring makalampas sa mabilisang engineering gamit ang orihinal na modelo.
pagpepresyo
Nag-aalok sila ng nababaluktot na pagpepresyo batay sa paggamit para sa bawat isa sa kanilang tatlong batayang modelo. Halimbawa, naniningil sila ng $0.25 para sa bawat 1000 token na nabuo ng modelo. Sa karaniwan, ang bawat token ay humigit-kumulang 1 salita o anim na character.
Nangangahulugan ito na maaari mong gamitin ang pinakamahusay na modelo ng AI21 upang lumikha ng isang 4000-salitang dokumento sa halagang $1 lamang. Gayunpaman, isang bagay na kailangan mong tandaan ay kailangan mo pa ring magbayad ng minimum na $29 bawat buwan para magamit ang modelo.
3. TextSynth
Ang TextSynth ay isa pang serbisyo sa web ng NLP na magagamit mo upang makabuo ng teksto. Hindi tulad ng nakaraang dalawang halimbawa, ang TextSynth ay hindi isang standalone na modelo. Gumagana ang serbisyo sa pamamagitan ng pagbibigay sa user ng access sa iba't ibang open-source na malalaking modelo ng wika tulad ng GPT-NeoX, M2M100 at maging ang GPT-J.
Maaaring gamitin ng mga developer ang kanilang REST API upang isama ang mga modelo ng wika sa kanilang sariling mga aplikasyon. Maaari mong subukang tingnan ang kanilang libre pahina ng palaruan upang makita kung paano gumaganap ang bawat available na modelo.
pagpepresyo
Ang kanilang libreng plano ay nagbibigay sa iyo ng access sa lahat ng kanilang mga modelo ng wika na may ilang mga limitasyon sa rate. Nililimitahan ng serbisyo ang bawat kahilingan sa haba na 200 token.
Inaalis ng karaniwang plano ang limitasyon sa bilang ng mga nabuong token. Ang modelo ng pagpepresyo ay batay sa kredito upang maiwasan ang mga hindi inaasahang gastos. Ang pinakamababang bilang ng mga kredito na bibilhin ay $20. Ang mga hindi nagamit na kredito ay hindi wasto pagkatapos ng isang taon.
Ang presyo ng bawat kahilingan ay batay sa bilang ng input at nabuong mga token. Batay sa talahanayan sa kanilang opisyal na website, maaari mong asahan na magbayad ng humigit-kumulang $0.75 hanggang $1.25 para sa paggamit ng kanilang mas murang mga modelo.
Konklusyon
Sana, matutulungan ka ng artikulong ito na makahanap ng abot-kaya at epektibong modelo ng wika na magagamit mo bilang isang OpenAI GPT-3 alternatibo.
Ang malalaking modelo ng wika ay napakalakas at maaaring gamitin para sa iba't ibang gawain. Magagamit ang mga ito upang bumuo ng teksto, magsalin sa pagitan ng mga wika, at maunawaan at tumugon sa natural na wika.
Batay sa aking pagsasaliksik sa espasyo at sa mga pagsubok na aking isinagawa, ang GPT-3 ay higit pa rin ang pagganap sa bawat isa malaking modelo ng wika sinubukan ko na. Gayunpaman, maaari itong magbago sa hinaharap habang ang mga mananaliksik ay bumubuo at naglalabas ng mga bagong modelo.
Ang mga mananaliksik sa Google, Facebook, at iba pang AI laboratories ay magpapatuloy pa rin sa pagsusulong ng kanilang sariling mga LMM. Tiyak na posible na ang isa sa mga AI team na ito ay lalabas na may modelong higit sa GPT-3.
Mag-iwan ng Sagot