Mudelli kbar tal-lingwa huma wħud mill-aktar żviluppi riċenti impressjonanti fil-qasam tal-ipprogrammar tal-lingwa naturali u n-netwerks newrali.
Il-GPT-3 ta' OpenAI jispikka bħala wieħed mill-mudelli bl-aħjar prestazzjoni hemmhekk. L-output tal-mudell huwa spiss drabi indistingwibbli minn test li ġej mill-bnedmin.
Madankollu, GPT-3 għadu mudell ta 'sors magħluq. Filwaqt li oerhört qawwija, hemm ċerti limitazzjonijiet li jistgħu jagħmluha mhux adattata għal ċerti każijiet ta 'użu.
F'dan l-artikolu, aħna se jmorru fuq ftit kbar mudelli tal-lingwa li jistgħu jikkompetu mal-prestazzjoni mhux maħduma tal-GPT-3.
Għaliex Fittex għal Alternattiva OpenAI GPT-3?
Il-mudell GPT-3 ta 'OpenAI juża avvanzati tagħlim fil-fond mudelli biex jipproduċu test simili għall-bniedem. Huwa l-mudell tat-tbassir tal-lingwa tat-tielet ġenerazzjoni mil-laboratorju ta 'riċerka ta' OpenAI.
Il-mudell inizjalment ġie rilaxxat bħala beta magħluqa qabel ma OpenAI eventwalment fetaħ l-API għall-pubbliku fl-aħħar tal-2021.
Bħalissa, GPT-3 għandu erba 'mudelli bażi għalik minn fejn tagħżel. Ada, l-irħas u l-iktar mudell veloċi jiswa biss $ 0.0004 għal kull 1000 tokens. L-aktar mudell b'saħħtu ta 'OpenAI, Davinci, jiswa $ 0.02 għal kull 1000 token, jew madwar 50 darba aktar għali.
OpenAI jeħtieġ ukoll li l-iżviluppatur isegwi tagħhom stess linji gwida dwar l-użu. L-iżviluppatur se jipprovdi wkoll kwota ta 'użu limitata li tista' tiżdied ladarba l-applikazzjoni tal-iżviluppatur tiġi approvata permezz ta 'proċess ta' reviżjoni manwali.
Filwaqt li l-output GPT-3 huwa magħruf sew għall-output ta 'kwalità għolja tiegħu, mhuwiex l-uniku mudell ta' tbassir tal-lingwa disponibbli għalik biex tużah.
Ejja mmorru fuq xi mudelli li jikkompetu tista' tuża bħala alternattiva għal GPT-3.
1. GPT-J
GPT-J huwa mudell tal-lingwa open-source mill-grupp Eleuther AI.
Il-prestazzjoni zero-shot hija bejn wieħed u ieħor ugwali għal GPT-3 u hija ħafna eqreb fil-prestazzjoni minn ħafna implimentazzjonijiet GPT oħra.
Il-mudell tal-ġenerazzjoni tat-test awtoregressiv ta '6 biljuni ta' parametri ġie mħarreġ fuq sett ta 'dejta magħruf bħala "The Pile".
Il-Munzell fil-fatt hija taħlita ta’ 22 sett ta’ data iżgħar magħquda flimkien. Għandu daqs ta' fajl kombinat ta' 825 GiB u ġie osservat li għandu enfasi akbar fuq sorsi akkademiċi u professjonali.
Tista' tittestja l-mudell lilek innifsek permezz ta' dan applikazzjoni tal-web b'xejn.
Stajt nittestja l-mudell bi pront sempliċi. GPT-J irnexxielu jelenka l-"aħjar modi biex titgħallem lingwa ġdida llum".
Madankollu, il-prestazzjoni hija kemmxejn spotty meta ppruvajt nistaqsiha biex tispjega x'kien mudell ta 'ġenerazzjoni ta' test awtoregressiv.
Filwaqt li l-output kien jagħmel sens, fil-fatt ma weġibx il-pront b'mod sinifikanti.
ipprezzar
Peress li l-GPT-J huwa mudell open-source, tista' fil-fatt tmexxi l-istanza tiegħek stess. Skond il- repożitorju uffiċjali, il-mudell huwa ddisinjat biex jaħdem fuq unità ta 'proċessar ta' tensor (TPU). Filwaqt li l-aħjar, din tista 'ma tkunx l-iktar għażla kosteffettiva peress li l-orħos ta' Google sħaba TPUs spiża madwar $4.50/siegħa.
Jista 'jkun inqas għali fit-tul li tuża l-GPU tiegħek stess jew tikri server tal-GPU dedikat permezz ta' servizzi bħal Vast.ai or FluidStack.
2. Ġurassiku-1
Jurassic-1 huwa mudell tal-lingwa rilaxxat minn AI21 Labs, kumpanija tal-AI Iżraeljana li tispeċjalizza fl-NLP. Bħal OpenAI, joffru wkoll API li tippermettilek taċċessa l-mudell tal-lingwa tagħhom.
Tista 'toħloq kont fuq tagħhom websajt biex taċċessa app tal-web tal-bitħa biex tittestja l-mudell għalik innifsek.
L-AI21 Studio jinkludi wkoll karatteristika fejn tista' tħarreġ u tistaqsi l-verżjonijiet tad-dwana tiegħek tal-mudelli Jurassic-1 tagħhom. Skont an post uffiċjali tal-blog, mudelli tad-dwana bl-inqas ħamsin eżempju jistgħu jaqbżu l-inġinerija fil-pront bl-użu tal-mudell oriġinali.
ipprezzar
Huma joffru prezzijiet flessibbli bbażati fuq l-użu għal kull wieħed mit-tliet mudelli bażi tagħhom. Pereżempju, jiċċarġjaw $ 0.25 għal kull 1000 token iġġenerat mill-mudell. Bħala medja, kull token huwa madwar kelma waħda jew sitt karattri.
Dan ifisser li tista' tuża l-aħjar mudell ta' AI21 biex toħloq dokument ta' 4000 kelma għal $1 biss. Ħaġa waħda li trid tiftakar madankollu hija li għad trid tħallas minimu ta '$29 kull xahar biex tuża l-mudell.
3. TextSynth
TextSynth huwa servizz ieħor tal-web NLP li tista' tuża biex tiġġenera test. B'differenza miż-żewġ eżempji preċedenti, TextSynth mhuwiex mudell waħdu. Is-servizz jaħdem billi jagħti lill-utent aċċess għal diversi mudelli lingwistiċi kbar ta’ sors miftuħ bħal GPT-NeoX, M2M100 u anke GPT-J.
L-iżviluppaturi jistgħu jużaw tagħhom SERĦAN API biex jintegraw il-mudelli tal-lingwa fl-applikazzjonijiet tagħhom stess. Tista' tipprova tiċċekkja b'xejn tagħhom paġna bitħa biex tara kif kull mudell disponibbli jwettaq.
ipprezzar
Il-pjan b'xejn tagħhom jagħtik aċċess għall-mudelli lingwistiċi kollha tagħhom b'xi limiti tar-rata. Is-servizz jirrestrinġi kull talba għal tul ta '200 tokens.
Il-pjan standard ineħħi l-limitazzjoni fuq in-numru ta 'tokens iġġenerati. Il-mudell tal-ipprezzar huwa bbażat fuq il-kreditu biex jiġu evitati spejjeż mhux mistennija. In-numru minimu ta 'krediti li tixtri huwa ta' $20. Krediti mhux użati huma invalidi wara sena.
Il-prezz ta 'kull talba huwa bbażat fuq in-numru ta' input u tokens iġġenerati. Ibbażat fuq it-tabella fuq il-websajt uffiċjali tagħhom, tista 'tistenna li tħallas madwar $ 0.75 sa $ 1.25 għall-użu tal-mudelli orħos tagħhom.
konklużjoni
Nisperaw, dan l-artikolu jista 'jgħinek issib mudell tal-lingwa affordabbli u effettiv li tista' tuża bħala OpenAI GPT-3 alternattiva.
Mudelli kbar tal-lingwa huma b'saħħithom ħafna u jistgħu jintużaw għal varjetà ta 'kompiti. Jistgħu jintużaw biex jiġġeneraw test, jittraduċu bejn il-lingwi, u jifhmu u jirrispondu għal-lingwa naturali.
Ibbażat fuq ir-riċerka tiegħi fl-ispazju u t-testijiet li għamilt, GPT-3 għadu jaqbeż lil kull ieħor mudell tal-lingwa kbira Ippruvajt. Madankollu, dan jista' jinbidel fil-futur hekk kif ir-riċerkaturi jiżviluppaw u joħorġu mudelli ġodda.
Riċerkaturi fil-Google, Facebook, u laboratorji oħra tal-AI xorta se jkomplu jaħdmu biex javvanzaw l-LMMs tagħhom stess. Huwa ċertament possibbli li wieħed minn dawn it-timijiet AI joħroġ b'mudell superjuri għal GPT-3.
Ħalli Irrispondi