Edukien aurkibidea[Ezkutatu][Erakutsi]
Hizkuntza-eredu handiak hizkuntza naturalen programazioaren eta neurona-sareen arloko azken garapen ikusgarrienetako batzuk dira.
OpenAI-ren GPT-3 errendimendurik onena duen modeloetako bat bezala nabarmentzen da. Ereduaren irteera sarritan ezin da gizakiengandik datorren testutik bereizten.
Hala ere, GPT-3 kode itxiko eredua da oraindik. Izugarri indartsua den arren, erabilera kasu batzuetarako desegokia izan daitekeen muga batzuk daude.
Artikulu honetan, handi batzuk aztertuko ditugu hizkuntza ereduak GPT-3-ren errendimendu gordinarekin lehiatu daitekeena.
Zergatik bilatu OpenAI GPT-3 alternatiba bat?
OpenAI-ren GPT-3 ereduak aurreratua erabiltzen du ikaskuntza sakona giza itxurako testuak sortzeko ereduak. OpenAIren ikerketa laborategiko hirugarren belaunaldiko hizkuntza iragarpen eredua da.
Eredua hasiera batean beta itxi gisa kaleratu zen OpenAIk APIa publikoari ireki baino lehen 2021 amaieran.
Gaur egun, GPT-3-k lau oinarrizko modelo ditu aukeratzeko. Ada, eredu merkeena eta azkarrenak 0.0004 $ baino ez ditu 1000 token bakoitzeko. OpenAIren modelorik indartsuenak, Davinci, 0.02 dolar balio du 1000 token bakoitzeko, edo 50 aldiz garestiago.
OpenAI-k garatzaileak berea jarraitzea ere eskatzen du erabilera jarraibideak. Garatzaileak erabilera kuota mugatu bat ere emango du, garatzailearen aplikazioa eskuzko berrikuspen prozesu baten bidez onartzen denean handitu daitekeena.
GPT-3 irteera kalitate handiko irteeragatik ezaguna den arren, ez da erabil dezakezun hizkuntza iragartzeko eredu bakarra.
Ikus ditzagun GPT-3-ren alternatiba gisa erabil ditzakezun modelo lehiakide batzuk.
1. GPT-J
GPT-J Eleuther AI taldearen kode irekiko hizkuntza eredua da.
Zero jaurtiketa errendimendua GPT-3-ren parekoa da gutxi gorabehera, eta errendimenduan askoz ere hurbilagoa da beste GPT inplementazio asko baino.
6 mila milioi parametroko testua sortzeko eredu autorregresiboa "The Pile" izenez ezagutzen den datu multzo batean trebatu da.
Piloa Izan ere, 22 datu-multzo txikiagoen konbinazioa da. 825 GiB-ko fitxategi-tamaina konbinatua du eta iturri akademiko eta profesionaletan enfasi handiagoa duela ikusi da.
Zuk zeuk probatu dezakezu eredua honen bidez doako web aplikazioa.
Eredua gonbita sinple batekin probatu ahal izan nuen. GPT-J-k "gaur egun hizkuntza berri bat ikasteko modurik onenak" zerrendatzea lortu zuen.
Dena den, errendimendua nahiko irregularra da testua sortzeko eredu autorregresiboa zer zen azaltzeko galdetzen saiatu nintzenean.
Irteerak zentzua bazuen ere, ez zion benetan erantzuten gonbita modu esanguratsuan.
Prezioak
GPT-J kode irekiko eredua denez, zuk zeuk exekutatu dezakezu zure instantzia. -ren arabera biltegi ofiziala, eredua tentsoreak prozesatzeko unitate (TPU) batean exekutatzeko diseinatuta dago. Optimoa izan arren, baliteke hau ez izatea aukerarik errentagarriena Google-ren merkeena denez gero hodeiko TPUen kostua 4.50 $/orduko inguru.
Baliteke epe luzera merkeagoa izatea zure GPU erabiltzea edo GPU zerbitzari dedikatu bat alokatzea bezalako zerbitzuen bidez. Vast.ai or FluidStack.
2. Jurasikoa-1
Jurassic-1 AI21 Labs-ek, NLPn espezializatutako Israelgo AI konpainiak kaleratutako hizkuntza-eredu bat da. OpenAI bezala, haien hizkuntza eredua sartzeko aukera ematen duen API bat ere eskaintzen dute.
Euren kontu bat sor dezakezu jolastokiko web aplikazio batera sartzeko, eredua zuk zeuk probatzeko.
AI21 Studio-k Jurassic-1 modeloen zure bertsio pertsonalizatuak entrenatzeko eta kontsultatzeko eginbide bat ere barne hartzen du. baten arabera blog post ofiziala, berrogeita hamar adibide baino gutxiago dituzten eredu pertsonalizatuak ingeniaritza gonkorra gainditu dezakete jatorrizko eredua erabiliz.
Prezioak
Erabileran oinarritutako prezio malguak eskaintzen dituzte oinarrizko hiru ereduetako bakoitzarentzat. Adibidez, 0.25 $ kobratzen dute ereduak sortutako 1000 token bakoitzeko. Batez beste, token bakoitzak hitz bat edo sei karaktere ditu gutxi gorabehera.
Horrek esan nahi du AI21-en eredurik onena erabil dezakezula 4000 hitzeko dokumentu bat $ 1-en truke sortzeko. Hala ere, gogoratu behar duzun gauza bat da eredua erabiltzeko hilero gutxienez 29 $ ordaindu behar dituzula.
3. TextSynth
TextSynth testua sortzeko erabil dezakezun NLP web-zerbitzu bat da. Aurreko bi adibideetan ez bezala, TextSynth ez da eredu autonomoa. Zerbitzuak erabiltzaileari GPT-NeoX, M2M100 eta GPT-J bezalako kode irekiko beste hizkuntza eredu handi batzuetarako sarbidea emanez funtzionatzen du.
Garatzaileek beren erabil dezakete REST API hizkuntza ereduak beren aplikazioetan integratzeko. Doako egiaztatzen saia zaitezke jolastokiaren orria eskuragarri dagoen eredu bakoitzak nola funtzionatzen duen ikusteko.
Prezioak
Doako planak beren hizkuntza-eredu guztietarako sarbidea ematen dizu tarifa-muga batzuekin. Zerbitzuak eskaera bakoitza 200 tokenera mugatzen du.
Plan estandarrak sortutako token kopuruaren muga kentzen du. Prezioen eredua kredituetan oinarritzen da ustekabeko gastuak ekiditeko. Erosteko gutxieneko kreditu kopurua 20 $ da. Erabili gabeko kredituak baliogabeak dira urtebete igaro ondoren.
Eskaera bakoitzaren prezioa sarrera eta sortutako token kopuruan oinarritzen da. Euren webgune ofizialeko taulan oinarrituta, 0.75 $ eta 1.25 $ inguru ordaindu beharko dituzu beren modelo merkeagoak erabiltzeagatik.
Ondorioa
Zorionez, artikulu honek erabil dezakezun hizkuntza-eredu merkea eta eraginkorra aurkitzen lagun zaitzake OpenAI GPT-3 alternatiba.
Hizkuntza eredu handiak oso indartsuak dira eta hainbat zereginetarako erabil daitezke. Testuak sortzeko, hizkuntzen artean itzultzeko eta hizkuntza naturala ulertzeko eta erantzuteko erabil daitezke.
Espazioan egin ditudan ikerketetan eta egin ditudan probetan oinarrituta, GPT-3-k beste guztiak gainditzen ditu oraindik hizkuntza eredu handia Saiatu naiz. Hala ere, hori aldatu egin daiteke etorkizunean ikertzaileek eredu berriak garatu eta kaleratu ahala.
Google, Facebook eta beste AI laborategietako ikertzaileek beren LMMak aurrera egiteko lanean jarraituko dute. Zalantzarik gabe, posible da AI talde horietako bat GPT-3 baino handiagoa den eredu batekin ateratzea.
Utzi erantzun bat