Sadržaj[Sakrij][Prikaži]
Modeli velikih jezika su neki od najimpresivnijih nedavnih razvoja u oblasti programiranja prirodnog jezika i neuronskih mreža.
OpenAI GPT-3 ističe se kao jedan od modela sa najboljim performansama. Izlaz modela se često puta ne razlikuje od teksta koji dolazi od ljudi.
Međutim, GPT-3 je i dalje model zatvorenog koda. Iako je nevjerovatno moćan, postoje određena ograničenja koja ga mogu učiniti neprikladnim za određene slučajeve upotrebe.
U ovom članku ćemo proći kroz nekoliko velikih jezički modeli koji se može takmičiti sa sirovim performansama GPT-3.
Zašto tražiti OpenAI GPT-3 alternativu?
OpenAI GPT-3 model koristi napredni duboko učenje modeli za proizvodnju teksta nalik ljudima. To je model treće generacije za predviđanje jezika iz OpenAI istraživačke laboratorije.
Model je prvobitno objavljen kao zatvorena beta verzija prije nego što je OpenAI konačno otvorio API za javnost krajem 2021.
Trenutno, GPT-3 ima četiri osnovna modela za izbor. Ada, najjeftiniji i najbrži model košta samo $0.0004 za 1000 tokena. Najmoćniji OpenAI-jev model, Davinci, košta 0.02 dolara za 1000 tokena, ili oko 50 puta skuplje.
OpenAI takođe zahteva od programera da prati svoje smjernice za upotrebu. Programer će također osigurati ograničenu kvotu korištenja koja se može povećati nakon što se aplikacija programera odobri kroz proces ručnog pregleda.
Iako je GPT-3 izlaz dobro poznat po svom visokokvalitetnom izlazu, to nije jedini model za predviđanje jezika koji vam je na raspolaganju.
Pogledajmo neke konkurentske modele koje možete koristiti kao alternativu GPT-3.
1. GPT-J
GPT-J je model jezika otvorenog koda Eleuther AI grupe.
Performanse nulte brzine su otprilike jednake GPT-3 i mnogo su bliže performansama od mnogih drugih GPT implementacija.
Model generisanja autoregresivnog teksta sa 6 milijardi parametara obučen je na skupu podataka poznatom kao “The Pile”.
The Pile je zapravo kombinacija 22 manja skupa podataka zajedno. Ima kombinovanu veličinu fajla od 825 GiB i primećeno je da ima veći naglasak na akademskim i profesionalnim izvorima.
Možete sami testirati model kroz ovo besplatna web aplikacija.
Bio sam u mogućnosti da testiram model jednostavnim upitom. GPT-J je uspio da nabroji „najbolje načine za učenje novog jezika danas“.
Međutim, performanse su pomalo mrlje kada sam pokušao da ga pitam da objasni šta je bio model generisanja autoregresivnog teksta.
Iako je rezultat imao smisla, zapravo nije odgovorio na upit na smislen način.
Cijene
Budući da je GPT-J model otvorenog koda, zapravo možete sami pokrenuti vlastitu instancu. Prema službeni repozitorij, model je dizajniran za rad na tenzorskoj procesorskoj jedinici (TPU). Iako je optimalna, ovo možda nije najisplativija opcija budući da je Googleova najjeftinija trošak TPU-a u oblaku oko 4.50 USD/sat.
Dugoročno bi moglo biti jeftinije koristiti vlastiti GPU ili iznajmiti namjenski GPU server putem usluga kao što su Vast.ai or FluidStack.
2. Jura-1
Jurassic-1 je jezički model koji je objavila AI21 Labs, izraelska AI kompanija specijalizirana za NLP. Kao i OpenAI, oni također nude API koji vam omogućava pristup njihovom jezičkom modelu.
Možete kreirati nalog na njihovom sajt da pristupite web aplikaciji za igralište kako biste sami testirali model.
AI21 Studio također uključuje funkciju gdje možete trenirati i ispitivati vlastite prilagođene verzije njihovih Jurassic-1 modela. Prema an zvanični blog post, prilagođeni modeli sa samo pedeset primjera mogu nadmašiti brzi inženjering koristeći originalni model.
Cijene
Oni nude fleksibilne cijene zasnovane na upotrebi za svaki od svoja tri osnovna modela. Na primjer, oni naplaćuju 0.25 dolara za svakih 1000 tokena koje generira model. U prosjeku, svaki token ima otprilike 1 riječ ili šest znakova.
To znači da možete koristiti najbolji model AI21 za kreiranje dokumenta od 4000 riječi za samo $1. Jedna stvar koju morate imati na umu je da i dalje morate platiti minimalno 29 USD svakog mjeseca da biste koristili model.
3. TextSynth
TextSynth je još jedan NLP web servis koji možete koristiti za generiranje teksta. Za razliku od prethodna dva primjera, TextSynth nije samostalan model. Usluga funkcioniše tako što korisniku daje pristup raznim drugim velikim jezičkim modelima otvorenog koda kao što su GPT-NeoX, M2M100, pa čak i GPT-J.
Programeri mogu koristiti svoje REST API da integrišu jezičke modele u sopstvene aplikacije. Možete pokušati provjeriti njihov besplatni stranica igrališta da vidite kako svaki od dostupnih modela radi.
Cijene
Njihov besplatni plan vam daje pristup svim njihovim jezičkim modelima uz određena ograničenja stope. Usluga ograničava svaki zahtjev na dužinu od 200 tokena.
Standardni plan uklanja ograničenje na broj generiranih tokena. Model određivanja cijena je baziran na kreditu kako bi se izbjegli neočekivani troškovi. Minimalni broj kredita za kupovinu je 20 USD. Neiskorišteni krediti su nevažeći nakon godinu dana.
Cijena svakog zahtjeva je zasnovana na broju ulaznih i generiranih tokena. Na osnovu tabele na njihovoj službenoj web stranici, možete očekivati da ćete platiti oko 0.75 do 1.25 dolara za korištenje njihovih jeftinijih modela.
zaključak
Nadajmo se da vam ovaj članak može pomoći da pronađete pristupačan i efikasan jezički model koji možete koristiti OpenAI GPT-3 alternativa.
Modeli velikih jezika su vrlo moćni i mogu se koristiti za razne zadatke. Mogu se koristiti za generiranje teksta, prevođenje s jednog jezika na drugi te razumijevanje i reagovanje na prirodni jezik.
Na osnovu mog istraživanja u svemiru i testova koje sam proveo, GPT-3 i dalje nadmašuje sve druge veliki jezički model Pokušao sam. Međutim, to bi se moglo promijeniti u budućnosti kako istraživači razvijaju i izdaju nove modele.
Istraživači u Guglu, Facebooku i drugim laboratorijama AI i dalje će nastaviti raditi na unapređenju vlastitih LMM-ova. Svakako je moguće da će jedan od ovih AI timova izaći sa modelom superiornijim od GPT-3.
Ostavite odgovor