Taula de continguts[Amaga][Espectacle]
Els grans models de llenguatge són alguns dels avenços recents més impressionants en el camp de la programació en llenguatge natural i les xarxes neuronals.
El GPT-3 d'OpenAI destaca com un dels models de millor rendiment que hi ha. La sortida del model sovint és indistinguible del text procedent dels humans.
Tanmateix, GPT-3 segueix sent un model de codi tancat. Tot i que és increïblement potent, hi ha certes limitacions que poden fer que no sigui adequat per a determinats casos d'ús.
En aquest article, repassarem uns quants grans models lingüístics que pot competir amb el rendiment brut de GPT-3.
Per què buscar una alternativa OpenAI GPT-3?
El model GPT-3 d'OpenAI utilitza avançats aprenentatge profund models per produir textos semblants als humans. És el model de predicció del llenguatge de tercera generació del laboratori d'investigació d'OpenAI.
El model es va llançar inicialment com a beta tancada abans que OpenAI finalment obrís l'API al públic a finals de 2021.
Actualment, GPT-3 té quatre models bàsics per triar. Ada, el model més barat i ràpid només costa 0.0004 dòlars per cada 1000 fitxes. El model més potent d'OpenAI, Davinci, costa 0.02 dòlars per cada 1000 fitxes, o aproximadament 50 vegades més car.
OpenAI també requereix que el desenvolupador segueixi els seus pautes d’ús. El desenvolupador també proporcionarà una quota d'ús limitada que es pot augmentar un cop s'aprovi l'aplicació del desenvolupador mitjançant un procés de revisió manual.
Tot i que la sortida GPT-3 és coneguda per la seva sortida d'alta qualitat, no és l'únic model de predicció d'idiomes disponible per utilitzar-lo.
Anem a repassar alguns models de la competència que podeu utilitzar com a alternativa a GPT-3.
1. GPT-J
GPT-J és un model de llenguatge de codi obert del grup Eleuther AI.
El rendiment zero-shot és aproximadament a l'igual de GPT-3 i és molt més proper en rendiment que moltes altres implementacions de GPT.
El model de generació de text autoregressiu de 6 milions de paràmetres s'ha entrenat en un conjunt de dades conegut com "The Pile".
La Pila és en realitat una combinació de 22 conjunts de dades més petits combinats. Té una mida de fitxer combinada de 825 GiB i s'ha observat que posa més èmfasi en les fonts acadèmiques i professionals.
Podeu provar el model vosaltres mateixos mitjançant això aplicació web gratuïta.
Vaig poder provar el model amb una senzilla indicació. GPT-J va aconseguir enumerar les "millors maneres d'aprendre un nou idioma avui".
Tanmateix, el rendiment és una mica irregular quan vaig intentar demanar-li que expliqués què era un model de generació de text autoregressiu.
Tot i que la sortida tenia sentit, en realitat no va respondre el missatge d'una manera significativa.
Preus
Com que GPT-J és un model de codi obert, podeu executar la vostra pròpia instància. D'acord amb la repositori oficial, el model està dissenyat per executar-se en una unitat de processament tensor (TPU). Tot i que és òptima, pot ser que aquesta no sigui l'opció més rendible ja que la més barata de Google cost de les TPU al núvol uns 4.50 $/hora.
Pot ser que a la llarga sigui menys costós utilitzar la vostra pròpia GPU o llogar un servidor GPU dedicat mitjançant serveis com ara Vast.ai or FluidStack.
2. Juràssic-1
Jurassic-1 és un model de llenguatge publicat per AI21 Labs, una empresa israeliana d'IA especialitzada en PNL. Igual que OpenAI, també ofereixen una API que permet accedir al seu model d'idioma.
Podeu crear un compte al seu per accedir a una aplicació web de pati per provar el model per tu mateix.
L'AI21 Studio també inclou una funció on podeu entrenar i consultar les vostres pròpies versions personalitzades dels seus models Jurassic-1. Segons un publicació oficial del bloc, els models personalitzats amb tan sols cinquanta exemples poden superar l'enginyeria ràpida utilitzant el model original.
Preus
Ofereixen preus flexibles basats en l'ús per a cadascun dels seus tres models bàsics. Per exemple, cobren 0.25 $ per cada 1000 fitxes generades pel model. De mitjana, cada testimoni té aproximadament 1 paraula o sis caràcters.
Això vol dir que podeu utilitzar el millor model d'AI21 per crear un document de 4000 paraules per només 1 $. Tanmateix, una cosa que heu de recordar és que encara heu de pagar un mínim de 29 dòlars al mes per utilitzar el model.
3. TextSynth
TextSynth és un altre servei web de PNL que podeu utilitzar per generar text. A diferència dels dos exemples anteriors, TextSynth no és un model autònom. El servei funciona donant accés a l'usuari a altres models d'idiomes grans de codi obert com GPT-NeoX, M2M100 i fins i tot GPT-J.
Els desenvolupadors poden utilitzar els seus REST API per integrar els models lingüístics a les seves pròpies aplicacions. Podeu provar de comprovar-ne gratuïtament pàgina del pati per veure com funciona cada model disponible.
Preus
El seu pla gratuït us permet accedir a tots els seus models d'idioma amb alguns límits de tarifes. El servei restringeix cada sol·licitud a una longitud de 200 fitxes.
El pla estàndard elimina la limitació del nombre de fitxes generades. El model de preus es basa en crèdits per evitar despeses inesperades. El nombre mínim de crèdits per comprar és de 20 dòlars. Els crèdits no utilitzats no són vàlids després d'un any.
El preu de cada sol·licitud es basa en el nombre d'entrada i fitxes generades. Segons la taula del seu lloc web oficial, podeu esperar pagar entre 0.75 i 1.25 dòlars per utilitzar els seus models més barats.
Conclusió
Amb sort, aquest article us pot ajudar a trobar un model d'idioma assequible i eficaç que podeu utilitzar com a Alternativa OpenAI GPT-3.
Els grans models de llenguatge són molt potents i es poden utilitzar per a una varietat de tasques. Es poden utilitzar per generar text, traduir entre idiomes i comprendre i respondre al llenguatge natural.
D'acord amb la meva investigació a l'espai i les proves que he realitzat, GPT-3 encara supera tots els altres gran model de llengua Ho he intentat. Tanmateix, això podria canviar en el futur a mesura que els investigadors desenvolupin i llancin nous models.
Els investigadors de Google, Facebook i altres laboratoris d'IA continuaran treballant per avançar en els seus propis LMM. Sens dubte, és possible que un d'aquests equips d'IA surti amb un model superior al GPT-3.
Deixa un comentari