Inhoudsopgave[Zich verstoppen][Laten zien]
Grote taalmodellen zijn enkele van de meest indrukwekkende recente ontwikkelingen op het gebied van natuurlijke taalprogrammering en neurale netwerken.
De GPT-3 van OpenAI onderscheidt zich als een van de best presterende modellen die er zijn. De output van het model is vaak niet te onderscheiden van tekst die van mensen afkomstig is.
GPT-3 is echter nog steeds een closed-sourcemodel. Hoewel ongelooflijk krachtig, zijn er bepaalde beperkingen die het ongeschikt kunnen maken voor bepaalde gebruikssituaties.
In dit artikel zullen we een paar grote taalmodellen die kan wedijveren met de rauwe prestaties van GPT-3.
Waarom zoeken naar een OpenAI GPT-3-alternatief?
Het GPT-3-model van OpenAI maakt gebruik van geavanceerde diepgaand leren modellen om mensachtige tekst te produceren. Het is het derde generatie taalvoorspellingsmodel van het onderzoekslaboratorium van OpenAI.
Het model werd aanvankelijk uitgebracht als een gesloten bèta voordat OpenAI de API uiteindelijk eind 2021 voor het publiek opende.
Momenteel heeft GPT-3 vier basismodellen waaruit u kunt kiezen. Ada, het goedkoopste en snelste model kost slechts $ 0.0004 per 1000 tokens. Het krachtigste model van OpenAI, Davinci, kost $ 0.02 per 1000 tokens, of ongeveer 50 keer duurder.
OpenAI vereist ook dat de ontwikkelaar zijn eigen volgen gebruiksrichtlijnen. De ontwikkelaar biedt ook een beperkt gebruiksquotum dat kan worden verhoogd zodra de aanvraag van de ontwikkelaar is goedgekeurd via een handmatig beoordelingsproces.
Hoewel de GPT-3-uitvoer bekend staat om zijn hoogwaardige uitvoer, is dit niet het enige taalvoorspellingsmodel dat u kunt gebruiken.
Laten we eens kijken naar enkele concurrerende modellen die u als alternatief voor GPT-3 kunt gebruiken.
1. GPT-J
GPT-J is een open-source taalmodel van de Eleuther AI-groep.
De zero-shot-prestaties zijn ongeveer gelijk aan die van GPT-3 en zijn veel beter in prestaties dan veel andere GPT-implementaties.
Het autoregressieve tekstgeneratiemodel met 6 miljard parameters is getraind op een dataset die bekend staat als "The Pile".
De stapel is eigenlijk een combinatie van 22 kleinere datasets gecombineerd. Het heeft een gecombineerde bestandsgrootte van 825 GiB en er is waargenomen dat het meer nadruk legt op academische en professionele bronnen.
Hiermee kunt u het model zelf testen gratis webapplicatie.
Ik kon het model testen met een eenvoudige prompt. GPT-J is erin geslaagd de "beste manieren om vandaag een nieuwe taal te leren" op te sommen.
De uitvoering was echter enigszins vlekkerig toen ik probeerde uit te leggen wat een autoregressief tekstgeneratiemodel was.
Hoewel de uitvoer logisch was, beantwoordde deze de prompt niet op een zinvolle manier.
Prijzen
Aangezien GPT-J een open-sourcemodel is, zou u uw eigen instantie zelf kunnen uitvoeren. Volgens de officiële opslagplaats, is het model ontworpen om op een tensorverwerkingseenheid (TPU) te draaien. Hoewel dit optimaal is, is dit misschien niet de meest kosteneffectieve optie sinds de goedkoopste van Google cloud TPU's kosten ongeveer $ 4.50 / uur.
Het kan op de lange termijn goedkoper zijn om uw eigen GPU te gebruiken of een speciale GPU-server te huren via services zoals Vast.ai or VloeistofStack.
2. Jura-1
Jurassic-1 is een taalmodel dat is uitgebracht door AI21 Labs, een Israëlisch AI-bedrijf dat gespecialiseerd is in NLP. Net als OpenAI bieden ze ook een API waarmee je toegang hebt tot hun taalmodel.
U kunt een account aanmaken op hun van de om toegang te krijgen tot een web-app voor een speeltuin om het model zelf te testen.
De AI21 Studio bevat ook een functie waarmee u uw eigen aangepaste versies van hun Jurassic-1-modellen kunt trainen en bevragen. volgens an officiële blogpost, kunnen aangepaste modellen met slechts vijftig voorbeelden beter presteren dan prompte engineering met het originele model.
Prijzen
Ze bieden flexibele, op gebruik gebaseerde prijzen voor elk van hun drie basismodellen. Ze brengen bijvoorbeeld $ 0.25 in rekening voor elke 1000 tokens die door het model worden gegenereerd. Gemiddeld is elk token ongeveer 1 woord of zes tekens.
Dit betekent dat u het beste model van AI21 kunt gebruiken om een document van 4000 woorden te maken voor slechts $1. Een ding dat u echter moet onthouden, is dat u nog steeds elke maand minimaal $ 29 moet betalen om het model te gebruiken.
3. Tekstsynth
TextSynth is een andere NLP-webservice die u kunt gebruiken om tekst te genereren. In tegenstelling tot de vorige twee voorbeelden, is TextSynth geen op zichzelf staand model. De service werkt door de gebruiker toegang te geven tot verschillende andere open-source grote taalmodellen zoals GPT-NeoX, M2M100 en zelfs GPT-J.
Ontwikkelaars kunnen hun REST API om de taalmodellen in hun eigen applicaties te integreren. Je kunt proberen hun gratis te bekijken speeltuin pagina om te zien hoe elk beschikbaar model presteert.
Prijzen
Hun gratis abonnement geeft je toegang tot al hun taalmodellen met enkele tarieflimieten. De service beperkt elk verzoek tot een lengte van 200 tokens.
Het standaardplan heft de beperking op het aantal gegenereerde tokens op. Het prijsmodel is gebaseerd op krediet om onverwachte uitgaven te voorkomen. Het minimum aantal te kopen credits is $20. Ongebruikte tegoeden zijn na een jaar ongeldig.
De prijs van elk verzoek is gebaseerd op het aantal ingevoerde en gegenereerde tokens. Op basis van de tabel op hun officiële website, kunt u verwachten dat u ongeveer $ 0.75 tot $ 1.25 betaalt voor het gebruik van hun goedkopere modellen.
Conclusie
Hopelijk kan dit artikel je helpen bij het vinden van een betaalbaar en effectief taalmodel dat je als taalgebruiker kunt gebruiken OpenAI GPT-3-alternatief.
Grote taalmodellen zijn zeer krachtig en kunnen voor verschillende taken worden gebruikt. Ze kunnen worden gebruikt om tekst te genereren, tussen talen te vertalen en om natuurlijke taal te begrijpen en erop te reageren.
Op basis van mijn onderzoek in de ruimte en de tests die ik heb uitgevoerd, presteert GPT-3 nog steeds beter dan alle andere groot taalmodel Ik heb geprobeerd. Dit zou in de toekomst echter kunnen veranderen als onderzoekers nieuwe modellen ontwikkelen en uitbrengen.
Onderzoekers van Google, Facebook en andere AI-laboratoria blijven werken aan het verbeteren van hun eigen LMM's. Het is zeker mogelijk dat een van deze AI-teams met een model komt dat superieur is aan GPT-3.
Laat een reactie achter