Indholdsfortegnelse[Skjule][At vise]
Store sprogmodeller er nogle af de mest imponerende seneste udviklinger inden for programmering af naturligt sprog og neurale netværk.
OpenAI's GPT-3 skiller sig ud som en af de bedst ydende modeller derude. Modellens output kan ofte ikke skelnes fra tekst, der kommer fra mennesker.
GPT-3 er dog stadig en lukket kildemodel. Selvom det er utroligt kraftfuldt, er der visse begrænsninger, der kan gøre det uegnet til visse anvendelsestilfælde.
I denne artikel vil vi gennemgå et par store sprogmodeller der kan konkurrere med GPT-3's rå ydeevne.
Hvorfor kigge efter et OpenAI GPT-3-alternativ?
OpenAIs GPT-3-model bruger avanceret dyb læring modeller til at producere menneskelignende tekst. Det er tredje generations sprogforudsigelsesmodel fra OpenAIs forskningslaboratorium.
Modellen blev oprindeligt udgivet som en lukket beta før OpenAI til sidst åbnede API'en for offentligheden i slutningen af 2021.
I øjeblikket har GPT-3 fire basismodeller, som du kan vælge imellem. Ada, den billigste og hurtigste model koster kun $0.0004 pr. 1000 tokens. OpenAIs mest kraftfulde model, Davinci, koster $0.02 per 1000 tokens, eller omkring 50 gange dyrere.
OpenAI kræver også, at udvikleren følger deres egen retningslinjer for brug. Udvikleren vil også give en begrænset brugskvote, der kan øges, når udviklerens ansøgning er godkendt gennem en manuel gennemgangsproces.
Mens GPT-3-outputtet er kendt for sit højkvalitetsoutput, er det ikke den eneste sprogforudsigelsesmodel, du kan bruge.
Lad os gennemgå nogle konkurrerende modeller, du kan bruge som et alternativ til GPT-3.
1. GPT-J
GPT-J er en open source-sprogmodel fra Eleuther AI-gruppen.
Zero-shot ydeevnen er nogenlunde på niveau med GPT-3 og er meget tættere på ydeevnen end mange andre GPT-implementeringer.
Den autoregressive tekstgenereringsmodel med 6 milliarder parametre er blevet trænet på et datasæt kendt som "The Pile".
Bunken er faktisk en kombination af 22 mindre datasæt kombineret sammen. Det har en kombineret filstørrelse på 825 GiB og er blevet observeret at have en større vægt på akademiske og professionelle kilder.
Du kan selv teste modellen herigennem gratis webapplikation.
Jeg var i stand til at teste modellen med en simpel prompt. GPT-J lykkedes med at opregne de "bedste måder at lære et nyt sprog på i dag".
Ydeevnen er dog noget plettet, da jeg forsøgte at bede den om at forklare, hvad en autoregressiv tekstgenereringsmodel var.
Selvom outputtet gav mening, svarede det faktisk ikke på prompten på en meningsfuld måde.
Priser
Da GPT-J er en open source-model, kan du faktisk selv køre din egen instans. Ifølge officielt depot, modellen er designet til at køre på en tensor processing unit (TPU). Selvom det er optimalt, er dette muligvis ikke den mest omkostningseffektive mulighed, siden Googles billigste sky TPU'er koster omkring $4.50/time.
Det kan være billigere i det lange løb at bruge din egen GPU eller leje en dedikeret GPU-server gennem tjenester som f.eks Vast.ai or FluidStack.
2. Jurassic-1
Jurassic-1 er en sprogmodel udgivet af AI21 Labs, et israelsk AI-firma, der er specialiseret i NLP. Ligesom OpenAI tilbyder de også en API, der giver dig adgang til deres sprogmodel.
Du kan oprette en konto på deres hjemmeside for at få adgang til en legeplads-webapp for selv at teste modellen.
AI21 Studio indeholder også en funktion, hvor du kan træne og forespørge på dine egne brugerdefinerede versioner af deres Jurassic-1-modeller. Ifølge en officielle blogindlæg, kan brugerdefinerede modeller med så få som halvtreds eksempler udkonkurrere hurtig konstruktion ved brug af den originale model.
Priser
De tilbyder fleksible brugsbaserede priser for hver af deres tre basismodeller. For eksempel opkræver de $0.25 for hver 1000 tokens genereret af modellen. I gennemsnit er hvert token cirka 1 ord eller seks tegn.
Det betyder, at du kan bruge AI21s bedste model til at lave et dokument på 4000 ord for kun $1. En ting du dog skal huske er, at du stadig skal betale minimum $29 hver måned for at bruge modellen.
3. TextSynth
TextSynth er en anden NLP-webtjeneste, som du kan bruge til at generere tekst. I modsætning til de to foregående eksempler er TextSynth ikke en selvstændig model. Tjenesten fungerer ved at give brugeren adgang til forskellige andre open source store sprogmodeller som GPT-NeoX, M2M100 og endda GPT-J.
Udviklere kan bruge deres REST-API at integrere sprogmodellerne i deres egne applikationer. Du kan prøve at tjekke deres gratis legeplads side for at se, hvordan hver tilgængelig model klarer sig.
Priser
Deres gratis abonnement giver dig adgang til alle deres sprogmodeller med nogle satsgrænser. Tjenesten begrænser hver anmodning til en længde på 200 tokens.
Standardplanen fjerner begrænsningen på antallet af genererede tokens. Prismodellen er kreditbaseret for at undgå uventede udgifter. Minimumsantallet af kreditter til køb er $20. Ubrugte kreditter er ugyldige efter et år.
Prisen for hver anmodning er baseret på antallet af input og genererede tokens. Baseret på tabellen på deres officielle hjemmeside kan du forvente at betale omkring $0.75 til $1.25 for at bruge deres billigere modeller.
Konklusion
Forhåbentlig kan denne artikel hjælpe dig med at finde en overkommelig og effektiv sprogmodel, du kan bruge som en OpenAI GPT-3 alternativ.
Store sprogmodeller er meget kraftfulde og kan bruges til en række forskellige opgaver. De kan bruges til at generere tekst, oversætte mellem sprog og forstå og reagere på naturligt sprog.
Baseret på min forskning i rummet og de test, jeg har udført, overgår GPT-3 stadig alle andre stor sprogmodel Jeg har prøvet. Dette kan dog ændre sig i fremtiden, efterhånden som forskerne udvikler og frigiver nye modeller.
Forskere ved Google, Facebook og andre AI-laboratorier vil stadig fortsætte med at arbejde på at fremme deres egne LMM'er. Det er bestemt muligt, at et af disse AI-hold vil komme ud med en model, der er bedre end GPT-3.
Giv en kommentar