Turinys[Slėpti][Rodyti]
Dideli kalbų modeliai yra vieni įspūdingiausių pastarojo meto natūralios kalbos programavimo ir neuroninių tinklų srities pokyčių.
„OpenAI“ GPT-3 išsiskiria kaip vienas geriausiai veikiančių modelių. Modelio išvestis dažnai nesiskiria nuo teksto, gauto iš žmonių.
Tačiau GPT-3 vis dar yra uždarojo kodo modelis. Nors jis yra neįtikėtinai galingas, yra tam tikrų apribojimų, dėl kurių jis gali būti netinkamas tam tikrais naudojimo atvejais.
Šiame straipsnyje apžvelgsime keletą didelių kalbos modeliai kurios gali konkuruoti su neapdorotu GPT-3 našumu.
Kodėl verta ieškoti OpenAI GPT-3 alternatyvos?
OpenAI GPT-3 modelis naudoja pažangias gilus mokymasis modelius, leidžiančius sukurti į žmogų panašų tekstą. Tai trečios kartos kalbos numatymo modelis iš OpenAI tyrimų laboratorijos.
Iš pradžių modelis buvo išleistas kaip uždara beta versija, kol galiausiai 2021 m. pabaigoje OpenAI atvėrė API visuomenei.
Šiuo metu GPT-3 galite rinktis iš keturių bazinių modelių. Ada, pigiausias ir greičiausias modelis kainuoja tik 0.0004 USD už 1000 žetonų. Galingiausias OpenAI modelis Davinci kainuoja 0.02 USD už 1000 žetonų arba maždaug 50 kartų brangiau.
„OpenAI“ taip pat reikalauja, kad kūrėjas laikytųsi savo naudojimo gaires. Kūrėjas taip pat suteiks ribotą naudojimo kvotą, kuri gali būti padidinta, kai kūrėjo paraiška bus patvirtinta atliekant neautomatinės peržiūros procesą.
Nors GPT-3 išvestis yra gerai žinoma dėl savo aukštos kokybės išvesties, tai nėra vienintelis kalbos numatymo modelis, kurį galite naudoti.
Peržiūrėkime kai kuriuos konkuruojančius modelius, kuriuos galite naudoti kaip GPT-3 alternatyvą.
1. GPT-J
GPT-J yra atvirojo kodo kalbos modelis, sukurtas Eleuther AI grupės.
Nulinis našumas yra maždaug toks pat kaip GPT-3 ir yra daug artimesnis nei daugelio kitų GPT diegimų.
6 milijardų parametrų autoregresyvaus teksto generavimo modelis buvo parengtas remiantis duomenų rinkiniu, vadinamu „Krūva“.
Krūva iš tikrųjų yra 22 mažesnių duomenų rinkinių, sujungtų kartu, derinys. Jo bendras failo dydis yra 825 GiB ir buvo pastebėta, kad jame daugiau dėmesio skiriama akademiniams ir profesionaliems šaltiniams.
Per tai galite patys išbandyti modelį nemokama žiniatinklio programa.
Galėjau išbandyti modelį su paprastu raginimu. GPT-J pavyko išvardyti „geriausius būdus išmokti naują kalbą šiandien“.
Tačiau atlikimas yra šiek tiek dėmėtas, kai bandžiau jo paprašyti paaiškinti, kas yra autoregresyvus teksto generavimo modelis.
Nors išvestis buvo prasminga, ji iš tikrųjų neatsakė į raginimą prasmingai.
Kainos
Kadangi GPT-J yra atvirojo kodo modelis, iš tikrųjų galite patys paleisti savo egzempliorių. Pagal oficialią saugyklą, modelis sukurtas veikti tensoriniame apdorojimo bloke (TPU). Nors tai yra optimali, tai gali būti ne pati ekonomiškiausia parinktis, nes „Google“ pigiausia debesies TPU kaina apie 4.50 USD/val.
Ilgainiui gali būti pigiau naudoti savo GPU arba išsinuomoti specialų GPU serverį per tokias paslaugas kaip Vast.ai or „FluidStack“..
2. Juros periodas-1
„Jurassic-1“ yra kalbos modelis, kurį išleido AI21 Labs, Izraelio AI įmonė, kuri specializuojasi NLP. Kaip ir OpenAI, jie taip pat siūlo API, leidžiančią pasiekti jų kalbos modelį.
Galite susikurti paskyrą pas juos Interneto svetainė Norėdami pasiekti žaidimų aikštelės žiniatinklio programą ir patys išbandyti modelį.
„AI21 Studio“ taip pat turi funkciją, kurią naudodami galite mokyti ir pateikti užklausas pagal savo pasirinktines jų „Jurassic-1“ modelių versijas. Pasak an oficialus tinklaraščio įrašas, pasirinktiniai modeliai, turintys vos penkiasdešimt pavyzdžių, gali pranokti greitą inžineriją naudojant originalų modelį.
Kainos
Jie siūlo lanksčią naudojimu pagrįstą kainodarą kiekvienam iš trijų bazinių modelių. Pavyzdžiui, jie ima 0.25 USD už kiekvieną 1000 modelio sugeneruotų žetonų. Vidutiniškai kiekvienas ženklas yra maždaug 1 žodis arba šeši simboliai.
Tai reiškia, kad galite naudoti geriausią AI21 modelį, kad sukurtumėte 4000 žodžių dokumentą tik už 1 USD. Tačiau vienas dalykas, kurį turite atsiminti, yra tai, kad norėdami naudoti modelį, kiekvieną mėnesį vis tiek turite mokėti mažiausiai 29 USD.
3. TextSynth
TextSynth yra dar viena NLP žiniatinklio paslauga, kurią galite naudoti tekstui generuoti. Skirtingai nuo dviejų ankstesnių pavyzdžių, TextSynth nėra atskiras modelis. Paslauga suteikia vartotojui prieigą prie įvairių kitų atvirojo kodo didelių kalbų modelių, tokių kaip GPT-NeoX, M2M100 ir net GPT-J.
Kūrėjai gali naudoti savo POILSIO API integruoti kalbos modelius į savo programas. Galite pabandyti patikrinti juos nemokamai žaidimų aikštelės puslapis norėdami pamatyti, kaip veikia kiekvienas turimas modelis.
Kainos
Jų nemokamas planas suteikia prieigą prie visų jų kalbų modelių su tam tikrais tarifų apribojimais. Paslauga apriboja kiekvieną užklausą iki 200 žetonų.
Standartinis planas pašalina sugeneruotų žetonų skaičiaus apribojimą. Kainodaros modelis yra pagrįstas kreditu, kad būtų išvengta netikėtų išlaidų. Minimalus įsigyjamų kreditų skaičius yra 20 USD. Nepanaudoti kreditai negalioja po metų.
Kiekvienos užklausos kaina priklauso nuo įvesties ir sugeneruotų žetonų skaičiaus. Remiantis lentele jų oficialioje svetainėje, galite tikėtis sumokėti apie 0.75–1.25 USD už pigesnių modelių naudojimą.
Išvada
Tikimės, kad šis straipsnis padės rasti prieinamą ir veiksmingą kalbos modelį, kurį galėtumėte naudoti kaip OpenAI GPT-3 alternatyva.
Dideli kalbų modeliai yra labai galingi ir gali būti naudojami įvairioms užduotims atlikti. Jie gali būti naudojami tekstui generuoti, versti iš vienos kalbos į kitą, suprasti natūralią kalbą ir į ją reaguoti.
Remiantis mano tyrimais erdvėje ir atliktais bandymais, GPT-3 vis dar lenkia visus kitus didelis kalbos modelis Aš bandžiau. Tačiau tai gali pasikeisti ateityje, kai mokslininkai kuria ir išleidžia naujus modelius.
„Google“, „Facebook“ ir kitų AI laboratorijų tyrėjai ir toliau dirbs siekdami tobulinti savo LMM. Neabejotinai įmanoma, kad viena iš šių AI komandų išleis modelį, pranašesnį už GPT-3.
Palikti atsakymą