Suured keelemudelid on mõned kõige muljetavaldavamad hiljutised arengud loomuliku keele programmeerimise ja närvivõrkude valdkonnas.
OpenAI GPT-3 paistab silma ühe parima jõudlusega mudelina. Mudeli väljund on sageli inimestelt pärit tekstist eristamatu.
Kuid GPT-3 on endiselt suletud lähtekoodiga mudel. Kuigi see on uskumatult võimas, on teatud piirangud, mis võivad muuta selle teatud kasutusjuhtudel sobimatuks.
Selles artiklis käsitleme mõnda suurt keelemudelid mis suudab konkureerida GPT-3 töötlemata jõudlusega.
Miks otsida OpenAI GPT-3 alternatiivi?
OpenAI GPT-3 mudel kasutab täiustatud sügav õpe mudeleid inimsarnase teksti loomiseks. See on OpenAI uurimislabori kolmanda põlvkonna keeleennustusmudel.
Mudel avaldati algselt suletud beetaversioonina, enne kui OpenAI lõpuks API avalikkusele 2021. aasta lõpus avas.
Praegu on GPT-3-l neli baasmudelit, mille vahel saate valida. Ada, odavaim ja kiireim mudel, maksab vaid 0.0004 dollarit 1000 märgi kohta. OpenAI võimsaim mudel Davinci maksab 0.02 dollarit 1000 märgi kohta ehk umbes 50 korda kallim.
OpenAI nõuab ka, et arendaja järgiks oma kasutamise juhised. Arendaja pakub ka piiratud kasutuskvoodi, mida saab suurendada, kui arendaja taotlus on käsitsi ülevaatamise käigus heaks kiidetud.
Kuigi GPT-3 väljund on tuntud oma kvaliteetse väljundi poolest, pole see ainus keeleennustusmudel, mida saate kasutada.
Vaatame üle mõned konkureerivad mudelid, mida saate GPT-3 alternatiivina kasutada.
1. GPT-J
GPT-J on Eleuther AI grupi avatud lähtekoodiga keelemudel.
Null-shot jõudlus on ligikaudu samaväärne GPT-3-ga ja on jõudluses palju lähemal kui paljudel teistel GPT-rakendustel.
6 miljardi parameetriga autoregressiivse teksti genereerimise mudelit on õpetatud andmekogumile, mida tuntakse kui "The Pile".
Kuhi on tegelikult 22 väiksema andmestiku kombinatsioon. Selle kombineeritud failimaht on 825 GiB ja on täheldatud, et sellel on rohkem rõhku akadeemilistele ja professionaalsetele allikatele.
Selle kaudu saate mudelit ise katsetada tasuta veebirakendus.
Sain mudelit testida lihtsa viipaga. GPT-J-l õnnestus loetleda "tänapäeval parimad viisid uue keele õppimiseks".
Esitus on aga mõnevõrra täpiline, kui püüdsin sellelt küsida, mis on autoregressiivne teksti genereerimise mudel.
Ehkki väljund oli mõttekas, ei vastanud see tegelikult viipale sisukalt.
hinnapoliitika
Kuna GPT-J on avatud lähtekoodiga mudel, saate tegelikult ise oma eksemplari käitada. Vastavalt ametlik hoidla, on mudel loodud töötama tensorprotsessoris (TPU). Kuigi see on optimaalne, ei pruugi see olla kõige kuluefektiivsem variant, kuna Google'i odavaim pilve-TPU-d maksavad umbes 4.50 dollarit tunnis.
Pikemas perspektiivis võib oma GPU kasutamine või spetsiaalse GPU-serveri rentimine selliste teenuste kaudu olla odavam Vast.ai or FluidStack.
2. Juura-1
Jurassic-1 on keelemudel, mille on välja andnud NLP-le spetsialiseerunud Iisraeli AI-ettevõte AI21 Labs. Sarnaselt OpenAI-le pakuvad nad ka API-d, mis võimaldab teil pääseda juurde nende keelemudelile.
Saate neile konto luua veebisait et pääseda juurde mänguväljaku veebirakendusele, et mudelit ise testida.
AI21 Studio sisaldab ka funktsiooni, mille abil saate oma Jurassic-1 mudelite kohandatud versioone treenida ja päringuid teha. Vastavalt an ametlik blogi postitus, kohandatud mudelid, millel on vaid viiskümmend näidet, suudavad esialgset mudelit kasutades ületada kiire projekteerimise.
hinnapoliitika
Nad pakuvad paindlikku kasutuspõhist hinnakujundust iga kolme põhimudeli jaoks. Näiteks võtavad nad 0.25 dollarit iga mudeli loodud 1000 märgi eest. Keskmiselt on iga märgis ligikaudu 1 sõna või kuus märki.
See tähendab, et saate kasutada AI21 parimat mudelit 4000-sõnalise dokumendi loomiseks vaid 1 dollari eest. Üks asi, mida peate siiski meeles pidama, on see, et mudeli kasutamiseks peate iga kuu maksma vähemalt 29 dollarit.
3. TextSynth
TextSynth on veel üks NLP veebiteenus, mida saate kasutada teksti genereerimiseks. Erinevalt kahest eelmisest näitest ei ole TextSynth iseseisev mudel. Teenus töötab, andes kasutajale juurdepääsu mitmesugustele teistele avatud lähtekoodiga suurtele keelemudelitele, nagu GPT-NeoX, M2M100 ja isegi GPT-J.
Arendajad saavad kasutada oma REST API keelemudelite integreerimiseks oma rakendustesse. Võite proovida neid tasuta vaadata mänguväljaku leht et näha, kuidas iga saadaolev mudel toimib.
hinnapoliitika
Nende tasuta pakett annab teile juurdepääsu kõigile nende keelemudelitele teatud piirangutega. Teenus piirab iga päringu pikkust 200 märgini.
Standardplaan eemaldab genereeritud žetoonide arvu piirangu. Hinnakujundusmudel on krediidipõhine, et vältida ootamatuid kulutusi. Minimaalne krediitide arv ostmiseks on 20 dollarit. Kasutamata krediit on aasta pärast kehtetu.
Iga päringu hind põhineb sisendi ja genereeritud žetoonide arvul. Nende ametlikul veebisaidil oleva tabeli põhjal võite nende odavamate mudelite kasutamise eest maksta umbes 0.75–1.25 dollarit.
Järeldus
Loodetavasti aitab see artikkel teil leida taskukohase ja tõhusa keelemudeli, mida saate kasutada OpenAI GPT-3 alternatiiv.
Suured keelemudelid on väga võimsad ja neid saab kasutada mitmesuguste ülesannete jaoks. Neid saab kasutada teksti genereerimiseks, keelte vahel tõlkimiseks ning loomuliku keele mõistmiseks ja sellele reageerimiseks.
Tuginedes minu uurimistööle ruumis ja läbi viidud testidele, ületab GPT-3 endiselt kõiki teisi suur keelemudel Ma olen proovinud. See võib aga tulevikus muutuda, kuna teadlased töötavad välja ja välja annavad uusi mudeleid.
Google'i, Facebooki ja teiste tehisintellekti laborite teadlased jätkavad endiselt omaenda LMM-ide edendamist. Kindlasti on võimalik, et üks neist AI-meeskondadest tuleb välja mudeliga, mis on parem kui GPT-3.
Jäta vastus