Orodha ya Yaliyomo[Ficha][Onyesha]
Miundo mikubwa ya lugha ni baadhi ya matukio ya hivi majuzi yanayovutia zaidi katika uga wa programu za lugha asilia na mitandao ya kiakili.
GPT-3 ya OpenAI inajitokeza kama mojawapo ya miundo inayofanya kazi vizuri zaidi huko nje. Matokeo ya modeli mara nyingi huwa hayatofautiani na maandishi yanayotoka kwa wanadamu.
Walakini, GPT-3 bado ni mfano wa chanzo kilichofungwa. Ingawa ina nguvu sana, kuna vikwazo fulani ambavyo vinaweza kuifanya isifae kwa visa fulani vya utumiaji.
Katika makala hii, tutapitia chache kubwa mifano ya lugha ambayo inaweza kushindana na utendaji mbichi wa GPT-3.
Kwa nini Utafute Mbadala wa OpenAI GPT-3?
Mfano wa GPT-3 wa OpenAI unatumia hali ya juu kujifunza kwa kina mifano ya kutoa maandishi yanayofanana na binadamu. Ni modeli ya utabiri wa lugha ya kizazi cha tatu kutoka kwa maabara ya utafiti ya OpenAI.
Mtindo huo hapo awali ulitolewa kama beta iliyofungwa kabla OpenAI hatimaye kufungua API kwa umma mwishoni mwa 2021.
Kwa sasa, GPT-3 ina miundo minne ya msingi ambayo unaweza kuchagua. Ada, mtindo wa bei nafuu na wa haraka zaidi unagharimu $0.0004 tu kwa tokeni 1000. Kielelezo chenye nguvu zaidi cha OpenAI, Davinci, kinagharimu $0.02 kwa tokeni 1000, au takriban mara 50 ghali zaidi.
OpenAI pia inahitaji msanidi programu kufuata yao miongozo ya matumizi. Msanidi pia atatoa kikomo cha matumizi ambacho kinaweza kuongezwa mara tu ombi la msanidi programu litakapoidhinishwa kupitia mchakato wa kukagua mwenyewe.
Ingawa toleo la GPT-3 linajulikana sana kwa matokeo yake ya ubora wa juu, sio modeli pekee ya utabiri wa lugha inayopatikana kwako kutumia.
Hebu tuchunguze baadhi ya mifano shindani ambayo unaweza kutumia kama mbadala wa GPT-3.
1. GPT-J
GPT-J ni modeli ya lugha huria na kikundi cha Eleuther AI.
Utendaji wa picha sifuri unakaribiana na GPT-3 na uko karibu zaidi katika utendakazi kuliko utekelezwaji mwingine mwingi wa GPT.
Muundo wa uzalishaji maandishi wa kigezo cha bilioni 6 umefunzwa kwenye seti ya data inayojulikana kama "The Pile".
Rundo kwa kweli ni mchanganyiko wa hifadhidata 22 ndogo zilizojumuishwa pamoja. Ina saizi ya faili iliyojumuishwa ya 825 GiB na imeonekana kuwa na msisitizo mkubwa kwenye vyanzo vya kitaaluma na kitaaluma.
Unaweza kujaribu mfano mwenyewe kupitia hii programu ya wavuti ya bure.
Niliweza kujaribu mfano kwa haraka rahisi. GPT-J ilifaulu kuorodhesha "njia bora za kujifunza lugha mpya leo".
Walakini, utendaji ni wa doa wakati nilijaribu kuiuliza ieleze ni mfano gani wa kizazi cha maandishi cha maandishi.
Ingawa matokeo yalikuwa na maana, kwa kweli haikujibu onyesho kwa njia ya maana.
bei
Kwa kuwa GPT-J ni mfano wa chanzo-wazi, unaweza kuendesha mfano wako mwenyewe. Kwa mujibu wa hazina rasmi, modeli imeundwa kuendeshwa kwenye kitengo cha usindikaji wa tensor (TPU). Ingawa ni bora zaidi, hili linaweza lisiwe chaguo la gharama nafuu zaidi kwa vile Google ni nafuu zaidi gharama ya TPU za wingu takriban $4.50/saa.
Inaweza kuwa ghali zaidi kwa muda mrefu kutumia GPU yako mwenyewe au kukodisha seva maalum ya GPU kupitia huduma kama vile Vast.ai or FluidStack.
2. Jurassic-1
Jurassic-1 ni kielelezo cha lugha kilichotolewa na AI21 Labs, kampuni ya Israeli ya AI inayobobea katika NLP. Kama OpenAI, pia hutoa API ambayo hukuruhusu kufikia muundo wao wa lugha.
Unaweza kuunda akaunti kwenye yao tovuti kufikia programu ya wavuti ya uwanja wa michezo ili kujijaribu mwenyewe kielelezo.
Studio ya AI21 pia inajumuisha kipengele ambapo unaweza kutoa mafunzo na kuuliza maswali kuhusu matoleo yako maalum ya miundo yao ya Jurassic-1. Kulingana na post blog rasmi, miundo maalum yenye mifano michache kama hamsini inaweza kufanya vyema zaidi katika uhandisi wa haraka kwa kutumia muundo asili.
bei
Wanatoa bei inayobadilika kulingana na utumiaji kwa kila moja ya miundo yao mitatu ya msingi. Kwa mfano, wao hutoza $ 0.25 kwa kila ishara 1000 zinazozalishwa na mfano. Kwa wastani, kila tokeni ina takriban neno 1 au herufi sita.
Hii inamaanisha kuwa unaweza kutumia muundo bora wa AI21 kuunda hati ya maneno 4000 kwa $1 pekee. Jambo moja unalohitaji kukumbuka ni kwamba bado unahitaji kulipa kima cha chini cha $29 kila mwezi ili kutumia modeli.
3. TextSynth
TextSynth ni huduma nyingine ya wavuti ya NLP ambayo unaweza kutumia kutengeneza maandishi. Tofauti na mifano miwili iliyopita, TextSynth sio mfano wa kujitegemea. Huduma hufanya kazi kwa kumpa mtumiaji ufikiaji wa modeli zingine za lugha kubwa za chanzo huria kama vile GPT-NeoX, M2M100 na hata GPT-J.
Watengenezaji wanaweza kutumia yao API YA REST kuunganisha miundo ya lugha katika matumizi yao wenyewe. Unaweza kujaribu kuangalia yao bila malipo ukurasa wa uwanja wa michezo ili kuona jinsi kila modeli inayopatikana inavyofanya kazi.
bei
Mpango wao wa bila malipo hukupa ufikiaji wa miundo yao yote ya lugha iliyo na viwango fulani vya viwango. Huduma inazuia kila ombi kwa urefu wa tokeni 200.
Mpango wa kawaida huondoa kikomo kwa idadi ya ishara zinazozalishwa. Muundo wa bei unategemea mkopo ili kuepuka gharama zisizotarajiwa. Idadi ya chini ya mikopo ya kununua ni $20. Mikopo ambayo haijatumika ni batili baada ya mwaka mmoja.
Bei ya kila ombi inategemea idadi ya pembejeo na tokeni zinazozalishwa. Kulingana na jedwali kwenye tovuti yao rasmi, unaweza kutarajia kulipa takriban $0.75 hadi $1.25 kwa kutumia miundo yao ya bei nafuu.
Hitimisho
Tunatumahi kuwa nakala hii inaweza kukusaidia kupata kielelezo cha lugha cha bei nafuu ambacho unaweza kutumia kama kielelezo Mbadala wa OpenAI GPT-3.
Miundo mikubwa ya lugha ina nguvu nyingi na inaweza kutumika kwa kazi mbalimbali. Zinaweza kutumika kutengeneza maandishi, kutafsiri kati ya lugha, na kuelewa na kujibu lugha asilia.
Kulingana na utafiti wangu katika nafasi na majaribio ambayo nimefanya, GPT-3 bado inazidi kila nyingine mfano wa lugha kubwa Nimejaribu. Hata hivyo, hii inaweza kubadilika katika siku zijazo kama watafiti kuendeleza na kutoa mifano mpya.
Watafiti katika Google, Facebook, na maabara zingine za AI bado wataendelea kufanya kazi katika kuendeleza LMM zao wenyewe. Hakika inawezekana kwamba moja ya timu hizi za AI itatoka na mfano bora kuliko GPT-3.
Acha Reply