Мазмұны[Жасыру][Көрсету]
Үлкен тілдік модельдер табиғи тілдегі бағдарламалау және нейрондық желілер саласындағы ең әсерлі соңғы жаңалықтардың бірі болып табылады.
OpenAI GPT-3 ең жақсы өнімді модельдердің бірі ретінде ерекшеленеді. Модельдің шығарылымы көбінесе адамдардан келетін мәтіннен айырмашылығы жоқ.
Дегенмен, GPT-3 әлі де жабық бастапқы модель болып табылады. Керемет күшті болғанымен, оны белгілі бір пайдалану жағдайлары үшін жарамсыз ететін белгілі бір шектеулер бар.
Бұл мақалада біз бірнеше үлкен тақырыпты қарастырамыз тілдік модельдер бұл GPT-3 шикі өнімділігімен бәсекелесе алады.
Неліктен OpenAI GPT-3 баламасын іздеу керек?
OpenAI GPT-3 үлгісі жетілдірілген үлгілерді пайдаланады терең білім алу адамға ұқсас мәтін шығаруға арналған модельдер. Бұл OpenAI зерттеу зертханасының үшінші буындағы тілді болжау үлгісі.
Модель бастапқыда OpenAI 2021 жылдың соңында API-ді көпшілікке ашқанға дейін жабық бета нұсқасы ретінде шығарылды.
Қазіргі уақытта GPT-3-те таңдауға болатын төрт негізгі үлгі бар. Ada, ең арзан және ең жылдам модель 0.0004 таңбалауыш үшін бар болғаны $1000 тұрады. OpenAI-дің ең қуатты моделі Davinci 0.02 токенге 1000 доллар тұрады немесе шамамен 50 есе қымбат.
OpenAI сонымен қатар әзірлеушіден өз әрекеттерін орындауды талап етеді пайдалану нұсқаулары. Әзірлеуші сонымен қатар әзірлеушінің қолданбасы қолмен қарау процесі арқылы мақұлданғаннан кейін ұлғайтылуы мүмкін шектеулі пайдалану квотасын қамтамасыз етеді.
GPT-3 шығысы өзінің жоғары сапалы шығысымен танымал болғанымен, ол сіз қолдануға болатын жалғыз тілді болжау үлгісі емес.
GPT-3-ке балама ретінде пайдалануға болатын кейбір бәсекелес үлгілерді қарастырайық.
1. GPT-J
GPT-J – Eleuther AI тобының ашық бастапқы тіл үлгісі.
Нөлдік түсірілім өнімділігі шамамен GPT-3-пен тең және көптеген басқа GPT енгізулеріне қарағанда өнімділік жағынан әлдеқайда жақын.
6 миллиард параметрі бар авторегрессивті мәтінді генерациялау моделі «The Pile» деп аталатын деректер жиынында оқытылды.
Қада шын мәнінде бірге біріктірілген 22 кішірек деректер жиынының комбинациясы. Оның жалпы файл өлшемі 825 ГБ және академиялық және кәсіби дереккөздерге көбірек көңіл бөлетіні байқалды.
Осы арқылы сіз үлгіні өзіңіз тексере аласыз тегін веб-қосымша.
Мен үлгіні қарапайым нұсқау арқылы сынап көрдім. GPT-J «бүгінгі таңда жаңа тілді үйренудің ең жақсы жолдарын» санап шықты.
Дегенмен, мен оны авторегрессивті мәтінді құру үлгісінің не екенін түсіндіруді сұрауға тырысқанда, өнімділік біршама нашар болды.
Шығару мағынасы болғанымен, ол нақты жауапқа мағыналы жауап бермеді.
Баға
GPT-J ашық бастапқы үлгі болғандықтан, сіз өз дананы өзіңіз іске қоса аласыз. сәйкес ресми репозиторий, модель тензорлық өңдеу блогында (TPU) жұмыс істеуге арналған. Оңтайлы болғанымен, бұл Google-дың ең арзан нұсқасынан кейін ең үнемді нұсқа болмауы мүмкін бұлтты TPU құны шамамен $4.50/сағ.
Ұзақ мерзімді перспективада жеке GPU пайдалану немесе қызметтер арқылы арнайы GPU серверін жалға алу арзанырақ болуы мүмкін Vast.ai or FluidStack.
2. Юра-1
Jurassic-1 — NLP саласында маманданған израильдік AI компаниясы AI21 Labs шығарған тіл үлгісі. OpenAI сияқты, олар өздерінің тіл үлгісіне қол жеткізуге мүмкіндік беретін API ұсынады.
Сіз олардың есептік жазбасын жасай аласыз сайтқа Үлгіні өзіңіз сынау үшін ойын алаңының веб қолданбасына кіру.
AI21 Studio сонымен қатар олардың Jurassic-1 үлгілерінің жеке теңшелетін нұсқаларын үйретуге және сұрауға болатын мүмкіндікті қамтиды. сәйкес а ресми бюллетень, аз ғана елу мысалдары бар теңшелетін үлгілер бастапқы үлгіні пайдаланып жылдам инженериядан асып түседі.
Баға
Олар өздерінің үш негізгі үлгісінің әрқайсысы үшін пайдалануға негізделген икемді бағаны ұсынады. Мысалы, олар модель жасаған әрбір 0.25 токен үшін $1000 алады. Орташа алғанда, әрбір таңбалауыш шамамен 1 сөзден немесе алты таңбадан тұрады.
Бұл бар болғаны 21 долларға 4000 сөзден тұратын құжатты жасау үшін AI1 ең жақсы үлгісін пайдалануға болатынын білдіреді. Есіңізде болсын, модельді пайдалану үшін ай сайын кемінде $29 төлеу керек.
3. TextSynth
TextSynth - мәтін жасау үшін пайдалануға болатын басқа NLP веб-қызметі. Алдыңғы екі мысалдан айырмашылығы, TextSynth дербес үлгі емес. Бұл қызмет пайдаланушыға GPT-NeoX, M2M100 және тіпті GPT-J сияқты басқа да ашық бастапқы үлкен тіл үлгілеріне рұқсат беру арқылы жұмыс істейді.
Әзірлеушілер оларды пайдалана алады REST API тілдік модельдерді өз қолданбаларына біріктіру. Оларды тегін тексеріп көруге болады ойын алаңы беті әрбір қолжетімді үлгінің қалай жұмыс істейтінін көру үшін.
Баға
Олардың тегін жоспары кейбір тарифтік шектеулері бар барлық тіл үлгілеріне қол жеткізуге мүмкіндік береді. Қызмет әрбір сұрауды 200 токен ұзындығымен шектейді.
Стандартты жоспар жасалған таңбалауыштар санына шектеуді жояды. Баға моделі күтпеген шығындарды болдырмау үшін несиеге негізделген. Сатып алуға болатын несиелердің ең аз саны - $20. Бір жылдан кейін пайдаланылмаған несиелер жарамсыз болып табылады.
Әрбір сұраудың бағасы енгізілген және жасалған таңбалауыштардың санына негізделген. Ресми веб-сайттағы кестеге сүйене отырып, олардың арзан үлгілерін пайдалану үшін шамамен $0.75-1.25 төлеуге болады.
қорытынды
Бұл мақала сізге қол жетімді және тиімді тіл үлгісін табуға көмектеседі деп үміттенеміз OpenAI GPT-3 балама.
Үлкен тіл үлгілері өте қуатты және әртүрлі тапсырмалар үшін пайдаланылуы мүмкін. Оларды мәтін құру, тілдер арасында аудару және табиғи тілді түсіну және оған жауап беру үшін пайдалануға болады.
Ғарыштағы зерттеулеріме және мен жүргізген сынақтарға сүйене отырып, GPT-3 әлі де басқаларынан асып түседі. үлкен тілдік модель Мен тырыстым. Дегенмен, бұл болашақта өзгеруі мүмкін, өйткені зерттеушілер жаңа үлгілерді жасап шығарады.
Google, Facebook және басқа AI зертханаларының зерттеушілері әлі де өздерінің LMM-терін жетілдіру бойынша жұмысты жалғастырады. Бұл AI командаларының бірі GPT-3-тен жоғары үлгімен шығуы мүмкін.
пікір қалдыру