Содржина[Крие][Прикажи]
Големите јазични модели се некои од најимпресивните неодамнешни случувања во областа на програмирање на природни јазици и невронски мрежи.
GPT-3 на OpenAI се издвојува како еден од моделите со најдобри перформанси таму. Излезот на моделот честопати не се разликува од текстот што доаѓа од луѓе.
Сепак, GPT-3 сè уште е модел со затворен извор. Иако е неверојатно моќен, постојат одредени ограничувања што може да го направат несоодветен за одредени случаи на употреба.
Во оваа статија, ќе разгледаме неколку големи јазични модели што може да се натпреварува со необработените перформанси на GPT-3.
Зошто да барате алтернатива OpenAI GPT-3?
Моделот GPT-3 на OpenAI користи напредни длабоко учење модели за производство на текст сличен на човекот. Тоа е моделот за предвидување на јазикот од третата генерација од истражувачката лабораторија на OpenAI.
Моделот првично беше објавен како затворена бета верзија пред OpenAI на крајот да го отвори API за јавноста кон крајот на 2021 година.
Во моментов, GPT-3 има четири основни модели од кои можете да изберете. Ада, најевтиниот и најбрзиот модел чини само 0.0004 долари за 1000 токени. Најмоќниот модел на OpenAI, Davinci, чини 0.02 долари за 1000 токени, или околу 50 пати поскапо.
OpenAI, исто така, бара од развивачот да го следи своето упатства за употреба. Програмерот исто така ќе обезбеди ограничена квота за користење што може да се зголеми откако апликацијата на развивачот ќе биде одобрена преку процес на рачно прегледување.
Иако излезот GPT-3 е добро познат по својот висококвалитетен излез, тој не е единствениот модел за предвидување на јазици што е достапен за користење.
Ајде да разгледаме некои конкурентни модели што можете да ги користите како алтернатива на GPT-3.
1. GPT-J
GPT-J е јазичен модел со отворен код од групата Eleuther AI.
Изведбата на нула снимка е приближно на исто ниво со GPT-3 и е многу поблиска во перформансите од многу други имплементации на GPT.
Моделот за авторегресивно генерирање текст од 6 милијарди параметри е обучен на збир на податоци познат како „Кугот“.
Купот всушност е комбинација од 22 помали збирки на податоци комбинирани заедно. Има комбинирана големина на датотека од 825 GiB и е забележано дека има поголем акцент на академските и професионалните извори.
Можете сами да го тестирате моделот преку ова бесплатна веб апликација.
Можев да го тестирам моделот со едноставно барање. GPT-J успеа да ги наброи „најдобрите начини за учење нов јазик денес“.
Како и да е, изведбата е донекаде забележлива кога се обидов да побарам да објасни што е модел за генерирање на авторегресивен текст.
Иако излезот имаше смисла, тој всушност не одговори на барањето на смислен начин.
Цени
Бидејќи GPT-J е модел со отворен код, вие всушност можете сами да извршите сопствен пример. Во согласност со официјално складиште, моделот е дизајниран да работи на единица за обработка на тензори (TPU). Иако е оптимална, ова можеби не е најисплатливата опција бидејќи е најевтината на Google цена на облак TPU околу 4.50 долари на час.
Можеби долгорочно ќе биде поевтино да користите сопствен графички процесор или да изнајмите посветен GPU сервер преку услуги како Vast.ai or FluidStack.
2. Јура-1
Jurassic-1 е јазичен модел издаден од AI21 Labs, израелска компанија за вештачка интелигенција која е специјализирана за НЛП. Како OpenAI, тие исто така нудат API што ви овозможува да пристапите до нивниот јазичен модел.
Можете да креирате сметка на нив за да пристапите до веб-апликација за игралиште за сами да го тестирате моделот.
Студиото AI21 исто така вклучува функција каде што можете да тренирате и да ги барате вашите сопствени сопствени верзии на нивните модели Јура-1. Според ан официјален блог пост, сопствените модели со само педесет примероци можат да го надминат брзото инженерство со користење на оригиналниот модел.
Цени
Тие нудат флексибилни цени засновани на употреба за секој од нивните три основни модели. На пример, тие наплаќаат 0.25 долари за секои 1000 токени генерирани од моделот. Во просек, секој токен е приближно 1 збор или шест знаци.
Ова значи дека можете да го користите најдобриот модел на AI21 за да креирате документ од 4000 зборови за само 1 долар. Сепак, едно нешто што треба да запомните е дека сепак треба да плаќате минимум 29 долари секој месец за да го користите моделот.
3. TextSynth
TextSynth е друга веб-услуга на NLP што можете да ја користите за генерирање текст. За разлика од претходните два примери, TextSynth не е самостоен модел. Услугата функционира така што му дава пристап на корисникот до разни други модели на големи јазици со отворен код како GPT-NeoX, M2M100, па дури и GPT-J.
Програмерите можат да ги користат нивните ОСТАНАТОТО API да ги интегрираат јазичните модели во нивните сопствени апликации. Може да се обидете да ги проверите нивните бесплатни страница за игралиште за да видите како функционира секој достапен модел.
Цени
Нивниот бесплатен план ви дава пристап до сите нивни јазични модели со одредени ограничувања на стапката. Услугата го ограничува секое барање на должина од 200 токени.
Стандардниот план го отстранува ограничувањето на бројот на генерирани токени. Моделот на цените е заснован на кредит за да се избегнат неочекувани трошоци. Минималниот број на кредити за купување е 20 долари. Неискористените кредити се неважечки по една година.
Цената на секое барање се заснова на бројот на влезни и генерирани токени. Врз основа на табелата на нивната официјална веб-страница, можете да очекувате да платите околу 0.75 до 1.25 долари за користење на нивните поевтини модели.
Заклучок
Се надеваме дека овој напис може да ви помогне да најдете достапен и ефективен јазичен модел што можете да го користите како Алтернатива OpenAI GPT-3.
Големите јазични модели се многу моќни и можат да се користат за различни задачи. Тие можат да се користат за генерирање текст, преведување меѓу јазици и разбирање и одговор на природниот јазик.
Врз основа на моето истражување во просторот и тестовите што ги спроведов, GPT-3 сè уште ги надминува сите други голем јазичен модел Се обидов. Сепак, ова може да се промени во иднина бидејќи истражувачите развиваат и објавуваат нови модели.
Истражувачите од Google, Facebook и другите лаборатории за вештачка интелигенција сè уште ќе продолжат да работат на унапредување на сопствените LMM. Сигурно е можно еден од овие тимови за вештачка интелигенција да излезе со модел супериорен од GPT-3.
Оставете Одговор