Velké jazykové modely jsou některé z nejpůsobivějších nedávných vývojů v oblasti programování přirozeného jazyka a neuronových sítí.
OpenAI GPT-3 vyniká jako jeden z nejvýkonnějších modelů. Výstup modelu je často k nerozeznání od textu pocházejícího od lidí.
GPT-3 je však stále model s uzavřeným zdrojovým kódem. I když je neuvěřitelně výkonný, existují určitá omezení, která mohou způsobit, že nebude vhodný pro určité případy použití.
V tomto článku se podíváme na několik velkých jazykové modely které mohou konkurovat hrubému výkonu GPT-3.
Proč hledat alternativu OpenAI GPT-3?
Model GPT-3 OpenAI využívá pokročilé hluboké učení modely, které vytvoří text podobný člověku. Je to model jazykové predikce třetí generace z výzkumné laboratoře OpenAI.
Model byl původně vydán jako uzavřená beta, než OpenAI na konci roku 2021 nakonec API otevřelo veřejnosti.
V současné době má GPT-3 čtyři základní modely, ze kterých si můžete vybrat. Ada, nejlevnější a nejrychlejší model stojí pouze 0.0004 $ za 1000 tokenů. Nejvýkonnější model OpenAI, Davinci, stojí 0.02 $ za 1000 tokenů, tedy asi 50krát dražší.
OpenAI také vyžaduje, aby se vývojář řídil svým vlastním pokyny k použití. Vývojář také poskytne omezenou kvótu využití, kterou lze zvýšit, jakmile bude vývojářova aplikace schválena procesem ruční kontroly.
I když je výstup GPT-3 známý pro svůj vysoce kvalitní výstup, není to jediný jazykový predikční model, který můžete použít.
Pojďme se podívat na některé konkurenční modely, které můžete použít jako alternativu ke GPT-3.
1. GPT-J
GPT-J je jazykový model s otevřeným zdrojovým kódem od skupiny Eleuther AI.
Výkon zero-shot je zhruba na stejné úrovni jako GPT-3 a je mnohem blíže výkonu než mnoho jiných implementací GPT.
Model autoregresivního generování textu s 6 miliardami parametrů byl natrénován na datovém souboru známém jako „The Pile“.
Hromada je ve skutečnosti kombinací 22 menších datových sad spojených dohromady. Má kombinovanou velikost souboru 825 GiB a bylo pozorováno, že klade větší důraz na akademické a profesionální zdroje.
Prostřednictvím toho si můžete model sami vyzkoušet bezplatná webová aplikace.
Model jsem mohl vyzkoušet jednoduchým příkazem. GPT-J uspěl ve výčtu „nejlepších způsobů, jak se dnes naučit nový jazyk“.
Výkon je však poněkud flekatý, když jsem se ho pokusil požádat, abych vysvětlil, co je to autoregresivní model generování textu.
I když výstup dával smysl, ve skutečnosti neodpovídal na výzvu smysluplným způsobem.
CENY
Vzhledem k tomu, že GPT-J je model s otevřeným zdrojovým kódem, můžete si vlastní instanci spustit sami. Podle úřední úložiště, model je navržen pro provoz na procesorové jednotce tensor (TPU). I když je to optimální, nemusí to být nákladově nejefektivnější možnost, protože je nejlevnější od Googlu náklady na cloudové TPU asi 4.50 $/hod.
Z dlouhodobého hlediska může být levnější používat vlastní GPU nebo si pronajmout vyhrazený GPU server prostřednictvím služeb, jako jsou Vast.ai or FluidStack.
2. Jurský-1
Jurassic-1 je jazykový model vydaný AI21 Labs, izraelskou společností AI, která se specializuje na NLP. Stejně jako OpenAI nabízejí také API, které vám umožní přístup k jejich jazykovému modelu.
Můžete si na nich vytvořit účet webových stránkách pro přístup k webové aplikaci hřiště a otestování modelu na vlastní kůži.
AI21 Studio také obsahuje funkci, kde můžete trénovat a dotazovat se na své vlastní verze jejich modelů Jurassic-1. Podle an oficiální blogový příspěvekVlastní modely s pouhými padesáti příklady mohou překonat rychlé inženýrství s použitím původního modelu.
CENY
Nabízejí flexibilní ceny založené na použití pro každý ze svých tří základních modelů. Například si účtují 0.25 $ za každých 1000 tokenů vygenerovaných modelem. V průměru má každý token přibližně 1 slovo nebo šest znaků.
To znamená, že můžete použít nejlepší model AI21 k vytvoření dokumentu o 4000 slovech za pouhých 1 $. Jedna věc, kterou si však musíte zapamatovat, je, že za používání modelu musíte každý měsíc zaplatit minimálně 29 USD.
3. TextSynth
TextSynth je další webová služba NLP, kterou můžete použít ke generování textu. Na rozdíl od předchozích dvou příkladů není TextSynth samostatný model. Služba funguje tak, že uživateli poskytuje přístup k různým dalším open source velkým jazykovým modelům, jako jsou GPT-NeoX, M2M100 a dokonce GPT-J.
Vývojáři mohou využít jejich REST API integrovat jazykové modely do vlastních aplikací. Můžete si je vyzkoušet zdarma stránka hřiště abyste viděli, jak fungují jednotlivé dostupné modely.
CENY
Jejich bezplatný plán vám umožňuje přístup ke všem jejich jazykovým modelům s určitými limity sazeb. Služba omezuje každý požadavek na délku 200 tokenů.
Standardní plán odstraňuje omezení počtu generovaných tokenů. Cenový model je založen na úvěru, aby se zabránilo neočekávaným výdajům. Minimální počet kreditů pro nákup je 20 $. Nevyužité kredity jsou po roce neplatné.
Cena každého požadavku se odvíjí od počtu vstupních a vygenerovaných tokenů. Na základě tabulky na jejich oficiálních stránkách můžete očekávat, že za používání jejich levnějších modelů zaplatíte přibližně 0.75 až 1.25 USD.
Proč investovat do čističky vzduchu?
Doufejme, že vám tento článek pomůže najít cenově dostupný a efektivní jazykový model, který můžete použít jako jazykový model Alternativa OpenAI GPT-3.
Velké jazykové modely jsou velmi výkonné a lze je použít pro různé úkoly. Lze je použít ke generování textu, překladu mezi jazyky a porozumění přirozenému jazyku a reakci na něj.
Na základě mého výzkumu ve vesmíru a testů, které jsem provedl, GPT-3 stále překonává všechny ostatní velký jazykový model Zkusil jsem. To by se však mohlo v budoucnu změnit, protože výzkumníci vyvíjejí a uvolňují nové modely.
Výzkumníci z Googlu, Facebooku a dalších laboratoří umělé inteligence budou i nadále pokračovat v práci na vývoji svých vlastních LMM. Je jistě možné, že jeden z těchto týmů AI přijde s modelem lepším než GPT-3.
Napsat komentář