Зміст[Сховати][Показати]
Великі мовні моделі є одними з найбільш вражаючих останніх розробок у галузі програмування природною мовою та нейронних мереж.
GPT-3 від OpenAI виділяється як одна з найефективніших моделей. Вихідні дані моделі часто неможливо відрізнити від тексту, що надходить від людей.
Однак GPT-3 все ще є моделлю із закритим кодом. Незважаючи на неймовірну потужність, є певні обмеження, які можуть зробити її непридатною для певних випадків використання.
У цій статті ми розглянемо кілька великих мовні моделі які можуть конкурувати з продуктивністю GPT-3.
Навіщо шукати альтернативу OpenAI GPT-3?
Модель OpenAI GPT-3 використовує розширені глибоке навчання моделі для створення людиноподібного тексту. Це модель передбачення мови третього покоління від дослідницької лабораторії OpenAI.
Модель спочатку була випущена як закрита бета-версія, перш ніж OpenAI зрештою відкрив API для громадськості наприкінці 2021 року.
Наразі GPT-3 має чотири базові моделі на вибір. Ada, найдешевша та найшвидша модель, коштує лише $0.0004 за 1000 токенів. Найпотужніша модель OpenAI, Davinci, коштує $0.02 за 1000 токенів, або приблизно в 50 разів дорожче.
OpenAI також вимагає від розробника дотримуватися власного інструкції з використання. Розробник також надасть обмежену квоту на використання, яку можна буде збільшити, коли заявку розробника буде схвалено шляхом перевірки вручну.
Хоча вихід GPT-3 добре відомий своєю високою якістю, це не єдина модель прогнозування мови, доступна для використання.
Давайте розглянемо деякі конкуруючі моделі, які можна використовувати як альтернативу GPT-3.
1. GPT-J
GPT-J — це модель мови з відкритим вихідним кодом, розроблена групою Eleuther AI.
Продуктивність нульового удару приблизно відповідає GPT-3 і набагато ближча за продуктивністю, ніж багато інших реалізацій GPT.
Модель авторегресійного генерування тексту з 6 мільярдами параметрів була навчена на наборі даних, відомому як «The Pile».
Купа насправді є комбінацією 22 менших наборів даних, об’єднаних разом. Він має загальний розмір файлу 825 ГіБ і, як було помічено, має більший акцент на академічних і професійних джерелах.
Ви можете перевірити модель самостійно безкоштовний веб-додаток.
Я зміг випробувати модель за допомогою простої підказки. GPT-J вдалося перерахувати «найкращі способи вивчення нової мови сьогодні».
Однак продуктивність була дещо нерівною, коли я спробував попросити його пояснити, що таке модель авторегресійного генерування тексту.
Хоча результат мав сенс, він насправді не відповідав на підказку змістовним чином.
Ціни
Оскільки GPT-J є моделлю з відкритим вихідним кодом, ви можете запустити власний екземпляр самостійно. Відповідно з офіційний репозиторій, модель розроблена для роботи на тензорному процесорі (TPU). Незважаючи на те, що це оптимально, це може бути не найвигіднішим варіантом, оскільки він найдешевший у Google вартість хмарних TPU приблизно 4.50 дол./год.
У довгостроковій перспективі може бути менш дорогим використання власного GPU або оренда виділеного GPU-сервера через такі служби, як Vast.ai or FluidStack.
2. Юра-1
Jurassic-1 — це мовна модель, випущена AI21 Labs, ізраїльською компанією штучного інтелекту, яка спеціалізується на НЛП. Як і OpenAI, вони також пропонують API, який дозволяє отримати доступ до їх мовної моделі.
Ви можете створити обліковий запис на них сайт отримати доступ до веб-програми ігрового майданчика, щоб самостійно перевірити модель.
AI21 Studio також містить функцію, за допомогою якої ви можете навчатися та запитувати власні версії їхніх моделей Jurassic-1. Згідно з ан офіційна публікація в блозі, користувальницькі моделі всього з п’ятдесятьма прикладами можуть перевершити оперативне проектування з використанням оригінальної моделі.
Ціни
Вони пропонують гнучку ціну на основі використання для кожної з трьох базових моделей. Наприклад, вони стягують $0.25 за кожні 1000 токенів, згенерованих моделлю. У середньому кожен токен складається приблизно з 1 слова або шести символів.
Це означає, що ви можете використовувати найкращу модель AI21 для створення документа з 4000 слів лише за 1 долар США. Одна річ, яку ви повинні пам’ятати, полягає в тому, що вам все одно потрібно платити мінімум 29 доларів щомісяця, щоб використовувати цю модель.
3. TextSynth
TextSynth — ще один веб-сервіс NLP, який можна використовувати для створення тексту. На відміну від попередніх двох прикладів, TextSynth не є окремою моделлю. Служба працює, надаючи користувачеві доступ до різних інших великих мовних моделей з відкритим кодом, таких як GPT-NeoX, M2M100 і навіть GPT-J.
Розробники можуть використовувати свої REST API інтегрувати мовні моделі у власні програми. Ви можете спробувати перевірити їх безкоштовно сторінка дитячого майданчика щоб побачити, як працює кожна доступна модель.
Ціни
Їхній безкоштовний план надає вам доступ до всіх їхніх мовних моделей із деякими обмеженнями щодо швидкості. Сервіс обмежує довжину кожного запиту до 200 токенів.
Стандартний план знімає обмеження на кількість згенерованих токенів. Модель ціноутворення заснована на кредиті, щоб уникнути несподіваних витрат. Мінімальна кількість кредитів для покупки становить 20 доларів США. Невикористані кредити недійсні через рік.
Ціна кожного запиту залежить від кількості введених і згенерованих токенів. Виходячи з таблиці на їхньому офіційному веб-сайті, ви можете розраховувати заплатити приблизно від 0.75 до 1.25 доларів США за використання їхніх дешевших моделей.
Висновок
Сподіваємось, ця стаття допоможе вам знайти доступну та ефективну модель мови, яку ви можете використовувати як Альтернатива OpenAI GPT-3.
Великі мовні моделі є дуже потужними і можуть використовуватися для різноманітних завдань. Їх можна використовувати для створення тексту, перекладу між мовами, а також для розуміння природної мови та відповіді на неї.
Грунтуючись на моїх дослідженнях у космосі та тестах, які я провів, GPT-3 все ще перевершує всі інші велика модель мови Я пробував. Однак це може змінитися в майбутньому, оскільки дослідники розроблятимуть і випускатимуть нові моделі.
Дослідники Google, Facebook та інших лабораторій штучного інтелекту продовжуватимуть працювати над вдосконаленням власних LMM. Цілком можливо, що одна з цих команд штучного інтелекту випустить модель, кращу за GPT-3.
залишити коментар