Содержание[Скрывать][Показывать]
Модели больших языков — одни из самых впечатляющих последних разработок в области программирования на естественном языке и нейронных сетей.
OpenAI GPT-3 выделяется как одна из самых эффективных моделей. Вывод модели часто неотличим от текста, исходящего от людей.
Однако GPT-3 по-прежнему является моделью с закрытым исходным кодом. Несмотря на то, что он невероятно мощный, существуют определенные ограничения, которые могут сделать его непригодным для определенных случаев использования.
В этой статье мы рассмотрим несколько крупных языковые модели что может конкурировать с производительностью GPT-3.
Зачем искать альтернативу OpenAI GPT-3?
В модели OpenAI GPT-3 используются расширенные глубокое обучение модели для создания человеческого текста. Это модель предсказания языка третьего поколения от исследовательской лаборатории OpenAI.
Первоначально модель была выпущена в виде закрытой бета-версии, прежде чем OpenAI в конце 2021 года открыл API для широкой публики.
В настоящее время GPT-3 предлагает вам на выбор четыре базовые модели. Ада, самая дешевая и быстрая модель, стоит всего 0.0004 доллара за 1000 токенов. Самая мощная модель OpenAI, Davinci, стоит 0.02 доллара за 1000 токенов, что примерно в 50 раз дороже.
OpenAI также требует, чтобы разработчик следовал собственным руководство по использованию. Разработчик также предоставит ограниченную квоту использования, которая может быть увеличена после того, как приложение разработчика будет одобрено в процессе ручной проверки.
Хотя выходные данные GPT-3 хорошо известны своим высоким качеством, это не единственная модель прогнозирования языка, которую вы можете использовать.
Давайте рассмотрим некоторые конкурирующие модели, которые вы можете использовать в качестве альтернативы GPT-3.
1. ГПТ-Дж
GPT-J — это языковая модель с открытым исходным кодом, разработанная группой Eleuther AI.
Производительность при нулевом выстреле примерно соответствует GPT-3 и намного ближе по производительности, чем многие другие реализации GPT.
Модель авторегрессионной генерации текста с 6 миллиардами параметров была обучена на наборе данных, известном как «Куча».
Куча на самом деле представляет собой комбинацию 22 небольших наборов данных, объединенных вместе. Он имеет общий размер файла 825 ГиБ и, как было замечено, уделяет больше внимания академическим и профессиональным источникам.
Вы можете протестировать модель самостоятельно через это бесплатное веб-приложение.
Я смог протестировать модель с помощью простой подсказки. GPT-J удалось перечислить «лучшие способы изучения нового языка на сегодняшний день».
Тем не менее, производительность была несколько неравномерной, когда я попытался объяснить, что такое авторегрессионная модель генерации текста.
Хотя вывод имел смысл, на самом деле он не отвечал на подсказку осмысленным образом.
Цены
Поскольку GPT-J — это модель с открытым исходным кодом, вы можете запустить свой собственный экземпляр самостоятельно. Согласно официальный репозиторий, модель предназначена для работы на тензорном процессоре (TPU). Хотя это оптимально, это может быть не самый экономичный вариант, поскольку самый дешевый вариант Google стоимость облачных TPU около 4.50 долларов в час.
В долгосрочной перспективе может быть дешевле использовать собственный графический процессор или арендовать выделенный сервер графического процессора через такие сервисы, как Васт.ай or Жидкий стек.
2. Юрский-1
Jurassic-1 — это языковая модель, выпущенная AI21 Labs, израильской ИИ-компанией, специализирующейся на НЛП. Как и OpenAI, они также предлагают API, который позволяет вам получить доступ к их языковой модели.
Вы можете создать учетную запись на их веб-сайт чтобы получить доступ к веб-приложению игровой площадки, чтобы протестировать модель самостоятельно.
AI21 Studio также включает в себя функцию, с помощью которой вы можете обучать и запрашивать свои собственные версии их моделей Jurassic-1. Согласно официальное сообщение в блоге, пользовательские модели всего с пятьюдесятью примерами могут превзойти быстрое проектирование с использованием исходной модели.
Цены
Они предлагают гибкие цены на основе использования для каждой из трех базовых моделей. Например, они взимают 0.25 доллара США за каждую 1000 токенов, сгенерированных моделью. В среднем каждый токен состоит примерно из 1 слова или шести символов.
Это означает, что вы можете использовать лучшую модель AI21 для создания документа из 4000 слов всего за 1 доллар. Однако вам нужно помнить одну вещь: вам все равно нужно платить минимум 29 долларов каждый месяц, чтобы использовать модель.
3. Текстовый синтезатор
TextSynth — еще один веб-сервис НЛП, который можно использовать для генерации текста. В отличие от двух предыдущих примеров, TextSynth не является автономной моделью. Сервис работает, предоставляя пользователю доступ к различным другим моделям больших языков с открытым исходным кодом, таким как GPT-NeoX, M2M100 и даже GPT-J.
Разработчики могут использовать свои REST API интегрировать языковые модели в свои собственные приложения. Вы можете попробовать проверить их бесплатно страница детской площадки чтобы увидеть, как работает каждая доступная модель.
Цены
Их бесплатный план дает вам доступ ко всем их языковым моделям с некоторыми ограничениями скорости. Служба ограничивает каждый запрос длиной 200 токенов.
Стандартный план снимает ограничение на количество генерируемых токенов. Модель ценообразования основана на кредитах, чтобы избежать непредвиденных расходов. Минимальное количество кредитов для покупки составляет 20 долларов. Неиспользованные кредиты становятся недействительными по истечении года.
Цена каждого запроса зависит от количества введенных и сгенерированных токенов. Судя по таблице на их официальном сайте, вы можете заплатить от 0.75 до 1.25 доллара за использование их более дешевых моделей.
Заключение
Надеюсь, эта статья поможет вам найти доступную и эффективную языковую модель, которую вы сможете использовать в качестве Альтернатива OpenAI GPT-3.
Большие языковые модели очень эффективны и могут использоваться для множества задач. Их можно использовать для создания текста, перевода с одного языка на другой, а также для понимания естественного языка и ответа на него.
Основываясь на моих исследованиях в космосе и проведенных тестах, GPT-3 по-прежнему превосходит все остальные. большая языковая модель Я пробовал. Однако это может измениться в будущем, поскольку исследователи разрабатывают и выпускают новые модели.
Исследователи из Google, Facebook и других лабораторий искусственного интеллекта продолжат работу над совершенствованием своих собственных LMM. Вполне возможно, что одна из этих команд ИИ создаст модель, превосходящую GPT-3.
Оставьте комментарий