Table des matières[Cacher][Montrer]
Les grands modèles de langage font partie des développements récents les plus impressionnants dans le domaine de la programmation en langage naturel et des réseaux de neurones.
Le GPT-3 d'OpenAI se distingue comme l'un des modèles les plus performants du marché. La sortie du modèle est souvent indiscernable du texte provenant des humains.
Cependant, GPT-3 est toujours un modèle à source fermée. Bien qu'incroyablement puissant, certaines limitations peuvent le rendre inadapté à certains cas d'utilisation.
Dans cet article, nous passerons en revue quelques grandes modèles de langage qui peut rivaliser avec les performances brutes du GPT-3.
Pourquoi rechercher une alternative OpenAI GPT-3 ?
Le modèle GPT-3 d'OpenAI utilise des l'apprentissage en profondeur modèles pour produire un texte de type humain. Il s'agit du modèle de prédiction de langage de troisième génération du laboratoire de recherche d'OpenAI.
Le modèle a été initialement publié en version bêta fermée avant qu'OpenAI n'ouvre finalement l'API au public fin 2021.
Actuellement, GPT-3 propose quatre modèles de base parmi lesquels vous pouvez choisir. Ada, le modèle le moins cher et le plus rapide ne coûte que 0.0004 $ pour 1000 jetons. Le modèle le plus puissant d'OpenAI, Davinci, coûte 0.02 $ pour 1000 jetons, soit environ 50 fois plus cher.
OpenAI exige également que le développeur suive ses propres directives d'utilisation. Le développeur fournira également un quota d'utilisation limité qui pourra être augmenté une fois que la demande du développeur aura été approuvée par le biais d'un processus d'examen manuel.
Bien que la sortie GPT-3 soit bien connue pour sa sortie de haute qualité, ce n'est pas le seul modèle de prédiction de langue que vous pouvez utiliser.
Passons en revue certains modèles concurrents que vous pouvez utiliser comme alternative au GPT-3.
1. GPT-J
GPT-J est un modèle de langage open source du groupe Eleuther AI.
Les performances zéro coup sont à peu près équivalentes à celles de GPT-3 et sont beaucoup plus proches en termes de performances que de nombreuses autres implémentations GPT.
Le modèle de génération de texte autorégressif à 6 milliards de paramètres a été formé sur un ensemble de données connu sous le nom de "The Pile".
La pile est en fait une combinaison de 22 ensembles de données plus petits combinés ensemble. Il a une taille de fichier combinée de 825 Gio et il a été observé qu'il met davantage l'accent sur les sources académiques et professionnelles.
Vous pouvez tester le modèle vous-même grâce à cette application web gratuite.
J'ai pu tester le modèle avec une simple invite. GPT-J a réussi à énumérer les "meilleures façons d'apprendre une nouvelle langue aujourd'hui".
Cependant, les performances sont quelque peu inégales lorsque j'ai essayé de lui demander d'expliquer ce qu'était un modèle de génération de texte autorégressif.
Bien que la sortie ait un sens, elle n'a pas réellement répondu à l'invite de manière significative.
Prix
Étant donné que GPT-J est un modèle open source, vous pouvez en fait exécuter vous-même votre propre instance. Selon le dépôt officiel, le modèle est conçu pour fonctionner sur une unité de traitement de tenseur (TPU). Bien qu'optimale, cette option n'est peut-être pas la plus rentable puisque la solution la moins chère de Google coût des Cloud TPU environ 4.50 $/heure.
Il peut être moins coûteux à long terme d'utiliser votre propre GPU ou de louer un serveur GPU dédié via des services tels que Vaste.ai or FluidStack.
2. Jurassique-1
Jurassic-1 est un modèle de langage publié par AI21 Labs, une société israélienne d'IA spécialisée dans la PNL. Comme OpenAI, ils proposent également une API qui vous permet d'accéder à leur modèle de langage.
Vous pouvez créer un compte sur leur site de NDN Collective pour accéder à une application Web de terrain de jeu pour tester le modèle par vous-même.
Le studio AI21 comprend également une fonctionnalité où vous pouvez former et interroger vos propres versions personnalisées de leurs modèles Jurassic-1. Selon un article de blog officiel, les modèles personnalisés avec aussi peu que cinquante exemples peuvent surpasser l'ingénierie rapide en utilisant le modèle d'origine.
Prix
Ils offrent une tarification flexible basée sur l'utilisation pour chacun de leurs trois modèles de base. Par exemple, ils facturent 0.25 $ pour 1000 1 jetons générés par le modèle. En moyenne, chaque jeton est d'environ XNUMX mot ou six caractères.
Cela signifie que vous pouvez utiliser le meilleur modèle d'AI21 pour créer un document de 4000 1 mots pour seulement 29 $. Une chose dont vous devez cependant vous souvenir est que vous devez toujours payer un minimum de XNUMX $ par mois pour utiliser le modèle.
3. Synthèse de texte
TextSynth est un autre service Web NLP que vous pouvez utiliser pour générer du texte. Contrairement aux deux exemples précédents, TextSynth n'est pas un modèle autonome. Le service fonctionne en donnant à l'utilisateur l'accès à divers autres grands modèles de langage open source tels que GPT-NeoX, M2M100 et même GPT-J.
Les développeurs peuvent utiliser leur API REST d'intégrer les modèles de langage dans leurs propres applications. Vous pouvez essayer de vérifier leur gratuit aire de jeux pour voir comment chaque modèle disponible fonctionne.
Prix
Leur forfait gratuit vous donne accès à tous leurs modèles linguistiques avec certaines limites de débit. Le service limite chaque demande à une longueur de 200 jetons.
Le plan standard supprime la limitation du nombre de jetons générés. Le modèle de tarification est basé sur le crédit pour éviter les dépenses imprévues. Le nombre minimum de crédits à acheter est de 20 $. Les crédits non utilisés sont invalides après un an.
Le prix de chaque requête est basé sur le nombre de jetons entrés et générés. Sur la base du tableau sur leur site officiel, vous pouvez vous attendre à payer environ 0.75 $ à 1.25 $ pour utiliser leurs modèles moins chers.
Conclusion
J'espère que cet article pourra vous aider à trouver un modèle de langage abordable et efficace que vous pourrez utiliser comme Alternative à OpenAI GPT-3.
Les grands modèles de langage sont très puissants et peuvent être utilisés pour une variété de tâches. Ils peuvent être utilisés pour générer du texte, traduire entre les langues, comprendre et répondre au langage naturel.
D'après mes recherches dans l'espace et les tests que j'ai effectués, GPT-3 surpasse toujours tous les autres grand modèle de langage J'ai essayé. Cependant, cela pourrait changer à l'avenir à mesure que les chercheurs développent et publient de nouveaux modèles.
Les chercheurs de Google, Facebook et d'autres laboratoires d'IA continueront de travailler à l'avancement de leurs propres LMM. Il est certainement possible qu'une de ces équipes d'IA propose un modèle supérieur au GPT-3.
Soyez sympa! Laissez un commentaire