Sommario[Nascondere][Spettacolo]
I modelli di linguaggio di grandi dimensioni sono alcuni degli sviluppi recenti più impressionanti nel campo della programmazione in linguaggio naturale e delle reti neurali.
Il GPT-3 di OpenAI si distingue come uno dei modelli con le migliori prestazioni in circolazione. L'output del modello è spesso indistinguibile dal testo proveniente da esseri umani.
Tuttavia, GPT-3 è ancora un modello closed-source. Sebbene sia incredibilmente potente, ci sono alcune limitazioni che potrebbero renderlo inadatto per determinati casi d'uso.
In questo articolo, ne esamineremo alcuni di grandi dimensioni modelli linguistici in grado di competere con le prestazioni grezze di GPT-3.
Perché cercare un'alternativa OpenAI GPT-3?
Il modello GPT-3 di OpenAI utilizza avanzato apprendimento profondo modelli per produrre testo simile a quello umano. È il modello di previsione del linguaggio di terza generazione del laboratorio di ricerca di OpenAI.
Il modello è stato inizialmente rilasciato come beta chiusa prima che OpenAI alla fine aprisse l'API al pubblico alla fine del 2021.
Attualmente, GPT-3 ha quattro modelli base tra cui scegliere. Ada, il modello più economico e veloce costa solo $ 0.0004 per 1000 token. Il modello più potente di OpenAI, Davinci, costa $ 0.02 per 1000 token, ovvero circa 50 volte più costoso.
OpenAI richiede anche allo sviluppatore di seguire il proprio linee guida per l'uso. Lo sviluppatore fornirà anche una quota di utilizzo limitata che può essere aumentata una volta che l'applicazione dello sviluppatore è stata approvata attraverso un processo di revisione manuale.
Sebbene l'output GPT-3 sia noto per il suo output di alta qualità, non è l'unico modello di previsione linguistica disponibile per l'uso.
Esaminiamo alcuni modelli concorrenti che puoi utilizzare come alternativa a GPT-3.
1.GPT-J
GPT-J è un modello di linguaggio open source del gruppo Eleuther AI.
Le prestazioni zero-shot sono più o meno alla pari con GPT-3 ed è molto più vicino in termini di prestazioni rispetto a molte altre implementazioni GPT.
Il modello di generazione di testo autoregressivo a 6 miliardi di parametri è stato addestrato su un set di dati noto come "The Pile".
Il mucchio è in realtà una combinazione di 22 set di dati più piccoli combinati insieme. Ha una dimensione del file combinata di 825 GiB ed è stato osservato che ha una maggiore enfasi sulle fonti accademiche e professionali.
Puoi provare tu stesso il modello attraverso questo applicazione web gratuita.
Sono stato in grado di testare il modello con un semplice prompt. GPT-J è riuscito a enumerare i “modi migliori per imparare una nuova lingua oggi”.
Tuttavia, la performance è alquanto imprevedibile quando ho cercato di chiedergli di spiegare cos'era un modello di generazione del testo autoregressivo.
Sebbene l'output avesse un senso, in realtà non ha risposto al prompt in modo significativo.
Prezzi
Poiché GPT-J è un modello open source, potresti effettivamente eseguire tu stesso la tua istanza. Secondo il repository ufficiale, il modello è progettato per essere eseguito su un'unità di elaborazione tensoriale (TPU). Sebbene ottimale, questa potrebbe non essere l'opzione più conveniente poiché è la più economica di Google costo delle TPU cloud circa $ 4.50/ora.
A lungo termine potrebbe essere meno costoso utilizzare la propria GPU o noleggiare un server GPU dedicato tramite servizi come Vasto.ai or Stack di fluido.
2. Giurassico-1
Jurassic-1 è un modello linguistico rilasciato da AI21 Labs, una società di intelligenza artificiale israeliana specializzata in PNL. Come OpenAI, offrono anche un'API che ti consente di accedere al loro modello linguistico.
Puoi creare un account su loro sito web per accedere a un'app Web del parco giochi per testare il modello di persona.
L'AI21 Studio include anche una funzione in cui puoi addestrare e interrogare le tue versioni personalizzate dei loro modelli Jurassic-1. Secondo un post ufficiale del blog, i modelli personalizzati con un minimo di cinquanta esempi possono superare le prestazioni dell'ingegneria rapida utilizzando il modello originale.
Prezzi
Offrono prezzi flessibili basati sull'utilizzo per ciascuno dei loro tre modelli di base. Ad esempio, addebitano $ 0.25 per ogni 1000 token generati dal modello. In media, ogni token è di circa 1 parola o sei caratteri.
Ciò significa che puoi utilizzare il miglior modello di AI21 per creare un documento di 4000 parole per solo $ 1. Una cosa che devi ricordare, tuttavia, è che devi comunque pagare un minimo di $ 29 ogni mese per utilizzare il modello.
3. Sintesi di testo
TextSynth è un altro servizio Web NLP che puoi utilizzare per generare testo. A differenza dei due esempi precedenti, TextSynth non è un modello autonomo. Il servizio funziona fornendo all'utente l'accesso a vari altri modelli di linguaggi open source di grandi dimensioni come GPT-NeoX, M2M100 e persino GPT-J.
Gli sviluppatori possono utilizzare il loro API REST integrare i modelli linguistici nelle proprie applicazioni. Puoi provare a dare un'occhiata gratuitamente pagina del parco giochi per vedere come si comporta ogni modello disponibile.
Prezzi
Il loro piano gratuito ti dà accesso a tutti i loro modelli linguistici con alcuni limiti di tariffa. Il servizio limita ogni richiesta a una lunghezza di 200 token.
Il piano standard rimuove la limitazione al numero di token generati. Il modello di tariffazione è basato sul credito per evitare spese impreviste. Il numero minimo di crediti per l'acquisto è di $ 20. I crediti non utilizzati non sono più validi dopo un anno.
Il prezzo di ogni richiesta si basa sul numero di input e di token generati. Sulla base della tabella sul loro sito Web ufficiale, puoi aspettarti di pagare da $ 0.75 a $ 1.25 per l'utilizzo dei loro modelli più economici.
Conclusione
Si spera che questo articolo possa aiutarti a trovare un modello linguistico economico ed efficace che puoi utilizzare come Alternativa OpenAI GPT-3.
I modelli linguistici di grandi dimensioni sono molto potenti e possono essere utilizzati per una varietà di attività. Possono essere utilizzati per generare testo, tradurre tra lingue e comprendere e rispondere al linguaggio naturale.
Sulla base delle mie ricerche nello spazio e dei test che ho condotto, GPT-3 supera ancora ogni altro grande modello linguistico Ho provato. Tuttavia, questo potrebbe cambiare in futuro man mano che i ricercatori sviluppano e rilasciano nuovi modelli.
I ricercatori di Google, Facebook e altri laboratori di intelligenza artificiale continueranno ancora a lavorare per far avanzare i propri LMM. È certamente possibile che uno di questi team di IA esca con un modello superiore a GPT-3.
Lascia un Commento