Mündəricat[Gizlət][Göstər]
Böyük dil modelləri təbii dildə proqramlaşdırma və neyron şəbəkələri sahəsində ən təsirli son inkişaflardan bəziləridir.
OpenAI-nin GPT-3 ən yaxşı performans göstərən modellərdən biri kimi seçilir. Modelin çıxışı çox vaxt insanlardan gələn mətndən fərqlənmir.
Bununla belə, GPT-3 hələ də qapalı mənbə modelidir. İnanılmaz dərəcədə güclü olsa da, onu müəyyən istifadə halları üçün yararsız edə biləcək müəyyən məhdudiyyətlər var.
Bu yazıda biz bir neçə böyük nüsxəni nəzərdən keçirəcəyik dil modelləri GPT-3-ün xam performansı ilə rəqabət edə bilər.
Niyə OpenAI GPT-3 Alternativini axtarırsınız?
OpenAI-nin GPT-3 modeli qabaqcıl modellərdən istifadə edir dərin öyrənmə insana bənzər mətn yaratmaq üçün modellər. Bu, OpenAI-nin tədqiqat laboratoriyasının üçüncü nəsil dil proqnozlaşdırma modelidir.
OpenAI nəhayət 2021-ci ilin sonunda ictimaiyyətə API-ni açmazdan əvvəl model əvvəlcə qapalı beta olaraq buraxıldı.
Hal-hazırda, GPT-3-də seçmək üçün dörd əsas model var. Ada, ən ucuz və sürətli model 0.0004 token üçün cəmi 1000 dollara başa gəlir. OpenAI-nin ən güclü modeli Davinci, 0.02 token üçün 1000 dollar və ya təxminən 50 dəfə bahadır.
OpenAI həmçinin tərtibatçıdan özlərinə əməl etməyi tələb edir istifadə qaydaları. Tərtibatçı həmçinin məhdud istifadə kvotasını təmin edəcək ki, bu da tərtibatçının müraciəti əl ilə nəzərdən keçirilməklə təsdiq edildikdən sonra artırıla bilər.
GPT-3 çıxışı yüksək keyfiyyətli çıxışı ilə məşhur olsa da, istifadə edə biləcəyiniz yeganə dil proqnozlaşdırma modeli deyil.
GPT-3-ə alternativ olaraq istifadə edə biləcəyiniz bəzi rəqib modelləri nəzərdən keçirək.
1. GPT-J
GPT-J Eleuther AI qrupunun açıq mənbəli dil modelidir.
Sıfır atış performansı təxminən GPT-3 ilə bərabərdir və performans baxımından bir çox digər GPT tətbiqlərindən daha yaxındır.
6 milyard parametrli avtoreqressiv mətn yaratma modeli “The Pile” kimi tanınan məlumat dəsti üzərində təlim keçib.
Xovlu əslində birlikdə birləşdirilmiş 22 kiçik məlumat dəstinin birləşməsidir. 825 GiB birləşmiş fayl ölçüsünə malikdir və akademik və peşəkar mənbələrə daha çox diqqət yetirdiyi müşahidə edilmişdir.
Bunun vasitəsilə modeli özünüz sınaqdan keçirə bilərsiniz pulsuz veb proqram.
Sadə bir göstərişlə modeli sınaqdan keçirə bildim. GPT-J “bu gün yeni bir dil öyrənməyin ən yaxşı yollarını” sadalamağa müvəffəq oldu.
Bununla belə, avtoreqressiv mətn yaratma modelinin nə olduğunu izah etmək üçün ondan soruşmağa çalışdığım zaman performans bir qədər ləkələnmişdir.
Çıxış mənalı olsa da, əslində sorğuya mənalı bir şəkildə cavab vermədi.
Fiyatlandırma
GPT-J açıq mənbəli model olduğundan, əslində öz nümunənizi özünüz idarə edə bilərsiniz. görə rəsmi depo, model tenzor emal blokunda (TPU) işləmək üçün nəzərdə tutulmuşdur. Optimal olsa da, bu, Google-un ən ucuz variantından bəri ən sərfəli seçim olmaya bilər bulud TPU-larının qiyməti təxminən $4.50/saat.
Öz GPU-dan istifadə etmək və ya kimi xidmətlər vasitəsilə xüsusi GPU serverini icarəyə götürmək uzun müddətdə daha ucuz ola bilər Vast.ai or FluidStack.
2. Yura-1
Jurassic-1, NLP sahəsində ixtisaslaşmış İsrailin AI21 Labs şirkəti tərəfindən buraxılan dil modelidir. OpenAI kimi, onlar da dil modellərinə daxil olmağa imkan verən API təklif edirlər.
Onlarda hesab yarada bilərsiniz veb modeli özünüz sınamaq üçün oyun meydançası veb proqramına daxil olmaq.
AI21 Studio həmçinin Jurassic-1 modellərinin öz fərdi versiyalarınızı hazırlaya və sorğulaya biləcəyiniz bir funksiyanı ehtiva edir. a görə rəsmi blog yazısı, əlli nümunəsi olan xüsusi modellər orijinal modeldən istifadə edərək operativ mühəndislikdən üstün ola bilər.
Fiyatlandırma
Onlar üç əsas modelinin hər biri üçün istifadəyə əsaslanan çevik qiymət təklif edirlər. Məsələn, model tərəfindən yaradılan hər 0.25 token üçün 1000 dollar alırlar. Orta hesabla, hər bir işarə təxminən 1 söz və ya altı simvoldan ibarətdir.
Bu o deməkdir ki, siz cəmi 21 dollara 4000 sözdən ibarət sənəd yaratmaq üçün AI1-in ən yaxşı modelindən istifadə edə bilərsiniz. Ancaq yadda saxlamağınız lazım olan bir şey odur ki, modeli istifadə etmək üçün hələ də hər ay minimum 29 dollar ödəməlisiniz.
3. TextSynth
TextSynth mətn yaratmaq üçün istifadə edə biləcəyiniz başqa bir NLP veb xidmətidir. Əvvəlki iki nümunədən fərqli olaraq, TextSynth müstəqil bir model deyil. Xidmət istifadəçiyə GPT-NeoX, M2M100 və hətta GPT-J kimi müxtəlif açıq mənbəli böyük dil modellərinə giriş imkanı verməklə işləyir.
Tərtibatçılar onlardan istifadə edə bilərlər REST API dil modellərini öz tətbiqlərinə inteqrasiya etmək. Onları pulsuz yoxlamağa cəhd edə bilərsiniz oyun meydançası səhifəsi hər bir mövcud modelin necə işlədiyini görmək.
Fiyatlandırma
Onların pulsuz planı sizə bəzi tarif məhdudiyyətləri ilə bütün dil modellərinə giriş imkanı verir. Xidmət hər sorğunu 200 token uzunluğu ilə məhdudlaşdırır.
Standart plan yaradılan tokenlərin sayına olan məhdudiyyəti aradan qaldırır. Qiymətləndirmə modeli gözlənilməz xərclərin qarşısını almaq üçün kreditə əsaslanır. Almaq üçün kreditlərin minimum sayı 20 dollardır. İstifadə olunmamış kreditlər bir ildən sonra etibarsız sayılır.
Hər sorğunun qiyməti giriş və yaradılan tokenlərin sayına əsaslanır. Rəsmi veb saytındakı cədvələ əsasən, onların daha ucuz modellərindən istifadə üçün təxminən 0.75-1.25 dollar ödəyəcəyinizi gözləyə bilərsiniz.
Nəticə
Ümid edirik ki, bu məqalə siz kimi istifadə edə biləcəyiniz sərfəli və effektiv dil modelini tapmağa kömək edə bilər OpenAI GPT-3 alternativi.
Böyük dil modelləri çox güclüdür və müxtəlif tapşırıqlar üçün istifadə edilə bilər. Onlar mətn yaratmaq, dillər arasında tərcümə etmək və təbii dili başa düşmək və ona cavab vermək üçün istifadə edilə bilər.
Kosmosdakı araşdırmalarıma və keçirdiyim testlərə əsasən, GPT-3 hələ də hər birini üstələyir böyük dil modeli Mən cəhd etmişəm. Bununla belə, tədqiqatçılar yeni modellər hazırlayıb buraxdıqca bu, gələcəkdə dəyişə bilər.
Google, Facebook və digər süni intellekt laboratoriyalarının tədqiqatçıları hələ də öz LMM-lərini təkmilləşdirmək üzərində işləməyə davam edəcəklər. Bu süni intellekt komandalarından birinin GPT-3-dən daha üstün bir modellə çıxması, şübhəsiz ki, mümkündür.
Cavab yaz