Mundarija[Yashirish][Show]
Katta til modellari tabiiy tilda dasturlash va neyron tarmoqlar sohasidagi eng ta'sirli so'nggi ishlanmalardan biridir.
OpenAI-ning GPT-3 eng yaxshi ko'rsatkichli modellardan biri sifatida ajralib turadi. Modelning chiqishi ko'pincha odamlardan kelgan matndan farq qilmaydi.
Biroq, GPT-3 hali ham yopiq manbali modeldir. Ajablanarli darajada kuchli bo'lsa-da, uni muayyan foydalanish holatlari uchun yaroqsiz holga keltiradigan ma'lum cheklovlar mavjud.
Ushbu maqolada biz bir nechta katta narsalarni ko'rib chiqamiz til modellari Bu GPT-3 ning xom ko'rsatkichlari bilan raqobatlasha oladi.
Nega OpenAI GPT-3 muqobilini qidiryapsizmi?
OpenAI ning GPT-3 modeli ilg'or texnologiyalardan foydalanadi chuqur o'rganish insonga o'xshash matn yaratish uchun modellar. Bu OpenAI tadqiqot laboratoriyasining uchinchi avlod tilini bashorat qilish modelidir.
Model dastlab yopiq beta-versiya sifatida chiqarildi, avval OpenAI 2021 yil oxirida APIni ommaga ochdi.
Hozirda GPT-3 siz tanlash uchun to'rtta asosiy modelga ega. Ada, eng arzon va eng tezkor model 0.0004 ta token uchun atigi $1000 turadi. OpenAI’ning eng kuchli modeli Davinci 0.02 ta token uchun 1000 dollar yoki taxminan 50 baravar qimmat turadi.
OpenAI, shuningdek, ishlab chiquvchidan o'zlariga ergashishni talab qiladi foydalanish bo'yicha ko'rsatmalar. Ishlab chiquvchi, shuningdek, ishlab chiqaruvchining arizasi qo‘lda ko‘rib chiqish jarayoni orqali tasdiqlanganidan keyin ko‘paytirilishi mumkin bo‘lgan cheklangan foydalanish kvotasi bilan ta’minlaydi.
GPT-3 chiqishi o'zining yuqori sifatli chiqishi bilan mashhur bo'lsa-da, u siz foydalanishingiz mumkin bo'lgan yagona tilni bashorat qilish modeli emas.
Keling, GPT-3 ga muqobil sifatida foydalanishingiz mumkin bo'lgan raqobatdosh modellarni ko'rib chiqaylik.
1. GPT-J
GPT-J Eleuther AI guruhining ochiq manbali til modelidir.
Nolinchi otish ko'rsatkichi taxminan GPT-3 bilan teng va boshqa ko'plab GPT ilovalariga qaraganda unumdorlik jihatidan ancha yaqinroq.
6 milliardli parametrli avtoregressiv matn yaratish modeli "Qoziq" deb nomlanuvchi ma'lumotlar to'plamida o'qitildi.
Qoziq aslida birlashtirilgan 22 kichikroq ma'lumotlar to'plamining kombinatsiyasi. Uning umumiy fayl hajmi 825 GiB va akademik va professional manbalarga ko'proq e'tibor qaratilishi kuzatilgan.
Bu orqali siz modelni o'zingiz sinab ko'rishingiz mumkin bepul veb-ilova.
Men oddiy so'rov bilan modelni sinab ko'rishga muvaffaq bo'ldim. GPT-J "bugungi kunda yangi tilni o'rganishning eng yaxshi usullarini" sanab o'tishga muvaffaq bo'ldi.
Biroq, men undan avtoregressiv matn yaratish modeli nima ekanligini tushuntirishni so'ramoqchi bo'lganimda, ishlash biroz noaniq bo'ldi.
Chiqish mantiqiy bo'lsa-da, u aslida so'rovga mazmunli javob bermadi.
narxlanish
GPT-J ochiq kodli model bo'lgani uchun siz o'zingizning misolingizni o'zingiz ishga tushirishingiz mumkin. ga ko'ra rasmiy ombor, model tenzor ishlov berish blokida (TPU) ishlashga mo'ljallangan. Optimal bo'lsa-da, bu Google eng arzon variantidan beri eng tejamkor variant bo'lmasligi mumkin bulutli TPU narxi taxminan $4.50/soat.
O'z GPU-dan foydalanish yoki maxsus GPU serverini ijaraga olish uzoq muddatda arzonroq bo'lishi mumkin Vast.ai or FluidStack.
2. Yura-1
Jurassic-1 - NLPga ixtisoslashgan Isroilning AI21 Labs kompaniyasi tomonidan chiqarilgan til modeli. OpenAI singari, ular ham o'zlarining til modeliga kirish imkonini beruvchi APIni taklif qilishadi.
Ularda hisob yaratishingiz mumkin Veb-sayt modelni o'zingiz sinab ko'rish uchun o'yin maydonchasi veb-ilovasiga kirish.
AI21 Studio shuningdek, Jurassic-1 modellarining shaxsiy versiyalarini o'qitish va so'rashingiz mumkin bo'lgan xususiyatni o'z ichiga oladi. An ko'ra rasmiy blog yozuvi, ellikta misolga ega maxsus modellar asl modeldan foydalangan holda tezkor muhandislikdan ustun bo'lishi mumkin.
narxlanish
Ular uchta asosiy modellarining har biri uchun foydalanishga asoslangan moslashuvchan narxlarni taklif qilishadi. Misol uchun, ular model tomonidan ishlab chiqarilgan har 0.25 token uchun 1000 dollar to'laydilar. O'rtacha har bir token taxminan 1 so'z yoki oltita belgidan iborat.
Bu shuni anglatadiki, siz AI21 ning eng yaxshi modelidan atigi $4000 evaziga 1 soʻzli hujjat yaratishingiz mumkin. Esda tutish kerak bo'lgan narsa shundaki, siz hali ham modeldan foydalanish uchun har oy kamida 29 dollar to'lashingiz kerak.
3. TextSynth
TextSynth - matn yaratish uchun foydalanishingiz mumkin bo'lgan boshqa NLP veb-xizmati. Oldingi ikkita misoldan farqli o'laroq, TextSynth mustaqil model emas. Xizmat foydalanuvchiga GPT-NeoX, M2M100 va hatto GPT-J kabi boshqa ochiq manbali yirik til modellariga kirish huquqini berish orqali ishlaydi.
Ishlab chiquvchilar ulardan foydalanishlari mumkin REST API til modellarini o'z ilovalariga integratsiya qilish. Siz ularni bepul tekshirishga harakat qilishingiz mumkin o'yin maydonchasi sahifasi har bir mavjud model qanday ishlashini ko'rish uchun.
narxlanish
Ularning bepul rejasi sizga ba'zi tarif cheklovlari bilan barcha til modellariga kirish imkonini beradi. Xizmat har bir so'rovni 200 ta token uzunligi bilan cheklaydi.
Standart reja ishlab chiqarilgan tokenlar soni bo'yicha cheklovni olib tashlaydi. Narxlar modeli kutilmagan xarajatlarning oldini olish uchun kreditga asoslangan. Sotib olish uchun minimal kreditlar soni - $20. Bir yildan keyin foydalanilmagan kreditlar haqiqiy emas.
Har bir so'rovning narxi kiritilgan va yaratilgan tokenlar soniga asoslanadi. Rasmiy veb-saytidagi jadvalga asoslanib, ularning arzonroq modellaridan foydalanish uchun taxminan 0.75 dan 1.25 dollargacha to'lashingiz mumkin.
Xulosa
Umid qilamizki, ushbu maqola siz sifatida foydalanishingiz mumkin bo'lgan arzon va samarali til modelini topishga yordam beradi OpenAI GPT-3 muqobil.
Katta til modellari juda kuchli va turli vazifalar uchun ishlatilishi mumkin. Ulardan matn yaratish, tillar o‘rtasida tarjima qilish, tabiiy tilni tushunish va unga javob berish uchun foydalanish mumkin.
Kosmosdagi tadqiqotlarim va men o'tkazgan sinovlarimga asoslanib, GPT-3 hali ham bir-biridan ustundir. katta til modeli Men sinab ko'rdim. Biroq, tadqiqotchilar yangi modellarni ishlab chiqishlari va chiqarishlari sababli kelajakda bu o'zgarishi mumkin.
Google, Facebook va boshqa sun'iy intellekt laboratoriyalari tadqiqotchilari o'zlarining LMMlarini rivojlantirish ustida ishlashda davom etadilar. Shubhasiz, ushbu AI jamoalaridan biri GPT-3 dan ustunroq model bilan chiqishi mumkin.
Leave a Reply