Гарчиг[Нуух][Үзүүлэх]
Том хэлний загварууд нь байгалийн хэлний програмчлал болон мэдрэлийн сүлжээн дэх сүүлийн үеийн хамгийн гайхалтай бүтээн байгуулалтуудын нэг юм.
OpenAI-ийн GPT-3 нь хамгийн сайн гүйцэтгэлтэй загваруудын нэг гэдгээрээ ялгардаг. Загварын гаралт нь ихэвчлэн хүнээс ирсэн текстээс ялгагдахгүй байдаг.
Гэсэн хэдий ч GPT-3 нь хаалттай эхийн загвар хэвээр байна. Гайхалтай хүчирхэг хэдий ч тодорхой хязгаарлалтууд байдаг бөгөөд энэ нь зарим тохиолдолд ашиглахад тохиромжгүй болгодог.
Энэ нийтлэлд бид хэд хэдэн том зүйлийг авч үзэх болно хэлний загварууд Энэ нь GPT-3-ийн түүхий гүйцэтгэлтэй өрсөлдөх чадвартай.
Яагаад OpenAI GPT-3 хувилбар хайж байна вэ?
OpenAI-ийн GPT-3 загвар нь дэвшилтэт технологийг ашигладаг гүн гүнзгий суралцах хүнтэй төстэй бичвэр гаргах загварууд. Энэ нь OpenAI-ийн судалгааны лабораторийн гурав дахь үеийн хэлийг таамаглах загвар юм.
Энэ загварыг OpenAI эцэст нь 2021 оны сүүлээр олон нийтэд API-г нээхээс өмнө хаалттай бета хувилбараар гаргасан.
Одоогийн байдлаар GPT-3 нь танд дөрвөн үндсэн загвартай. Ада, хамгийн хямд бөгөөд хурдан загвар нь 0.0004 жетон нь ердөө 1000 долларын үнэтэй. OpenAI-ийн хамгийн хүчирхэг загвар болох Davinci нь 0.02 жетон нь 1000 доллар буюу 50 дахин илүү үнэтэй байдаг.
OpenAI нь хөгжүүлэгчээс өөрсдийнхөө дагахыг шаарддаг ашиглах заавар. Хөгжүүлэгч нь гарын авлагын хяналтын процессоор хөгжүүлэгчийн өргөдлийг зөвшөөрсний дараа нэмэгдүүлэх боломжтой хязгаарлагдмал ашиглалтын квотыг өгөх болно.
GPT-3 гаралт нь өндөр чанартай гаралтаараа алдартай ч энэ нь таны ашиглах боломжтой цорын ганц хэлээр таамаглах загвар биш юм.
GPT-3-ийн өөр хувилбар болгон ашиглаж болох зарим өрсөлдөгч загваруудыг авч үзье.
1. GPT-J
GPT-J бол Eleuther AI группын нээлттэй эхийн хэлний загвар юм.
Тэг цохилтын гүйцэтгэл нь GPT-3-тай ойролцоо бөгөөд бусад олон GPT хэрэгжүүлэлтээс илүү гүйцэтгэлтэй ойролцоо байна.
6 тэрбум параметрийн авторегрессив текст үүсгэх загварыг "Овоол" гэж нэрлэгддэг өгөгдлийн багц дээр сургасан.
Овоолго Энэ нь үнэндээ 22 жижиг өгөгдлийн багцын нэгдэл юм. Энэ нь 825 GiB файлын хэмжээтэй бөгөөд эрдэм шинжилгээний болон мэргэжлийн эх сурвалжид илүү их анхаарал хандуулдаг нь ажиглагдсан.
Та үүгээр дамжуулан загварыг өөрөө туршиж үзэх боломжтой үнэгүй вэб програм.
Би энгийн зааварчилгаагаар загварыг туршиж үзсэн. GPT-J нь "Өнөөдөр шинэ хэл сурах шилдэг аргуудыг" жагсааж чадсан.
Гэсэн хэдий ч, би үүнийг авторегрессив текст үүсгэх загвар гэж юу болохыг тайлбарлахыг оролдоход гүйцэтгэл бага зэрэг толботой байсан.
Гаралт нь утга учиртай байсан ч энэ нь үнэн хэрэгтээ асуултанд утга учиртай хариулт өгөөгүй.
үнийн
GPT-J нь нээлттэй эхийн загвар тул та өөрөө өөрийнхөө жишээг ажиллуулж болно. Заасны дагуу албан ёсны агуулах, загвар нь тензор боловсруулах нэгж (TPU) дээр ажиллахаар бүтээгдсэн. Хэдийгээр оновчтой боловч энэ нь Google-ийн хамгийн хямд хувилбараас хойш хамгийн хэмнэлттэй сонголт биш байж магадгүй юм үүлэн TPU-ийн өртөг ойролцоогоор $4.50/цаг.
Өөрийн GPU ашиглах эсвэл тусгай GPU сервер түрээслэх нь урт хугацаанд хямд байх болно Vast.ai or FluidStack.
2. Юрийн галавын-1
Jurassic-1 бол NLP чиглэлээр мэргэшсэн Израилийн AI21 Labs компаниас гаргасан хэлний загвар юм. OpenAI-ийн нэгэн адил тэд өөрсдийн хэлний загварт хандах боломжийг олгодог API-г санал болгодог.
Та тэдний дээр данс үүсгэж болно вэб сайт тоглоомын талбайн вэб програм руу нэвтэрч, загвараа өөрөө туршиж үзээрэй.
AI21 Studio нь мөн Jurassic-1 загваруудынхаа захиалгат хувилбаруудыг сургаж, асууж болох функцийг агуулдаг. Ангийн дагуу албан ёсны блог, тавин жишээтэй захиалгат загварууд нь анхны загварыг ашиглан шуурхай инженерчлэлээс давж чаддаг.
үнийн
Тэд үндсэн гурван загвар тус бүрийн хэрэглээнд суурилсан уян хатан үнийг санал болгодог. Жишээлбэл, тэд загвараар үүсгэсэн 0.25 жетон тутамд 1000 доллар авдаг. Дунджаар токен бүр нь ойролцоогоор 1 үг эсвэл зургаан тэмдэгт байна.
Энэ нь та AI21-ийн шилдэг загварыг ашиглан ердөө 4000 доллараар 1 үгтэй баримт бичгийг бүтээх боломжтой гэсэн үг юм. Гэсэн хэдий ч таны санах ёстой нэг зүйл бол загварыг ашиглахын тулд сар бүр дор хаяж 29 доллар төлөх шаардлагатай болно.
3. TextSynth
TextSynth бол текст үүсгэхэд ашиглаж болох өөр нэг NLP вэб үйлчилгээ юм. Өмнөх хоёр жишээнээс ялгаатай нь TextSynth нь бие даасан загвар биш юм. Энэхүү үйлчилгээ нь хэрэглэгчдэд GPT-NeoX, M2M100, тэр ч байтугай GPT-J гэх мэт бусад нээлттэй эхийн том хэлний загваруудад хандах боломжийг олгодог.
Хөгжүүлэгчид ашиглах боломжтой REST API хэлний загваруудыг өөрийн хэрэглээнд нэгтгэх. Та тэдгээрийг үнэгүй шалгаж үзэх боломжтой тоглоомын талбайн хуудас боломжтой загвар бүр хэрхэн ажиллаж байгааг харах.
үнийн
Тэдний үнэ төлбөргүй төлөвлөгөө нь танд үнийн хязгаартай бүх хэлний загварт хандах боломжийг олгоно. Энэхүү үйлчилгээ нь хүсэлт бүрийг 200 жетоноор хязгаарладаг.
Стандарт төлөвлөгөө нь үүсгэсэн жетонуудын тооны хязгаарлалтыг арилгадаг. Үнийн загвар нь гэнэтийн зардлаас зайлсхийхийн тулд зээл дээр суурилдаг. Худалдан авах зээлийн хамгийн бага тоо нь $ 20 байна. Жилийн дараа ашиглагдаагүй кредит хүчингүй болно.
Хүсэлт бүрийн үнэ нь оролтын тоо болон үүсгэсэн жетон дээр суурилдаг. Тэдний албан ёсны вэбсайт дээрх хүснэгтэд үндэслэн хямд загваруудыг ашиглахын тулд та 0.75-1.25 доллар төлнө гэж найдаж болно.
Дүгнэлт
Энэхүү нийтлэл нь танд ашиглах боломжтой хямд, үр дүнтэй хэлний загварыг олоход тусална гэж найдаж байна OpenAI GPT-3 хувилбар.
Хэлний том загварууд нь маш хүчирхэг бөгөөд янз бүрийн ажилд ашиглаж болно. Тэдгээрийг текст үүсгэх, хэл хооронд орчуулах, байгалийн хэлийг ойлгох, хариу үйлдэл хийхэд ашиглаж болно.
Миний сансарт хийсэн судалгаа, хийсэн туршилтууд дээр үндэслэн GPT-3 нь бие биенээсээ давсан хэвээр байна. том хэлний загвар Би оролдсон. Гэсэн хэдий ч судлаачид шинэ загваруудыг боловсруулж, гаргах үед энэ нь ирээдүйд өөрчлөгдөж магадгүй юм.
Google, Facebook болон бусад хиймэл оюун ухааны лабораторийн судлаачид өөрсдийн LMM-ийг хөгжүүлэх чиглэлээр үргэлжлүүлэн ажиллах болно. Эдгээр AI багуудын аль нэг нь GPT-3-аас илүү загвартай гарч ирэх нь гарцаагүй.
хариу үлдээх