სარჩევი[დამალვა][ჩვენება]
დიდი ენობრივი მოდელები არის ბოლოდროინდელი ყველაზე შთამბეჭდავი განვითარება ბუნებრივი ენების პროგრამირებისა და ნერვული ქსელების სფეროში.
OpenAI-ს GPT-3 გამოირჩევა, როგორც ერთ-ერთი ყველაზე წარმატებული მოდელი. მოდელის გამომავალი ხშირად არ განსხვავდება ადამიანებისგან მიღებული ტექსტისგან.
თუმცა, GPT-3 ჯერ კიდევ დახურული კოდის მოდელია. მიუხედავად იმისა, რომ წარმოუდგენლად ძლიერია, არსებობს გარკვეული შეზღუდვები, რამაც შეიძლება ის შეუსაბამო გახადოს გარკვეული გამოყენების შემთხვევებისთვის.
ამ სტატიაში ჩვენ განვიხილავთ რამდენიმე დიდს ენის მოდელები რომელსაც შეუძლია კონკურენცია გაუწიოს GPT-3-ის ნედლეულ შესრულებას.
რატომ ეძებთ OpenAI GPT-3 ალტერნატივას?
OpenAI-ს GPT-3 მოდელი იყენებს მოწინავე ღრმა სწავლება მოდელები ადამიანის მსგავსი ტექსტის შესაქმნელად. ეს არის მესამე თაობის ენის პროგნოზირების მოდელი OpenAI-ს კვლევითი ლაბორატორიიდან.
მოდელი თავდაპირველად გამოვიდა როგორც დახურული ბეტა, სანამ OpenAI-მ საბოლოოდ გახსნა API საზოგადოებისთვის 2021 წლის ბოლოს.
ამჟამად, GPT-3-ს აქვს ოთხი ძირითადი მოდელი, რომელთაგან შეგიძლიათ აირჩიოთ. ადა, ყველაზე იაფი და სწრაფი მოდელი ღირს მხოლოდ $0.0004 1000 ჟეტონზე. OpenAI-ის ყველაზე ძლიერი მოდელი, Davinci, ღირს $0.02 1000 ჟეტონზე, ანუ დაახლოებით 50-ჯერ უფრო ძვირი.
OpenAI ასევე მოითხოვს დეველოპერს დაიცვას საკუთარი გამოყენების სახელმძღვანელო მითითებები. დეველოპერი ასევე უზრუნველყოფს შეზღუდული გამოყენების კვოტას, რომელიც შეიძლება გაიზარდოს დეველოპერის განაცხადის დამტკიცების შემდეგ, ხელით განხილვის პროცესის მეშვეობით.
მიუხედავად იმისა, რომ GPT-3 გამომავალი კარგად არის ცნობილი თავისი მაღალი ხარისხის გამომავალი გამოშვებით, ის არ არის თქვენთვის ხელმისაწვდომი ენის პროგნოზირების ერთადერთი მოდელი.
მოდით გადავხედოთ რამდენიმე კონკურენტ მოდელს, რომლებიც შეგიძლიათ გამოიყენოთ GPT-3-ის ალტერნატივად.
1. GPT-J
GPT-J არის ღია კოდის ენის მოდელი Eleuther AI ჯგუფის მიერ.
ნულოვანი გასროლის შესრულება უხეშად შეესაბამება GPT-3-ს და ბევრად უფრო ახლოსაა შესრულებით, ვიდრე ბევრი სხვა GPT განხორციელება.
6 მილიარდი პარამეტრიანი ავტორეგრესიული ტექსტის გენერირების მოდელი გაწვრთნილი იქნა მონაცემთა ნაკრებზე, რომელიც ცნობილია როგორც "The Pile".
წყობის რეალურად არის 22 მცირე მონაცემთა ნაკრების კომბინაცია ერთად. მას აქვს ფაილის კომბინირებული ზომა 825 გიბაიტი და დაფიქსირდა, რომ უფრო მეტი აქცენტი აქვს აკადემიურ და პროფესიულ წყაროებზე.
თქვენ შეგიძლიათ თავად შეამოწმოთ მოდელი ამ გზით უფასო ვებ აპლიკაცია.
მე შევძელი მოდელის გამოცდა მარტივი მოწოდებით. GPT-J-მ მოახერხა „დღეს ახალი ენის შესწავლის საუკეთესო გზების“ ჩამოთვლა.
თუმცა, სპექტაკლი გარკვეულწილად მყიფეა, როდესაც ვცდილობდი მეკითხა, აეხსნა, თუ რა იყო ავტორეგრესიული ტექსტის გენერაციის მოდელი.
მიუხედავად იმისა, რომ გამომავალს აზრი ჰქონდა, მან რეალურად არ უპასუხა მოთხოვნას მნიშვნელოვანი გზით.
ფასები
ვინაიდან GPT-J არის ღია კოდის მოდელი, თქვენ თავად შეგეძლოთ საკუთარი ინსტანციის გაშვება. მიხედვით ოფიციალური საცავი, მოდელი შექმნილია ტენსორის დამუშავების ერთეულზე (TPU) გასაშვებად. მიუხედავად იმისა, რომ ოპტიმალურია, ეს შეიძლება არ იყოს ყველაზე ეკონომიური ვარიანტი Google-ის ყველაზე იაფის შემდეგ ღრუბლოვანი TPU-ების ღირებულება დაახლოებით $4.50/საათში.
შესაძლოა გრძელვადიან პერსპექტივაში ნაკლებად ძვირი დაჯდეს საკუთარი GPU-ს გამოყენება ან გამოყოფილი GPU სერვერის დაქირავება ისეთი სერვისების საშუალებით, როგორიცაა ვასტ.აი or FluidStack.
2. იურული-1
Jurassic-1 არის ენის მოდელი, რომელიც გამოშვებულია AI21 Labs-ის მიერ, ისრაელის AI კომპანია, რომელიც სპეციალიზირებულია NLP-ში. OpenAI-ის მსგავსად, ისინი ასევე გვთავაზობენ API-ს, რომელიც საშუალებას გაძლევთ შეხვიდეთ მათი ენის მოდელზე.
თქვენ შეგიძლიათ შექმნათ ანგარიში მათზე ნახვა სათამაშო მოედნის ვებ აპზე წვდომისთვის, რათა თავად გამოსცადოთ მოდელი.
AI21 Studio ასევე შეიცავს ფუნქციას, სადაც შეგიძლიათ ივარჯიშოთ და მოიძიოთ მათი Jurassic-1 მოდელების საკუთარი ვერსიები. მიხედვით ა ოფიციალური დღიურში, მორგებულ მოდელებს ორმოცდაათამდე მაგალითით შეუძლიათ აჯობონ სწრაფ ინჟინერიას ორიგინალური მოდელის გამოყენებით.
ფასები
ისინი გვთავაზობენ მოქნილ ფასებს მათი სამი ძირითადი მოდელისთვის. მაგალითად, ისინი ახდენენ 0.25 დოლარს მოდელის მიერ გენერირებული ყოველი 1000 ტოკენისთვის. საშუალოდ, თითოეული ნიშანი შეადგენს დაახლოებით 1 სიტყვას ან ექვს სიმბოლოს.
ეს ნიშნავს, რომ თქვენ შეგიძლიათ გამოიყენოთ AI21-ის საუკეთესო მოდელი 4000 სიტყვიანი დოკუმენტის შესაქმნელად მხოლოდ 1 დოლარად. ერთი რამ, რაც უნდა გახსოვდეთ, არის ის, რომ თქვენ მაინც უნდა გადაიხადოთ მინიმუმ $29 ყოველთვიურად მოდელის გამოსაყენებლად.
3. TextSynth
TextSynth არის კიდევ ერთი NLP ვებ სერვისი, რომელიც შეგიძლიათ გამოიყენოთ ტექსტის გენერირებისთვის. წინა ორი მაგალითისგან განსხვავებით, TextSynth არ არის დამოუკიდებელი მოდელი. სერვისი მუშაობს იმით, რომ მომხმარებელს აძლევს წვდომას სხვადასხვა სხვა ღია კოდის მსხვილ ენობრივ მოდელებზე, როგორიცაა GPT-NeoX, M2M100 და თუნდაც GPT-J.
დეველოპერებს შეუძლიათ გამოიყენონ თავიანთი REST API ენის მოდელების საკუთარ აპლიკაციებში ინტეგრირება. შეგიძლიათ სცადოთ მათი უფასო შემოწმება სათამაშო მოედნის გვერდი რომ ნახოთ, როგორ მუშაობს თითოეული ხელმისაწვდომი მოდელი.
ფასები
მათი უფასო გეგმა გაძლევთ წვდომას მათი ენის ყველა მოდელზე გარკვეული ტარიფის შეზღუდვით. სერვისი ზღუდავს თითოეულ მოთხოვნას 200 ტოკენის სიგრძეზე.
სტანდარტული გეგმა ხსნის შეზღუდვას გენერირებული ტოკენების რაოდენობაზე. ფასების მოდელი დაფუძნებულია კრედიტზე, რათა თავიდან იქნას აცილებული მოულოდნელი ხარჯები. შესაძენად კრედიტების მინიმალური რაოდენობა არის $20. გამოუყენებელი კრედიტები ბათილია ერთი წლის შემდეგ.
თითოეული მოთხოვნის ფასი ეფუძნება შეყვანის და გენერირებული ტოკენების რაოდენობას. მათი ოფიციალური ვებსაიტის ცხრილიდან გამომდინარე, შეგიძლიათ გადაიხადოთ დაახლოებით $0.75-დან $1.25-მდე მათი იაფი მოდელების გამოყენებისთვის.
დასკვნა
იმედია, ეს სტატია დაგეხმარებათ იპოვოთ ხელმისაწვდომი და ეფექტური ენის მოდელი, რომლის გამოყენებაც შეგიძლიათ OpenAI GPT-3 ალტერნატივა.
დიდი ენობრივი მოდელები ძალიან ძლიერია და შეიძლება გამოყენებულ იქნას სხვადასხვა ამოცანებისთვის. მათი გამოყენება შესაძლებელია ტექსტის გენერირებისთვის, ენებს შორის თარგმნისთვის და ბუნებრივი ენის გასაგებად და რეაგირებისთვის.
სივრცეში ჩემი კვლევისა და ჩემ მიერ ჩატარებული ტესტების საფუძველზე, GPT-3 მაინც აჯობებს სხვა დიდი ენის მოდელი Მე ვეცადე. თუმცა, ეს შეიძლება შეიცვალოს მომავალში, რადგან მკვლევარები შეიმუშავებენ და გამოუშვან ახალი მოდელები.
Google-ის, Facebook-ის და სხვა AI ლაბორატორიების მკვლევარები კვლავ გააგრძელებენ მუშაობას საკუთარი LMM-ების განვითარებაზე. რა თქმა უნდა, შესაძლებელია, რომ ერთ-ერთი ამ AI გუნდი გამოვიდეს GPT-3-ზე უკეთესი მოდელით.
დატოვე პასუხი