अनुक्रमणिका[लपवा][दाखवा]
नैसर्गिक भाषा प्रोग्रामिंग आणि न्यूरल नेटवर्क्सच्या क्षेत्रातील सर्वात प्रभावी अलीकडील घडामोडींपैकी मोठी भाषा मॉडेल्स आहेत.
OpenAI चे GPT-3 हे सर्वोत्कृष्ट कामगिरी करणाऱ्या मॉडेलपैकी एक आहे. मॉडेलचे आउटपुट अनेकदा मानवाकडून आलेल्या मजकुरापासून वेगळे करता येत नाही.
तथापि, GPT-3 अजूनही बंद-स्रोत मॉडेल आहे. आश्चर्यकारकपणे शक्तिशाली असताना, काही मर्यादा आहेत ज्यामुळे ते काही विशिष्ट वापराच्या प्रकरणांसाठी अयोग्य बनवू शकतात.
या लेखात, आम्ही काही मोठ्या गोष्टींवर जाऊ भाषा मॉडेल जीपीटी-३ च्या कच्च्या कामगिरीशी स्पर्धा करू शकते.
ओपनएआय GPT-3 पर्यायी का शोधा?
OpenAI चे GPT-3 मॉडेल प्रगत वापरते खोल शिकणे मानवासारखा मजकूर तयार करण्यासाठी मॉडेल. ओपनएआयच्या संशोधन प्रयोगशाळेतील हे तिसर्या पिढीतील भाषा अंदाज मॉडेल आहे.
OpenAI ने 2021 च्या अखेरीस लोकांसाठी API उघडण्यापूर्वी मॉडेल सुरुवातीला बंद बीटा म्हणून प्रसिद्ध केले गेले.
सध्या, तुमच्यासाठी निवडण्यासाठी GPT-3 मध्ये चार बेस मॉडेल आहेत. Ada, सर्वात स्वस्त आणि जलद मॉडेलची किंमत फक्त $0.0004 प्रति 1000 टोकन आहे. OpenAI चे सर्वात शक्तिशाली मॉडेल, Davinci, ची किंमत प्रति 0.02 टोकन $1000 किंवा सुमारे 50 पट जास्त आहे.
OpenAI ला देखील विकसकाने त्यांचे स्वतःचे अनुसरण करणे आवश्यक आहे वापर मार्गदर्शक तत्त्वे. विकासक मर्यादित वापर कोटा देखील प्रदान करेल जो विकासकाचा अर्ज मॅन्युअल पुनरावलोकन प्रक्रियेद्वारे मंजूर झाल्यानंतर वाढविला जाऊ शकतो.
GPT-3 आउटपुट त्याच्या उच्च-गुणवत्तेच्या आउटपुटसाठी सुप्रसिद्ध असताना, तुमच्यासाठी वापरण्यासाठी हे एकमेव भाषा अंदाज मॉडेल उपलब्ध नाही.
GPT-3 चा पर्याय म्हणून तुम्ही वापरू शकता अशा काही स्पर्धात्मक मॉडेल्स पाहू.
1. GPT-J
GPT-J हे Eleuther AI गटाचे मुक्त-स्रोत भाषा मॉडेल आहे.
शून्य-शॉट कार्यप्रदर्शन GPT-3 च्या बरोबरीने आहे आणि इतर अनेक GPT अंमलबजावणीच्या तुलनेत कार्यक्षमतेत खूप जवळ आहे.
6-बिलियन पॅरामीटर ऑटोरिग्रेसिव्ह टेक्स्ट जनरेशन मॉडेलला "द पाइल" म्हणून ओळखल्या जाणार्या डेटा सेटवर प्रशिक्षित केले गेले आहे.
पाइल प्रत्यक्षात एकत्रितपणे एकत्रित केलेल्या 22 लहान डेटासेटचे संयोजन आहे. त्याचा एकत्रित फाइल आकार 825 GiB आहे आणि त्यात शैक्षणिक आणि व्यावसायिक स्रोतांवर जास्त भर असल्याचे आढळून आले आहे.
आपण याद्वारे स्वतः मॉडेलची चाचणी घेऊ शकता विनामूल्य वेब अनुप्रयोग.
मी एका साध्या प्रॉम्प्टसह मॉडेलची चाचणी घेण्यास सक्षम होतो. GPT-J "आज नवीन भाषा शिकण्याचे सर्वोत्तम मार्ग" मोजण्यात यशस्वी झाले.
तथापि, जेव्हा मी ऑटोरेग्रेसिव्ह टेक्स्ट जनरेशन मॉडेल काय आहे हे स्पष्ट करण्यासाठी विचारण्याचा प्रयत्न केला तेव्हा कार्यप्रदर्शन काहीसे स्पॉट आहे.
आउटपुटला अर्थ प्राप्त झाला असला तरी, प्रत्यक्षात प्रॉम्प्टला अर्थपूर्ण पद्धतीने उत्तर दिले नाही.
किंमत
GPT-J हे ओपन-सोर्स मॉडेल असल्याने, तुम्ही तुमचे स्वतःचे उदाहरण स्वतः चालवू शकता. त्यानुसार अधिकृत भांडार, मॉडेल टेन्सर प्रोसेसिंग युनिट (TPU) वर चालण्यासाठी डिझाइन केलेले आहे. इष्टतम असताना, हा Google च्या स्वस्त पर्यायापासून सर्वात किफायतशीर पर्याय असू शकत नाही क्लाउड TPU ची किंमत सुमारे $4.50/तास.
तुमचा स्वतःचा GPU वापरणे किंवा समर्पित GPU सर्व्हर यांसारख्या सेवांद्वारे भाड्याने घेणे दीर्घकाळात कमी खर्चिक असू शकते. वस्त.आय or फ्लुइडस्टॅक.
2. ज्युरासिक-1
Jurassic-1 हे AI21 Labs, NLP मध्ये माहिर असलेल्या इस्रायली AI कंपनीने जारी केलेले एक भाषा मॉडेल आहे. OpenAI प्रमाणे, ते एक API देखील ऑफर करतात जे तुम्हाला त्यांच्या भाषा मॉडेलमध्ये प्रवेश करण्याची परवानगी देतात.
तुम्ही त्यांच्यावर खाते तयार करू शकता वेबसाइट स्वतःसाठी मॉडेलची चाचणी घेण्यासाठी प्लेग्राउंड वेब अॅपमध्ये प्रवेश करण्यासाठी.
AI21 स्टुडिओमध्ये एक वैशिष्ट्य देखील समाविष्ट आहे जेथे तुम्ही त्यांच्या जुरासिक-1 मॉडेल्सच्या तुमच्या स्वतःच्या कस्टम आवृत्त्यांचे प्रशिक्षण आणि क्वेरी करू शकता. त्यानुसार एक अधिकृत ब्लॉग पोस्ट, पन्नास उदाहरणांसह सानुकूल मॉडेल मूळ मॉडेल वापरून प्रॉम्प्ट अभियांत्रिकीपेक्षा जास्त कामगिरी करू शकतात.
किंमत
ते त्यांच्या प्रत्येक तीन बेस मॉडेलसाठी लवचिक वापर-आधारित किंमत ऑफर करतात. उदाहरणार्थ, मॉडेलद्वारे व्युत्पन्न केलेल्या प्रत्येक 0.25 टोकनसाठी ते $1000 आकारतात. सरासरी, प्रत्येक टोकन अंदाजे 1 शब्द किंवा सहा वर्ण आहे.
याचा अर्थ असा की तुम्ही AI21 चे सर्वोत्तम मॉडेल फक्त $4000 मध्ये 1-शब्द दस्तऐवज तयार करण्यासाठी वापरू शकता. तथापि, तुम्हाला एक गोष्ट लक्षात ठेवणे आवश्यक आहे की मॉडेल वापरण्यासाठी तुम्हाला दरमहा किमान $29 भरावे लागतील.
3. टेक्स्टसिंथ
TextSynth ही दुसरी NLP वेब सेवा आहे जी तुम्ही मजकूर तयार करण्यासाठी वापरू शकता. मागील दोन उदाहरणांप्रमाणे, TextSynth हे स्टँडअलोन मॉडेल नाही. ही सेवा वापरकर्त्याला GPT-NeoX, M2M100 आणि अगदी GPT-J सारख्या इतर मुक्त-स्रोत मोठ्या भाषा मॉडेल्समध्ये प्रवेश देऊन कार्य करते.
विकसक त्यांचा वापर करू शकतात आरईएसटी API भाषा मॉडेल्स त्यांच्या स्वतःच्या अनुप्रयोगांमध्ये समाकलित करण्यासाठी. तुम्ही त्यांची मोफत तपासणी करून पाहू शकता खेळाचे मैदान पृष्ठ प्रत्येक उपलब्ध मॉडेल कसे कार्य करते हे पाहण्यासाठी.
किंमत
त्यांची विनामूल्य योजना तुम्हाला त्यांच्या सर्व भाषा मॉडेलमध्ये काही दर मर्यादांसह प्रवेश देते. सेवा प्रत्येक विनंतीला 200 टोकन्सच्या लांबीपर्यंत प्रतिबंधित करते.
मानक योजना व्युत्पन्न टोकनच्या संख्येवरील मर्यादा काढून टाकते. अनपेक्षित खर्च टाळण्यासाठी किंमत मॉडेल क्रेडिट-आधारित आहे. खरेदीसाठी क्रेडिटची किमान संख्या $20 आहे. न वापरलेले क्रेडिट्स एका वर्षानंतर अवैध आहेत.
प्रत्येक विनंतीची किंमत इनपुट आणि व्युत्पन्न टोकनच्या संख्येवर आधारित आहे. त्यांच्या अधिकृत वेबसाइटवरील सारणीवर आधारित, तुम्ही त्यांचे स्वस्त मॉडेल वापरण्यासाठी सुमारे $0.75 ते $1.25 ची अपेक्षा करू शकता.
निष्कर्ष
आशेने, हा लेख तुम्हाला परवडणारी आणि प्रभावी भाषा मॉडेल शोधण्यात मदत करेल जे तुम्ही वापरू शकता OpenAI GPT-3 पर्यायी.
मोठ्या भाषेचे मॉडेल खूप शक्तिशाली आहेत आणि विविध कार्यांसाठी वापरले जाऊ शकतात. त्यांचा वापर मजकूर व्युत्पन्न करण्यासाठी, भाषांमधील भाषांतर करण्यासाठी आणि नैसर्गिक भाषा समजून घेण्यासाठी आणि प्रतिसाद देण्यासाठी केला जाऊ शकतो.
अंतराळातील माझे संशोधन आणि मी घेतलेल्या चाचण्यांच्या आधारे, GPT-3 अजूनही इतरांपेक्षा जास्त कामगिरी करते मोठ्या भाषेचे मॉडेल मी प्रयत्न केला आहे. तथापि, हे भविष्यात बदलू शकते कारण संशोधक नवीन मॉडेल विकसित करतात आणि रिलीज करतात.
Google, Facebook आणि इतर AI प्रयोगशाळांमधील संशोधक अजूनही त्यांच्या स्वत: च्या LMMs पुढे नेण्यासाठी कार्य करत राहतील. हे निश्चितपणे शक्य आहे की यापैकी एक AI संघ GPT-3 पेक्षा श्रेष्ठ मॉडेल घेऊन येईल.
प्रत्युत्तर द्या