विषयसूची[लुकाउनुहोस्][देखाउनु]
ठूला भाषा मोडेलहरू प्राकृतिक भाषा प्रोग्रामिङ र न्यूरल नेटवर्कको क्षेत्रमा सबैभन्दा प्रभावशाली हालका घटनाहरू हुन्।
OpenAI को GPT-3 त्यहाँको उत्कृष्ट प्रदर्शन गर्ने मोडेलहरू मध्ये एक हो। मोडेलको आउटपुट प्रायः मानिसबाट आएको पाठबाट अलग गर्न सकिँदैन।
यद्यपि, GPT-3 अझै पनि बन्द-स्रोत मोडेल हो। अविश्वसनीय रूपमा शक्तिशाली हुँदा, त्यहाँ केही सीमितताहरू छन् जसले यसलाई निश्चित प्रयोगका केसहरूको लागि अनुपयुक्त बनाउन सक्छ।
यस लेखमा, हामी केहि ठूला माथि जानेछौं भाषा मोडेलहरू जसले GPT-3 को कच्चा प्रदर्शनसँग प्रतिस्पर्धा गर्न सक्छ।
किन OpenAI GPT-3 वैकल्पिक खोज्नुहोस्?
OpenAI को GPT-3 मोडेलले उन्नत प्रयोग गर्दछ गहिरो शिक्षा मानव जस्तै पाठ उत्पादन गर्न मोडेल। यो OpenAI को अनुसन्धान प्रयोगशालाबाट तेस्रो पुस्ताको भाषा भविष्यवाणी मोडेल हो।
OpenAI ले अन्ततः 2021 को अन्तमा जनताको लागि API खोल्नु अघि मोडेल सुरुमा बन्द बिटाको रूपमा जारी गरिएको थियो।
हाल, GPT-3 मा चारवटा आधार मोडेलहरू छन् जसबाट तपाईं छनौट गर्न सक्नुहुन्छ। Ada, सस्तो र छिटो मोडेलको लागत मात्र $0.0004 प्रति 1000 टोकनहरू। OpenAI को सबैभन्दा शक्तिशाली मोडेल, Davinci, प्रति 0.02 टोकनहरू $ 1000, वा लगभग 50 गुणा बढी महँगो छ।
OpenAI लाई पनि विकासकर्ताले आफ्नै पालना गर्न आवश्यक छ उपयोग दिशानिर्देशन। विकासकर्ताले सीमित उपयोग कोटा पनि प्रदान गर्नेछ जुन विकासकर्ताको आवेदन म्यानुअल समीक्षा प्रक्रिया मार्फत स्वीकृत भएपछि वृद्धि गर्न सकिन्छ।
जबकि GPT-3 आउटपुट यसको उच्च-गुणस्तरको आउटपुटको लागि राम्रोसँग परिचित छ, यो तपाइँको प्रयोगको लागि उपलब्ध भाषा भविष्यवाणी मोडेल मात्र होइन।
GPT-3 को विकल्पको रूपमा तपाईंले प्रयोग गर्न सक्ने केही प्रतिस्पर्धी मोडेलहरू हेरौं।
1. GPT-J
GPT-J Eleuther AI समूह द्वारा खुला स्रोत भाषा मोडेल हो।
शून्य-शट प्रदर्शन लगभग GPT-3 सँग बराबर छ र अन्य धेरै GPT कार्यान्वयनहरू भन्दा प्रदर्शनमा धेरै नजिक छ।
6-बिलियन प्यारामिटर अटोरेग्रेसिभ टेक्स्ट जेनरेशन मोडेललाई "द पाइल" भनेर चिनिने डाटा सेटमा तालिम दिइएको छ।
ढेर यो वास्तवमा 22 साना डेटासेटहरूको संयोजन हो। यसमा 825 GiB को संयुक्त फाइल साइज छ र यसले शैक्षिक र व्यावसायिक स्रोतहरूमा बढी जोड दिएको पाइएको छ।
तपाईं यस मार्फत मोडेल आफैलाई परीक्षण गर्न सक्नुहुन्छ नि: शुल्क वेब अनुप्रयोग.
म एक साधारण प्रम्प्ट संग मोडेल बाहिर परीक्षण गर्न सक्षम थिए। GPT-J "आज नयाँ भाषा सिक्ने उत्तम तरिकाहरू" गणना गर्न सफल भयो।
जे होस्, प्रदर्शन केहि हदसम्म धब्बा छ जब मैले यसलाई अटोरेग्रेसिभ टेक्स्ट जेनरेशन मोडेल के हो भनेर व्याख्या गर्न सोध्ने प्रयास गरे।
जबकि आउटपुटले अर्थपूर्ण बनायो, यसले वास्तवमा अर्थपूर्ण तरिकामा प्रम्प्टको जवाफ दिएन।
मूल्य निर्धारण
GPT-J खुला-स्रोत मोडेल भएकोले, तपाईंले वास्तवमा आफ्नो उदाहरण आफैं चलाउन सक्नुहुन्छ। यस अनुसार आधिकारिक भण्डार, मोडेल टेन्सर प्रशोधन इकाई (TPU) मा चलाउन डिजाइन गरिएको छ। इष्टतम हुँदा, यो Google को सस्तो पछि सबैभन्दा लागत-प्रभावी विकल्प नहुन सक्छ क्लाउड TPUs लागत लगभग $4.50/घण्टा।
तपाईंको आफ्नै GPU प्रयोग गर्न वा सेवाहरू मार्फत समर्पित GPU सर्भर भाडामा लिनु लामो अवधिमा कम महँगो हुन सक्छ। Vast.ai or FluidStack.
2. जुरासिक-1
Jurassic-1 AI21 Labs, NLP मा विशेषज्ञता इजरायली AI कम्पनी द्वारा जारी गरिएको भाषा मोडेल हो। ओपनएआई जस्तै, तिनीहरूले एपीआई पनि प्रस्ताव गर्छन् जसले तपाईंलाई तिनीहरूको भाषा मोडेल पहुँच गर्न अनुमति दिन्छ।
तपाईं तिनीहरूको मा एक खाता बनाउन सक्नुहुन्छ वेबसाइट आफ्नो लागि मोडेल परीक्षण गर्न खेल मैदान वेब अनुप्रयोग पहुँच गर्न।
AI21 स्टुडियोमा एउटा सुविधा पनि समावेश छ जहाँ तपाईंले तिनीहरूको जुरासिक-१ मोडेलहरूको आफ्नै अनुकूलन संस्करणहरूलाई तालिम दिन र क्वेरी गर्न सक्नुहुन्छ। अनुसार ए आधिकारिक ब्लग पोस्ट, पचास भन्दा कम उदाहरणहरू भएका अनुकूलन मोडेलहरूले मौलिक मोडेल प्रयोग गरेर प्रम्प्ट इन्जिनियरिङलाई उत्कृष्ट प्रदर्शन गर्न सक्छन्।
मूल्य निर्धारण
तिनीहरू प्रत्येक तीन आधार मोडेलहरूको लागि लचिलो उपयोग-आधारित मूल्य निर्धारण प्रस्ताव गर्छन्। उदाहरणका लागि, तिनीहरूले मोडेलद्वारा उत्पन्न प्रत्येक 0.25 टोकनहरूको लागि $ 1000 चार्ज गर्छन्। औसतमा, प्रत्येक टोकन लगभग 1 शब्द वा छ वर्णहरू छन्।
यसको मतलब तपाईले AI21 को उत्कृष्ट मोडेल प्रयोग गर्न सक्नुहुन्छ 4000-शब्द कागजात मात्र $1 मा सिर्जना गर्न। तपाईले सम्झनु पर्ने एउटा कुरा यो हो कि तपाईले अझै पनि मोडेल प्रयोग गर्न प्रत्येक महिना न्यूनतम $ 29 तिर्न आवश्यक छ।
3. TextSynth
TextSynth अर्को NLP वेब सेवा हो जुन तपाईले पाठ उत्पन्न गर्न प्रयोग गर्न सक्नुहुन्छ। अघिल्लो दुई उदाहरणहरूको विपरीत, TextSynth एक स्ट्यान्डअलोन मोडेल होइन। GPT-NeoX, M2M100 र यहाँ सम्म कि GPT-J जस्ता विभिन्न अन्य खुला-स्रोत ठूला भाषा मोडेलहरूमा प्रयोगकर्तालाई पहुँच प्रदान गरेर सेवाले काम गर्दछ।
विकासकर्ताहरूले तिनीहरूको प्रयोग गर्न सक्छन् REST API भाषा मोडेलहरूलाई तिनीहरूको आफ्नै अनुप्रयोगहरूमा एकीकृत गर्न। तपाईं तिनीहरूको निःशुल्क जाँच गर्न प्रयास गर्न सक्नुहुन्छ खेल मैदान पृष्ठ प्रत्येक उपलब्ध मोडेल कसरी प्रदर्शन गर्छ हेर्न।
मूल्य निर्धारण
तिनीहरूको नि:शुल्क योजनाले तपाईंलाई तिनीहरूका सबै भाषा मोडेलहरूमा केही दर सीमाहरूको साथ पहुँच दिन्छ। सेवाले प्रत्येक अनुरोधलाई 200 टोकनहरूको लम्बाइमा सीमित गर्दछ।
मानक योजनाले उत्पन्न टोकनहरूको संख्यामा सीमितता हटाउँछ। अप्रत्याशित खर्चहरूबाट बच्नको लागि मूल्य निर्धारण मोडेल क्रेडिट-आधारित छ। खरिद गर्न क्रेडिटहरूको न्यूनतम संख्या $ 20 हो। अप्रयुक्त क्रेडिटहरू एक वर्ष पछि अमान्य छन्।
प्रत्येक अनुरोधको मूल्य इनपुट र उत्पन्न टोकनहरूको संख्यामा आधारित हुन्छ। तिनीहरूको आधिकारिक वेबसाइटको तालिकामा आधारित, तपाईंले तिनीहरूको सस्तो मोडेलहरू प्रयोग गर्नको लागि $ 0.75 देखि $ 1.25 तिर्न अपेक्षा गर्न सक्नुहुन्छ।
निष्कर्ष
आशा छ, यो लेखले तपाईंलाई सस्तो र प्रभावकारी भाषा मोडेल फेला पार्न मद्दत गर्न सक्छ जुन तपाईंले प्रयोग गर्न सक्नुहुन्छ OpenAI GPT-3 वैकल्पिक.
ठूला भाषा मोडेलहरू धेरै शक्तिशाली छन् र विभिन्न कार्यहरूको लागि प्रयोग गर्न सकिन्छ। तिनीहरू पाठ उत्पन्न गर्न, भाषाहरू बीच अनुवाद गर्न, र प्राकृतिक भाषा बुझ्न र प्रतिक्रिया गर्न प्रयोग गर्न सकिन्छ।
अन्तरिक्षमा मेरो अनुसन्धान र मैले सञ्चालन गरेको परीक्षणहरूको आधारमा, GPT-3 ले अझै पनि अन्य प्रदर्शन गर्दछ। ठूलो भाषा मोडेल मैले प्रयास गरेको छु। जे होस्, यो भविष्यमा परिवर्तन हुन सक्छ किनभने अनुसन्धानकर्ताहरूले नयाँ मोडेलहरू विकास र जारी गर्छन्।
Google, Facebook, र अन्य AI प्रयोगशालाहरूमा अनुसन्धानकर्ताहरूले अझै पनि आफ्नै LMMs लाई अगाडि बढाउने काम जारी राख्नेछन्। यो निश्चित रूपमा सम्भव छ कि यी एआई टोलीहरू मध्ये एक GPT-3 भन्दा उच्च मोडेलको साथ बाहिर आउनेछ।
जवाफ छाड्नुस्