Google अपने विशाल संसाधनों का लाभ उठाते हुए और पर्याप्त संख्या में शीर्ष-प्रतिभाशाली इंजीनियरों को नियुक्त करते हुए, AI अनुसंधान में लगातार सबसे आगे रहा है। हालाँकि, भाषा मॉडल के संदर्भ में, Google के प्रयास खेल के लिए देर से आए।
तकनीकी दिग्गज Microsoft पहले से ही OpenAI के साथ एक उपयोगी साझेदारी से लाभान्वित हो रहा है, Google के पास पकड़ने के अलावा कोई विकल्प नहीं था।
इस वर्ष के Google I/O सम्मेलन में, कंपनी ने जनरेटिव AI हथियारों की दौड़: PaLM 2 के जवाब की घोषणा की। क्या यह नया मॉडल OpenAI के GPT-4 के साथ-साथ प्रदर्शन में माप करेगा?
पाम 2 क्या है?
गूगल वर्णन करता है पालम 2 एक अत्याधुनिक भाषा मॉडल के रूप में जो 2022 में पहली बार घोषित अपने मौजूदा PaLM मॉडल में सुधार करता है। अन्य भाषा मॉडल के समान, PaLM 2 विभिन्न पाठ निर्माण कार्यों को करने में सक्षम है जैसे कि PaLM कई प्रकार के कार्यों में सक्षम है , जिसमें प्रश्नों का उत्तर देना, पाठ का अनुवाद करना, कोड जनरेट करना, और अधिक.
परीक्षणों से पता चला है कि PaLM 2 पहले से ही महत्वपूर्ण सुधार दिखाता है, बहुत कम संख्या में मापदंडों का उपयोग करते हुए PaLM मॉडल से बेहतर प्रदर्शन करता है।
PaLM 2 मॉडलों का परिवार है
अन्य भाषा मॉडल की तरह, PaLM 2 प्रोजेक्ट वास्तव में मॉडल का एक परिवार है जो आकार में होता है। Google PaLM 2 मॉडल को चार आकारों में प्रदान करेगा: गेको, ओटर, बाइसन और यूनिकॉर्न।
आकार में विविधता विभिन्न उपयोग मामलों में PaLM 2 को तैनात करना आसान बनाती है। उदाहरण के लिए, गेको मॉडल इतना हल्का है कि पूरा मॉडल एक मोबाइल डिवाइस में फिट हो सकता है और यहां तक कि ऑफलाइन भी चल सकता है।
PaLM 2 का प्रशिक्षण डाटासेट
एक सफल भाषा मॉडल के सबसे महत्वपूर्ण पहलुओं में से एक है प्रशिक्षण प्राप्त करने वाले. प्रशिक्षण डेटासेट पर्याप्त रूप से विविध होना चाहिए ताकि मॉडल को उस विषय वस्तु की गहरी समझ हो जिसके लिए इसे डिज़ाइन किया गया है।
बड़े भाषा मॉडल (एलएलएम) के लिए, आमतौर पर कोई विशिष्ट विषय नहीं होता है जिस पर मॉडल को प्रशिक्षित करना चाहिए। एलएलएम इसके बजाय सामान्य-उद्देश्य वाले मॉडल के रूप में बनाए गए हैं जो कई प्रकार के कार्यों को करने के लिए फिट होने चाहिए। ये मॉडल बड़े शाब्दिक डेटासेट का उपयोग करते हैं जो वेब के एक बड़े हिस्से के साथ-साथ प्रकाशित संदर्भ सामग्री, साहित्य और यहां तक कि स्रोत कोड को भी कैप्चर करते हैं।
PaLM 2 के प्रशिक्षण डेटासेट और अन्य मॉडलों के बीच मुख्य अंतर गैर-अंग्रेज़ी डेटा के उच्च प्रतिशत का समावेश है। उनके अनुसार तकनीकी प्रतिवेदन, गैर-अंग्रेज़ी पाठों को शामिल करने के लिए डेटासेट का विस्तार करना मॉडल को भाषाओं और संस्कृतियों की व्यापक विविधता के लिए उजागर करता है।
PaLM 2 मॉडल को समानांतर बहुभाषी डेटा पर भी प्रशिक्षित किया गया था ताकि मॉडल को एक भाषा से दूसरी भाषा में अनुवाद करने की क्षमता हासिल हो सके। डेटा में टेक्स्ट के जोड़े शामिल हैं जहां एक प्रविष्टि अंग्रेजी में है और दूसरी दूसरी भाषा में समकक्ष टेक्स्ट है।
ऊपर दी गई तालिका PaLM 2 को प्रशिक्षित करने के लिए उपयोग किए जाने वाले बहुभाषी वेब दस्तावेज़ों के भाषा वितरण को दर्शाती है।
PaLM 2 की मुख्य विशेषताएं
यहाँ कुछ मुख्य क्षेत्र दिए गए हैं जिनमें PaLM 2 अन्य भाषा मॉडलों की तुलना में उत्कृष्ट है।
विचार
PaLM 2 के डेटासेट में गणितीय अभिव्यक्तियों के साथ वैज्ञानिक पेपर और वेब सामग्री जैसे स्रोत शामिल हैं। यह मॉडल को गणित, सामान्य ज्ञान तर्क और तर्क में बेहतर क्षमता प्रदान करता है।
शोधकर्ताओं ने ग्रेड स्कूल और हाई स्कूल गणित के सवालों पर मॉडल की गणितीय तर्क क्षमता का परीक्षण किया जहां यह GPT-4 की गणित क्षमताओं के तुलनीय परिणाम दिखाता है।
कोडन
PaLM 2 का प्रशिक्षण डेटा भी इसे विभिन्न प्रकार की प्रोग्रामिंग भाषाओं में कोड उत्पन्न करने की क्षमता देता है। PALM 2 टीम ने एक कोडिंग-विशिष्ट PaLM 2 मॉडल बनाया जिसे PaLM 2-S* कहा जाता है जिसे कोड-भारी बहुभाषी डेटासेट पर प्रशिक्षित किया गया था।
मॉडल न केवल कोड जनरेशन में सक्षम है, बल्कि यह कई भाषाओं वाले कार्यों को संभालने में भी सक्षम है। उदाहरण के लिए, आप PaLM 2 को Python सॉर्टिंग फ़ंक्शन बनाने के लिए कह सकते हैं जो स्पैनिश में पंक्ति-दर-पंक्ति टिप्पणियां जोड़ता है।
बहुभाषी
चूंकि मॉडल को एक डेटासेट पर प्रशिक्षित किया गया था जिसमें 100 से अधिक भाषाएं शामिल हैं, PaLM 2 कई भाषाओं में पाठ को समझने, उत्पन्न करने और अनुवाद करने में दक्षता दिखाता है।
बहुभाषावाद का परीक्षण करने के लिए, शोधकर्ताओं ने विभिन्न भाषाओं में विभिन्न भाषा प्रवीणता परीक्षणों पर मॉडल का परीक्षण किया। परिणाम बताते हैं कि न केवल PaLM 2 PaLM से बेहतर प्रदर्शन करता है बल्कि प्रत्येक मूल्यांकन की गई भाषा के लिए एक उत्तीर्ण ग्रेड भी प्राप्त करता है।
PaLM 2 विभिन्न भाषाओं में मुहावरों को समझने, चुटकुलों को समझाने, टाइपो को ठीक करने की अपनी क्षमता से अपनी बहुभाषी क्षमताओं को भी दिखाता है, और यह भी सीख सकता है कि औपचारिक पाठ को बोलचाल की बातचीत में कैसे बदलना है।
PaLM 2 Google उत्पादों को शक्ति प्रदान करता है
Google पहले से ही मॉडल को अन्य उत्पादों के साथ एकीकृत करके PaLM 2 की प्रगति का लाभ उठा रहा है।
चारण
मॉडल की बहुभाषी कार्यों को संभालने की क्षमता अब Google को शक्ति प्रदान कर रही है बार्ड प्रयोग क्योंकि यह 180 से अधिक देशों और क्षेत्रों में फैला हुआ है।
बार्ड अब PaLM 2 की कोडिंग क्षमताओं का उपयोग प्रोग्रामिंग और सॉफ्टवेयर विकास कार्यों जैसे कोड जनरेशन और कोड डिबगिंग में सहायता के लिए भी कर रहा है।
Google Workspace के लिए डुएट AI
Google अपने Google कार्यक्षेत्र समूह के अनुप्रयोगों में जनरेटिव AI सुविधाओं को जोड़ने की भी योजना बना रहा है। जीमेल और डॉक्स में जल्द ही नामक एक सुविधा शामिल होगी युगल एआई जो उपयोगकर्ता को उनके उत्तरों का मसौदा तैयार करने और संकेतों का उपयोग करके लिखने में मदद करेगा।
डुएट एआई उपयोगकर्ताओं को उपयोगकर्ता द्वारा दिए गए संकेतों के आधार पर कार्यों और परियोजनाओं के लिए Google शीट्स में कस्टम प्लान बनाने की भी अनुमति देगा।
निष्कर्ष
Google निश्चित रूप से अपने PaLM 2 भाषा मॉडल के साथ AI भाषा उपकरणों के बाजार में अंतर को पाटने की उम्मीद कर रहा है। जबकि मॉडल का एपीआई अभी तक सार्वजनिक रूप से उपलब्ध नहीं है, उनके शोध के परिणाम बताते हैं कि मॉडल GPT-4 के प्रदर्शन से मेल खाने के लिए पर्याप्त प्रतिस्पर्धी है।
Google के मौजूदा उपयोगकर्ता आधार के साथ, उन्हें निश्चित रूप से बड़े पैमाने पर अनुकूलन का लाभ मिलता है यदि उनका AI उनकी सेवाओं जैसे कि उनके खोज इंजन या उनके उत्पादकता उपकरणों के सूट में एकीकृत हो जाता है।
एक जवाब लिखें