AI संशोधनामध्ये Google सातत्याने आघाडीवर आहे, तिच्या अफाट संसाधनांचा लाभ घेत आहे आणि मोठ्या संख्येने उच्च-प्रतिभा अभियंते नियुक्त करत आहे. तथापि, भाषेच्या मॉडेल्सच्या बाबतीत, Google च्या प्रयत्नांना गेमसाठी उशीर झाला.
टेक दिग्गज मायक्रोसॉफ्टला आधीच OpenAI सह फलदायी भागीदारीचा फायदा होत असताना, Google ला पकडण्याशिवाय पर्याय नव्हता.
या वर्षीच्या Google I/O परिषदेत, कंपनीने जनरेटिव्ह AI शस्त्रास्त्रांच्या शर्यतीचे उत्तर जाहीर केले: PaLM 2. हे नवीन मॉडेल OpenAI च्या GPT-4 च्या बरोबरीने कार्यक्षमतेत मापन करेल का?
PaLM 2 म्हणजे काय?
Google वर्णन करते PaLM 2 अत्याधुनिक भाषा मॉडेल म्हणून जे त्यांच्या विद्यमान PaLM मॉडेलमध्ये सुधारणा करते जे 2022 मध्ये प्रथम घोषित केले गेले. इतर भाषा मॉडेल प्रमाणेच, PaLM 2 विविध मजकूर निर्मिती कार्ये करण्यास सक्षम आहे जसे की PaLM कार्यांच्या विस्तृत श्रेणीत सक्षम आहे प्रश्नांची उत्तरे देणे, मजकूराचे भाषांतर करणे यासह, कोड तयार करत आहे, आणि बरेच काही.
चाचण्यांनी दर्शविले आहे की PaLM 2 आधीच लक्षणीय सुधारणा दर्शवते, पॅरामीटर्सच्या खूपच कमी संख्येचा वापर करताना PaLM मॉडेलला मागे टाकते.
PaLM 2 हे मॉडेल्सचे कुटुंब आहे
इतर भाषेच्या मॉडेल्सप्रमाणे, PaLM 2 प्रकल्प हे प्रत्यक्षात मॉडेल्सचे एक कुटुंब आहे जे आकारात आहे. Google चार आकारांमध्ये PaLM 2 मॉडेल प्रदान करेल: Gecko, Otter, Bison आणि Unicorn.
आकारातील विविधता विविध वापराच्या प्रकरणांमध्ये PaLM 2 तैनात करणे सोपे करते. उदाहरणार्थ, गेको मॉडेल इतके हलके आहे की संपूर्ण मॉडेल मोबाइल डिव्हाइसमध्ये बसू शकते आणि ऑफलाइन देखील चालवू शकते.
PaLM 2 चा प्रशिक्षण डेटासेट
यशस्वी भाषा मॉडेलची सर्वात महत्वाची बाब म्हणजे प्रशिक्षण डेटासेट. प्रशिक्षण डेटासेट पुरेसा वैविध्यपूर्ण असणे आवश्यक आहे की मॉडेलला ते ज्या विषयासाठी डिझाइन केले आहे त्या विषयाची सखोल माहिती मिळू शकेल.
मोठ्या भाषेच्या मॉडेल्ससाठी (LLM), मॉडेलने प्रशिक्षण घेतले पाहिजे असा कोणताही विशिष्ट विषय नाही. LLMs त्याऐवजी सामान्य-उद्देशीय मॉडेल म्हणून तयार केले जातात जे मोठ्या संख्येने कार्ये करण्यासाठी योग्य असले पाहिजेत. हे मॉडेल मोठे मजकूर डेटासेट वापरतात जे वेबचा मोठा भाग तसेच प्रकाशित संदर्भ साहित्य, साहित्य आणि अगदी स्त्रोत कोड देखील कॅप्चर करतात.
PaLM 2 च्या प्रशिक्षण डेटासेट आणि इतर मॉडेलमधील मुख्य फरक म्हणजे इंग्रजी नसलेल्या डेटाच्या उच्च टक्केवारीचा समावेश आहे. त्यांच्या मते तांत्रिक अहवाल, नॉन-इंग्रजी मजकूर समाविष्ट करण्यासाठी डेटासेटचा विस्तार करणे मॉडेलला विविध भाषा आणि संस्कृतींसमोर आणते.
PaLM 2 मॉडेलला समांतर बहुभाषिक डेटावरही प्रशिक्षण देण्यात आले होते जेणेकरून मॉडेलला एका भाषेतून दुसर्या भाषेत भाषांतर करण्याची क्षमता प्राप्त करण्यात मदत होईल. डेटामध्ये मजकूराच्या जोड्यांचा समावेश आहे जेथे एक प्रविष्टी इंग्रजीमध्ये आहे आणि दुसरी दुसर्या भाषेतील समतुल्य मजकूर आहे.
वरील सारणी PaLM 2 ला प्रशिक्षित करण्यासाठी वापरल्या जाणार्या बहुभाषिक वेब दस्तऐवजांचे भाषा वितरण दर्शवते.
PaLM 2 प्रमुख वैशिष्ट्ये
इतर भाषा मॉडेल्सच्या तुलनेत PaLM 2 उत्कृष्ट असलेली काही मुख्य क्षेत्रे येथे आहेत.
रीझनिंग
PaLM 2 च्या डेटासेटमध्ये वैज्ञानिक कागदपत्रे आणि गणितीय अभिव्यक्तीसह वेब सामग्री यासारख्या स्रोतांचा समावेश आहे. हे मॉडेलला गणित, सामान्य ज्ञान तर्क आणि तर्कशास्त्रातील सुधारित क्षमता देते.
संशोधकांनी ग्रेड स्कूल आणि हायस्कूल गणिताच्या प्रश्नांवर मॉडेलच्या गणितीय तर्क क्षमतांची चाचणी केली जेथे ते GPT-4 च्या गणित क्षमतेशी तुलनात्मक परिणाम दर्शविते.
कोडिंग
PaLM 2 चा प्रशिक्षण डेटा विविध प्रोग्रामिंग भाषांमध्ये कोड तयार करण्याची क्षमता देखील देतो. PALM 2 टीमने PaLM 2-S* नावाचे कोडिंग-विशिष्ट PaLM 2 मॉडेल तयार केले जे कोड-हेवी बहुभाषिक डेटासेटवर प्रशिक्षित होते.
मॉडेल केवळ कोड जनरेशन करण्यास सक्षम नाही, परंतु एकाधिक भाषांचा समावेश असलेली कार्ये हाताळण्यास देखील सक्षम आहे. उदाहरणार्थ, तुम्ही PaLM 2 ला Python सॉर्टिंग फंक्शन तयार करण्यास सांगू शकता जे स्पॅनिशमध्ये लाइन-बाय-लाइन टिप्पण्या जोडते.
बहुभाषिकता
मॉडेलला 100 पेक्षा जास्त भाषांचा समावेश असलेल्या डेटासेटवर प्रशिक्षण देण्यात आले असल्याने, PaLM 2 अनेक भाषांमधील मजकूर समजणे, जनरेट करणे आणि भाषांतरित करण्यात प्रवीणता दाखवते.
बहुभाषिकतेची चाचणी घेण्यासाठी, संशोधकांनी वेगवेगळ्या भाषांमधील विविध भाषा प्राविण्य चाचण्यांवर मॉडेलची चाचणी केली. परिणाम दर्शविते की PaLM 2 ने केवळ PaLM ला मागे टाकले नाही तर प्रत्येक मूल्यमापन केलेल्या भाषेसाठी उत्तीर्ण ग्रेड देखील प्राप्त केला आहे.
PaLM 2 विविध भाषांमधील मुहावरे समजून घेणे, विनोद समजावून सांगणे, टायपोस दूर करणे, आणि औपचारिक मजकूराचे बोलचाल चॅटमध्ये कसे रूपांतरित करायचे ते देखील शिकू शकते.
PaLM 2 Google उत्पादनांना शक्ती देते
Google आधीच इतर उत्पादनांसह मॉडेल समाकलित करून PaLM 2 च्या प्रगतीचा फायदा घेत आहे.
या शब्दांत यथार्थ गौरव
बहुभाषिक कार्ये हाताळण्याची मॉडेलची क्षमता आता Google ला शक्ती देत आहे बार्ड प्रयोग कारण ते 180 पेक्षा जास्त देश आणि प्रदेशांमध्ये विस्तारते.
Bard आता PaLM 2 च्या कोडिंग क्षमतांचा वापर प्रोग्रामिंग आणि सॉफ्टवेअर डेव्हलपमेंट कार्य जसे की कोड जनरेशन आणि कोड डीबगिंगमध्ये मदत करण्यासाठी करत आहे.
Google Workspace साठी Duet AI
Google त्याच्या Google Workspace गटाच्या ऍप्लिकेशन्समध्ये जनरेटिव्ह AI वैशिष्ट्ये जोडण्याची योजना आखत आहे. जीमेल आणि डॉक्समध्ये लवकरच नावाचे वैशिष्ट्य समाविष्ट केले जाईल युगल AI जे वापरकर्त्याला प्रॉम्प्ट वापरून त्यांची उत्तरे आणि लिहिण्यास मदत करेल.
Duet AI वापरकर्त्यांना वापरकर्त्यांनी दिलेल्या सूचनांवर आधारित कार्ये आणि प्रकल्पांसाठी Google Sheets मध्ये सानुकूल योजना तयार करण्यास अनुमती देईल.
निष्कर्ष
Google निश्चितपणे त्यांच्या PaLM 2 भाषा मॉडेलसह AI भाषा साधनांच्या बाजारपेठेतील अंतर पूर्ण करेल अशी आशा आहे. मॉडेलचे sAPI अद्याप सार्वजनिकरित्या उपलब्ध नसले तरी, त्यांच्या संशोधनाचे परिणाम असे दर्शवतात की मॉडेल GPT-4 च्या कामगिरीशी जुळण्यासाठी पुरेसे स्पर्धात्मक आहे.
Google च्या विद्यमान वापरकर्ता आधारासह, जर त्यांचे AI त्यांच्या सेवांमध्ये जसे की त्यांचे शोध इंजिन किंवा त्यांच्या उत्पादन साधनांच्या संचमध्ये समाकलित झाले तर त्यांना निश्चितपणे मोठ्या प्रमाणात अनुकूलतेचा फायदा होईल.
प्रत्युत्तर द्या