गुगल लगातार AI अनुसन्धानमा अग्रपंक्तिमा रहेको छ, यसको विशाल स्रोतहरूको सदुपयोग गर्दै र उच्च-प्रतिभाशाली इन्जिनियरहरूको पर्याप्त संख्यामा रोजगारी दिन्छ। यद्यपि, भाषा मोडेलको सन्दर्भमा, गुगलको प्रयास खेलमा ढिलो भयो।
टेक दिग्गज माइक्रोसफ्टले ओपनएआईसँगको फलदायी साझेदारीबाट पहिले नै लाभान्वित भइसकेको हुँदा, गुगलसँग त्यसलाई पकड्नुको विकल्प थिएन।
यस वर्षको गुगल I/O सम्मेलनमा, कम्पनीले जेनेरेटिभ AI हतियार दौड: PaLM 2 मा आफ्नो जवाफ घोषणा गर्यो। के यो नयाँ मोडेलले OpenAI को GPT-4 सँगसँगै प्रदर्शन मापन गर्नेछ?
PaLM 2 के हो?
गुगल वर्णन गर्दछ PaLM 2 एक अत्याधुनिक भाषा मोडेलको रूपमा जुन 2022 मा पहिलो पटक घोषणा गरिएको तिनीहरूको अवस्थित PaLM मोडेलमा सुधार हुन्छ। अन्य भाषा मोडेलहरू जस्तै, PaLM 2 ले विभिन्न पाठ उत्पादन कार्यहरू गर्न सक्षम छ जस्तै PaLM कार्यहरूको विस्तृत श्रृंखलामा सक्षम छ। , प्रश्नहरूको जवाफ, पाठ अनुवाद सहित, कोड उत्पन्न गर्दै, र अधिक धेरै।
परीक्षणहरूले देखाएको छ कि PaLM 2 ले पहिले नै महत्त्वपूर्ण सुधारहरू देखाउँछ, PaLM मोडेल भन्दा धेरै कम प्यारामिटरहरू प्रयोग गर्दा।
PaLM 2 मोडेलहरूको परिवार हो
अन्य भाषा मोडेलहरू जस्तै, PaLM 2 परियोजना वास्तवमा आकारमा दायरा मोडेलहरूको परिवार हो। गुगलले PaLM 2 मोडेल चार साइजमा उपलब्ध गराउनेछ: Gecko, Otter, Bison, र Unicorn।
साइजको विविधताले विभिन्न प्रयोग केसहरूमा PaLM 2 लाई प्रयोग गर्न सजिलो बनाउँछ। उदाहरणका लागि, Gecko मोडेल पर्याप्त हल्का छ कि सम्पूर्ण मोडेल मोबाइल उपकरणमा फिट हुन सक्छ र अफलाइन पनि चलाउन सक्छ।
PaLM 2 को प्रशिक्षण डाटासेट
सफल भाषा मोडेलको सबैभन्दा महत्त्वपूर्ण पक्षहरू मध्ये एक हो प्रशिक्षण डेटासेट। मोडेललाई यसको लागि डिजाइन गरिएको विषयवस्तुको गहिरो समझ प्राप्त गर्न अनुमति दिन प्रशिक्षण डेटासेट पर्याप्त विविध हुनुपर्छ।
ठूला भाषा मोडेलहरू (LLMs) को लागि, त्यहाँ सामान्यतया कुनै विशेष विषय छैन जुन मोडेलले प्रशिक्षण गर्नुपर्छ। LLMs को सट्टा सामान्य-उद्देश्य मोडेल बनाइन्छ जुन धेरै कार्यहरू गर्न फिट हुनुपर्छ। यी मोडेलहरूले ठूला पाठ्य डेटासेटहरू प्रयोग गर्छन् जसले वेबको ठूलो भागको साथसाथै प्रकाशित सन्दर्भ सामग्री, साहित्य, र स्रोत कोड पनि कब्जा गर्दछ।
PaLM 2 को प्रशिक्षण डेटासेट र अन्य मोडेलहरू बीचको मुख्य भिन्नता गैर-अंग्रेजी डेटाको उच्च प्रतिशत समावेश गर्नु हो। उनीहरुका अनुसार प्राविधिक रिपोर्ट, गैर-अंग्रेजी पाठहरू समावेश गर्न डेटासेट विस्तार गर्नाले मोडेललाई भाषा र संस्कृतिहरूको फराकिलो विविधतामा उजागर गर्दछ।
PaLM 2 मोडेललाई एक भाषाबाट अर्को भाषामा अनुवाद गर्ने क्षमता प्राप्त गर्न मद्दतको लागि समानान्तर बहुभाषिक डेटामा पनि तालिम दिइएको थियो। डेटाले पाठको जोडी समावेश गर्दछ जहाँ एउटा प्रविष्टि अंग्रेजीमा छ र अर्को अर्को भाषामा बराबरको पाठ हो।
माथिको तालिकाले PaLM 2 लाई तालिम दिन प्रयोग गरिने बहुभाषी वेब कागजातहरूको भाषा वितरण देखाउँछ।
PaLM 2 प्रमुख विशेषताहरू
यहाँ केहि मुख्य क्षेत्रहरू छन् जुन PaLM 2 अन्य भाषा मोडेलहरूको तुलनामा उत्कृष्ट छ।
तर्क गर्दै
PaLM 2 को डेटासेटले गणितीय अभिव्यक्तिहरूसँग वैज्ञानिक कागजहरू र वेब सामग्री जस्ता स्रोतहरू समावेश गर्दछ। यसले मोडेललाई गणित, सामान्य ज्ञान तर्क, र तर्कमा सुधारिएको क्षमताहरू दिन्छ।
शोधकर्ताहरूले ग्रेड स्कूल र हाई स्कूल गणित प्रश्नहरूमा मोडेलको गणितीय तर्क क्षमताहरूको परीक्षण गरे जहाँ यसले GPT-4 को गणित क्षमताहरूसँग तुलनात्मक परिणामहरू देखाउँछ।
कोडिंग
PaLM 2 को प्रशिक्षण डेटाले यसलाई विभिन्न प्रोग्रामिङ भाषाहरूमा कोड उत्पन्न गर्ने क्षमता पनि दिन्छ। PALM 2 टोलीले PaLM 2-S* नामक कोडिङ-विशिष्ट PaLM 2 मोडेल सिर्जना गर्यो जसलाई कोड-हेवी बहुभाषी डेटासेटमा तालिम दिइएको थियो।
न केवल मोडेल कोड उत्पादन गर्न सक्षम छ, तर यसले धेरै भाषाहरू समावेश गर्ने कार्यहरू ह्यान्डल गर्न सक्षम छ। उदाहरणका लागि, तपाईंले PaLM 2 लाई पाइथन क्रमबद्ध गर्ने प्रकार्य सिर्जना गर्न सोध्न सक्नुहुन्छ जसले स्पेनिशमा लाइन-द्वारा-लाइन टिप्पणीहरू थप्छ।
बहुभाषिकता
मोडेललाई १०० भन्दा बढी भाषाहरू समावेश गर्ने डेटासेटमा तालिम दिइएको हुनाले, PaLM 100 ले धेरै भाषाहरूमा पाठ बुझ्ने, उत्पादन गर्ने र अनुवाद गर्ने क्षमता देखाउँछ।
बहुभाषिकता परीक्षण गर्न, अन्वेषकहरूले विभिन्न भाषाहरूमा विभिन्न भाषा प्रवीणता परीक्षणहरूमा मोडेलको परीक्षण गरे। नतिजाहरूले देखाउँछन् कि PaLM 2 ले PaLM लाई मात्र नभई प्रत्येक मूल्याङ्कन गरिएको भाषाको लागि पासिंग ग्रेड पनि हासिल गरेको छ।
PaLM 2 ले विभिन्न भाषाहरूमा मुहावराहरू बुझ्ने, चुटकुले व्याख्या गर्ने, टाइपोहरू ठीक गर्ने, र औपचारिक पाठलाई बोलचाल च्याटमा कसरी रूपान्तरण गर्ने भनेर पनि सिक्न सक्छ।
PaLM 2 ले Google उत्पादनहरूलाई शक्ति दिन्छ
गुगलले पहिले नै PaLM 2 को अन्य उत्पादनहरु संग मोडेल एकीकृत गरेर प्रगति को लाभ उठाइरहेको छ।
बार्ड
बहुभाषिक कार्यहरू ह्यान्डल गर्ने मोडेलको क्षमताले अब गुगललाई शक्ति दिइरहेको छ बार्ड प्रयोग जसरी यो 180 भन्दा बढी देश र क्षेत्रहरूमा फैलिएको छ।
Bard ले अब PaLM 2 को कोडिङ क्षमताहरू प्रोग्रामिङ र सफ्टवेयर विकास कार्यहरू जस्तै कोड उत्पादन र कोड डिबगिङमा सहयोग गर्न प्रयोग गरिरहेको छ।
Google Workspace को लागि Duet AI
गुगलले यसको गुगल वर्कस्पेस समूहका अनुप्रयोगहरूमा जेनेरेटिभ एआई सुविधाहरू थप्ने योजना पनि बनाइरहेको छ। जीमेल र कागजातले चाँडै नै एउटा सुविधा समावेश गर्नेछ युगल AI जसले प्रयोगकर्तालाई प्रम्प्टहरू प्रयोग गरेर उनीहरूको जवाफ र लेखनको मस्यौदा तयार गर्न मद्दत गर्नेछ।
Duet AI ले प्रयोगकर्ताहरूलाई Google Sheets मा प्रयोगकर्ताद्वारा दिइएको प्रम्प्टको आधारमा कार्यहरू र परियोजनाहरूका लागि अनुकूलन योजनाहरू सिर्जना गर्न अनुमति दिनेछ।
निष्कर्ष
गुगल पक्कै पनि आफ्नो PaLM 2 भाषा मोडेलको साथ AI भाषा उपकरणहरूको बजारमा खाडल बन्द गर्ने आशामा छ। जबकि मोडेलको sAPI अझै सार्वजनिक रूपमा उपलब्ध छैन, तिनीहरूको अनुसन्धानका नतिजाहरूले देखाउँछन् कि मोडेल GPT-4 को प्रदर्शनसँग मेल खाने पर्याप्त प्रतिस्पर्धी छ।
गुगलको अवस्थित प्रयोगकर्ता आधारसँग, तिनीहरूको AI तिनीहरूको खोज इन्जिन वा तिनीहरूको उत्पादकता उपकरणहरूको सूट जस्ता सेवाहरूमा एकीकृत भएमा तिनीहरूले पक्कै पनि ठूलो अनुकूलनको फाइदा पाउनेछन्।
जवाफ छाड्नुस्