Google એ AI સંશોધનમાં સતત મોખરે રહ્યું છે, તેના વિશાળ સંસાધનોનો લાભ ઉઠાવે છે અને નોંધપાત્ર સંખ્યામાં ટોચના પ્રતિભાશાળી એન્જિનિયરોને રોજગારી આપે છે. જો કે, ભાષાના મોડલના સંદર્ભમાં, Google ના પ્રયત્નો રમતમાં મોડું થયું.
ટેક જાયન્ટ માઈક્રોસોફ્ટ ઓપનએઆઈ સાથેની ફળદાયી ભાગીદારીથી પહેલાથી જ ફાયદો ઉઠાવી રહી છે ત્યારે, Google પાસે પકડવા સિવાય કોઈ વિકલ્પ નહોતો.
આ વર્ષની Google I/O કોન્ફરન્સમાં, કંપનીએ જનરેટિવ AI આર્મ્સ રેસ માટે તેના જવાબની જાહેરાત કરી: PaLM 2. શું આ નવું મોડલ OpenAI ના GPT-4 ની સાથે પ્રદર્શનમાં માપન કરશે?
PaLM 2 શું છે?
Google વર્ણવે છે PaLM 2 એક અદ્યતન ભાષા મોડેલ તરીકે જે 2022 માં પ્રથમ જાહેર કરાયેલા તેમના હાલના PaLM મોડેલમાં સુધારો કરે છે. અન્ય ભાષાના મોડલની જેમ, PaLM 2 વિવિધ ટેક્સ્ટ જનરેશન કાર્યો કરવા સક્ષમ છે જેમ કે PaLM વિશાળ શ્રેણીના કાર્યો માટે સક્ષમ છે. , પ્રશ્નોના જવાબ આપવા, ટેક્સ્ટનો અનુવાદ કરવા સહિત, કોડ જનરેટ કરી રહ્યો છે, અને ઘણું બધું.
પરીક્ષણોએ દર્શાવ્યું છે કે PaLM 2 પહેલાથી જ નોંધપાત્ર સુધારાઓ દર્શાવે છે, જે PaLM મોડલ કરતાં ઘણી ઓછી સંખ્યામાં પેરામીટર્સનો ઉપયોગ કરે છે.
PaLM 2 એ મોડેલ્સનું કુટુંબ છે
અન્ય ભાષાના મૉડલ્સની જેમ, PaLM 2 પ્રોજેક્ટ વાસ્તવમાં મૉડલનું એક કુટુંબ છે જે કદમાં શ્રેણીબદ્ધ છે. Google ચાર કદમાં PaLM 2 મોડલ પ્રદાન કરશે: Gecko, Otter, Bison, અને Unicorn.
કદમાં વિવિધતા વિવિધ ઉપયોગના કેસોમાં PaLM 2 ને જમાવવાનું સરળ બનાવે છે. ઉદાહરણ તરીકે, Gecko મૉડલ એટલું હલકું છે કે આખું મૉડલ મોબાઇલ ડિવાઇસમાં ફિટ થઈ શકે છે અને ઑફલાઇન પણ ચાલી શકે છે.
PaLM 2 ની તાલીમ ડેટાસેટ
સફળ ભાષા મોડેલના સૌથી મહત્વપૂર્ણ પાસાઓ પૈકી એક છે તાલીમ ડેટાસેટ. પ્રશિક્ષણ ડેટાસેટ એટલો વૈવિધ્યસભર હોવો જોઈએ કે મોડેલને તે જે વિષય માટે ડિઝાઇન કરવામાં આવ્યો છે તેની ઊંડી સમજણ મેળવી શકે.
મોટા લેંગ્વેજ મોડલ્સ (LLM) માટે, સામાન્ય રીતે કોઈ વિશિષ્ટ વિષય નથી કે જેના પર મોડેલને તાલીમ આપવી જોઈએ. એલએલએમ તેના બદલે સામાન્ય હેતુના મોડલ તરીકે બનાવવામાં આવ્યા છે જે વિશાળ સંખ્યામાં કાર્યો કરવા માટે યોગ્ય હોવા જોઈએ. આ મોડેલો મોટા ટેક્સ્ટ્યુઅલ ડેટાસેટ્સનો ઉપયોગ કરે છે જે વેબના મોટા ભાગને તેમજ પ્રકાશિત સંદર્ભ સામગ્રી, સાહિત્ય અને સ્રોત કોડને પણ કેપ્ચર કરે છે.
PaLM 2 ના તાલીમ ડેટાસેટ અને અન્ય મોડેલો વચ્ચેનો મુખ્ય તફાવત એ છે કે બિન-અંગ્રેજી ડેટાની ઊંચી ટકાવારીનો સમાવેશ. તેમના અનુસાર તકનીકી અહેવાલ, બિન-અંગ્રેજી ગ્રંથો સમાવવા માટે ડેટાસેટને વિસ્તૃત કરવાથી મોડેલને ભાષાઓ અને સંસ્કૃતિઓની વિશાળ વિવિધતાઓ સામે આવે છે.
PaLM 2 મોડેલને સમાંતર બહુભાષી ડેટા પર પણ તાલીમ આપવામાં આવી હતી જેથી મોડેલને એક ભાષામાંથી બીજી ભાષામાં અનુવાદ કરવાની ક્ષમતા પ્રાપ્ત કરવામાં મદદ મળી શકે. ડેટામાં ટેક્સ્ટની જોડીનો સમાવેશ થાય છે જ્યાં એક એન્ટ્રી અંગ્રેજીમાં છે અને બીજી બીજી ભાષામાં સમકક્ષ ટેક્સ્ટ છે.
ઉપરનું કોષ્ટક PaLM 2 ને તાલીમ આપવા માટે વપરાતા બહુભાષી વેબ દસ્તાવેજોનું ભાષા વિતરણ દર્શાવે છે.
PaLM 2 મુખ્ય લક્ષણો
અહીં કેટલાક મુખ્ય ક્ષેત્રો છે જે PaLM 2 અન્ય ભાષાના મોડલ્સની તુલનામાં શ્રેષ્ઠ છે.
તર્ક
PaLM 2ના ડેટાસેટમાં વૈજ્ઞાનિક કાગળો અને ગાણિતિક અભિવ્યક્તિઓ સાથેની વેબ સામગ્રી જેવા સ્ત્રોતોનો સમાવેશ થાય છે. આ મોડેલને ગણિત, સામાન્ય જ્ઞાનની તર્ક અને તર્કશાસ્ત્રમાં સુધારેલી ક્ષમતાઓ આપે છે.
સંશોધકોએ ગ્રેડ સ્કૂલ અને હાઇ સ્કૂલના ગણિતના પ્રશ્નો પર મોડેલની ગાણિતિક તર્ક ક્ષમતાઓનું પરીક્ષણ કર્યું જ્યાં તે GPT-4 ની ગણિત ક્ષમતાઓ સાથે તુલનાત્મક પરિણામો દર્શાવે છે.
કોડિંગ
PaLM 2 નો તાલીમ ડેટા તેને વિવિધ પ્રોગ્રામિંગ ભાષાઓમાં કોડ જનરેટ કરવાની ક્ષમતા પણ આપે છે. PALM 2 ટીમે PaLM 2-S* નામનું કોડિંગ-વિશિષ્ટ PaLM 2 મોડલ બનાવ્યું હતું જેને કોડ-હેવી બહુભાષી ડેટાસેટ પર તાલીમ આપવામાં આવી હતી.
મોડલ માત્ર કોડ જનરેશન માટે સક્ષમ નથી, પરંતુ તે બહુવિધ ભાષાઓને સમાવતા કાર્યોને હેન્ડલ કરવામાં પણ સક્ષમ છે. ઉદાહરણ તરીકે, તમે PaLM 2 ને Python સોર્ટિંગ ફંક્શન બનાવવા માટે કહી શકો છો જે સ્પેનિશમાં લાઇન-બાય-લાઇન ટિપ્પણીઓ ઉમેરે છે.
બહુભાષી
મોડલને 100 થી વધુ ભાષાઓ સમાવિષ્ટ ડેટાસેટ પર તાલીમ આપવામાં આવી હોવાથી, PaLM 2 બહુવિધ ભાષાઓમાં ટેક્સ્ટને સમજવા, જનરેટ કરવા અને અનુવાદ કરવામાં પ્રાવીણ્ય દર્શાવે છે.
બહુભાષીતાને ચકાસવા માટે, સંશોધકોએ વિવિધ ભાષાઓમાં વિવિધ ભાષા પ્રાવીણ્ય પરીક્ષણો પર મોડેલનું પરીક્ષણ કર્યું. પરિણામો દર્શાવે છે કે માત્ર PaLM 2 એ PaLM ને આઉટપરફોર્મ નથી કર્યું પણ દરેક મૂલ્યાંકન કરેલ ભાષા માટે પાસિંગ ગ્રેડ પણ પ્રાપ્ત કર્યો છે.
PaLM 2 વિવિધ ભાષાઓમાં રૂઢિપ્રયોગો સમજવા, જોક્સ સમજાવવા, ટાઈપો સુધારવાની ક્ષમતા દ્વારા તેની બહુભાષી ક્ષમતાઓ પણ દર્શાવે છે અને ઔપચારિક ટેક્સ્ટને બોલચાલની ચેટમાં કેવી રીતે રૂપાંતરિત કરવું તે પણ શીખી શકે છે.
PaLM 2 Google પ્રોડક્ટ્સને પાવર આપે છે
Google પહેલેથી જ PaLM 2 ની પ્રગતિનો લાભ અન્ય ઉત્પાદનો સાથે મોડેલને સંકલિત કરીને લઈ રહ્યું છે.
બાર્ડ
બહુભાષી કાર્યોને હેન્ડલ કરવાની મૉડલની ક્ષમતા હવે Google ને શક્તિ આપી રહી છે ચારણ પ્રયોગ કારણ કે તે 180 થી વધુ દેશો અને પ્રદેશોમાં વિસ્તરે છે.
બાર્ડ હવે કોડ જનરેશન અને કોડ ડિબગીંગ જેવા પ્રોગ્રામિંગ અને સોફ્ટવેર ડેવલપમેન્ટ કાર્યોમાં મદદ કરવા માટે PaLM 2 ની કોડિંગ ક્ષમતાઓનો પણ ઉપયોગ કરી રહ્યું છે.
Google Workspace માટે Duet AI
ગૂગલ તેના ગૂગલ વર્કસ્પેસ ગ્રૂપ ઓફ એપ્લીકેશનમાં જનરેટિવ AI સુવિધાઓ ઉમેરવાનું પણ આયોજન કરી રહ્યું છે. જીમેલ અને ડોક્સમાં ટૂંક સમયમાં એક ફીચરનો સમાવેશ થશે ડ્યુએટ AI જે વપરાશકર્તાને તેમના જવાબો અને સંકેતોનો ઉપયોગ કરીને લખવામાં મદદ કરશે.
Duet AI વપરાશકર્તાઓને વપરાશકર્તા દ્વારા આપવામાં આવેલા સંકેતોના આધારે કાર્યો અને પ્રોજેક્ટ્સ માટે Google શીટ્સમાં કસ્ટમ પ્લાન બનાવવાની પણ મંજૂરી આપશે.
ઉપસંહાર
ગૂગલ તેમના PaLM 2 લેંગ્વેજ મોડલ વડે AI લેંગ્વેજ ટૂલ્સના માર્કેટમાં ગેપને પૂર્ણ કરવાની આશા રાખે છે. જ્યારે મોડલનું sAPI હજુ સુધી સાર્વજનિક રૂપે ઉપલબ્ધ નથી, તેમના સંશોધનનાં પરિણામો દર્શાવે છે કે મોડેલ GPT-4 ની કામગીરીને મેચ કરવા માટે પૂરતું સ્પર્ધાત્મક છે.
Google ના હાલના વપરાશકર્તા આધાર સાથે, જો તેમનું AI તેમની સેવાઓ જેમ કે તેમના સર્ચ એન્જિન અથવા તેમના ઉત્પાદકતા સાધનોના સ્યુટમાં સંકલિત થઈ જાય તો તેઓને મોટા પાયે અનુકૂલનનો લાભ ચોક્કસપણે મળશે.
એક જવાબ છોડો