ഗൂഗിൾ AI ഗവേഷണത്തിന്റെ മുൻനിരയിൽ തുടരുന്നു, അതിന്റെ വിപുലമായ വിഭവങ്ങൾ പ്രയോജനപ്പെടുത്തുകയും മികച്ച പ്രതിഭയുള്ള എഞ്ചിനീയർമാരെ ഗണ്യമായ എണ്ണം നിയമിക്കുകയും ചെയ്യുന്നു. എന്നിരുന്നാലും, ഭാഷാ മോഡലുകളുടെ കാര്യത്തിൽ, ഗൂഗിളിന്റെ ശ്രമങ്ങൾ ഗെയിമിലേക്ക് വൈകി.
ടെക് ഭീമനായ മൈക്രോസോഫ്റ്റ് ഓപ്പൺ എഐയുമായുള്ള ഫലപ്രദമായ പങ്കാളിത്തത്തിൽ നിന്ന് ഇതിനകം പ്രയോജനം നേടിയതിനാൽ, ഗൂഗിളിന് പിടിക്കുകയല്ലാതെ മറ്റ് മാർഗമില്ല.
ഈ വർഷത്തെ ഗൂഗിൾ ഐ/ഒ കോൺഫറൻസിൽ, ഉൽപ്പാദനക്ഷമതയുള്ള AI ആയുധ മൽസരത്തിനുള്ള ഉത്തരം കമ്പനി പ്രഖ്യാപിച്ചു: PalM 2. OpenAI-യുടെ GPT-4-നൊപ്പം ഈ പുതിയ മോഡൽ പ്രകടനത്തെ അളക്കുമോ?
എന്താണ് PalM 2?
ഗൂഗിൾ വിവരിക്കുന്നു PalM 2 2022-ൽ ആദ്യമായി പ്രഖ്യാപിച്ച അവരുടെ നിലവിലുള്ള PalM മോഡലിനെ മെച്ചപ്പെടുത്തുന്ന ഒരു അത്യാധുനിക ഭാഷാ മോഡൽ എന്ന നിലയിൽ. മറ്റ് ഭാഷാ മോഡലുകൾക്ക് സമാനമായി, PalM 2-ന് വിവിധ ടെക്സ്റ്റ് ജനറേഷൻ ടാസ്ക്കുകൾ ചെയ്യാൻ കഴിയും. , ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകുക, വാചകം വിവർത്തനം ചെയ്യുക, കോഡ് സൃഷ്ടിക്കുന്നു, അതോടൊപ്പം തന്നെ കുടുതല്.
വളരെ കുറഞ്ഞ അളവിലുള്ള പാരാമീറ്ററുകൾ ഉപയോഗിക്കുമ്പോൾ തന്നെ PalM മോഡലിനെ മറികടന്ന്, PalM 2 ഇതിനകം കാര്യമായ മെച്ചപ്പെടുത്തലുകൾ കാണിക്കുന്നുവെന്ന് പരിശോധനകൾ തെളിയിച്ചിട്ടുണ്ട്.
PalM 2 മോഡലുകളുടെ ഒരു കുടുംബമാണ്
മറ്റ് ഭാഷാ മോഡലുകൾ പോലെ, PalM 2 പ്രോജക്റ്റ് യഥാർത്ഥത്തിൽ വലിപ്പത്തിലുള്ള മോഡലുകളുടെ ഒരു കുടുംബമാണ്. Gecko, Otter, Bison, Unicorn എന്നിങ്ങനെ നാല് വലുപ്പങ്ങളിൽ Google PalM 2 മോഡൽ നൽകും.
വലിപ്പത്തിലുള്ള വൈവിധ്യം, വിവിധ ഉപയോഗ സന്ദർഭങ്ങളിൽ PalM 2 വിന്യസിക്കുന്നത് എളുപ്പമാക്കുന്നു. ഉദാഹരണത്തിന്, ഗെക്കോ മോഡൽ ഭാരം കുറഞ്ഞതാണ്, മുഴുവൻ മോഡലും ഒരു മൊബൈൽ ഉപകരണത്തിൽ ഉൾക്കൊള്ളാനും ഓഫ്ലൈനിൽ പോലും പ്രവർത്തിക്കാനും കഴിയും.
PalM 2-ന്റെ പരിശീലന ഡാറ്റാസെറ്റ്
വിജയകരമായ ഒരു ഭാഷാ മാതൃകയുടെ ഏറ്റവും പ്രധാനപ്പെട്ട വശങ്ങളിലൊന്നാണ് പരിശീലന ഡാറ്റാസെറ്റ്. പരിശീലന ഡാറ്റാസെറ്റ് രൂപകൽപ്പന ചെയ്തിരിക്കുന്ന വിഷയത്തെക്കുറിച്ച് ആഴത്തിലുള്ള ധാരണയുണ്ടാക്കാൻ മോഡലിനെ അനുവദിക്കുന്നതിന് പര്യാപ്തമായിരിക്കണം.
വലിയ ഭാഷാ മോഡലുകൾക്ക് (LLMs), മോഡൽ പരിശീലിപ്പിക്കേണ്ട പ്രത്യേക വിഷയങ്ങളൊന്നുമില്ല. LLM-കൾ പൊതു-ഉദ്ദേശ്യ മോഡലുകളായി നിർമ്മിക്കപ്പെട്ടിരിക്കുന്നു, അത് നിരവധി ജോലികൾ ചെയ്യാൻ അനുയോജ്യമായിരിക്കണം. ഈ മോഡലുകൾ വെബിന്റെ വലിയൊരു ഭാഗവും പ്രസിദ്ധീകരിച്ച റഫറൻസ് മെറ്റീരിയലും സാഹിത്യവും സോഴ്സ് കോഡും പിടിച്ചെടുക്കുന്ന വലിയ ടെക്സ്ച്വൽ ഡാറ്റാസെറ്റുകൾ ഉപയോഗിക്കുന്നു.
PalM 2-ന്റെ പരിശീലന ഡാറ്റാസെറ്റും മറ്റ് മോഡലുകളും തമ്മിലുള്ള പ്രധാന വ്യത്യാസം ഇംഗ്ലീഷ് ഇതര ഡാറ്റയുടെ ഉയർന്ന ശതമാനം ഉൾപ്പെടുത്തുന്നതാണ്. അവരുടെ പ്രകാരം സാങ്കേതിക റിപ്പോർട്ട്, ഇംഗ്ലീഷ് ഇതര ഗ്രന്ഥങ്ങൾ ഉൾപ്പെടുത്തുന്നതിനായി ഡാറ്റാസെറ്റ് വിപുലീകരിക്കുന്നത് മോഡലിനെ വൈവിധ്യമാർന്ന ഭാഷകളിലേക്കും സംസ്കാരങ്ങളിലേക്കും തുറന്നുകാട്ടുന്നു.
ഒരു ഭാഷയിൽ നിന്ന് മറ്റൊരു ഭാഷയിലേക്ക് വിവർത്തനം ചെയ്യാനുള്ള കഴിവ് മോഡലിനെ സഹായിക്കുന്നതിന് സമാന്തര ബഹുഭാഷാ ഡാറ്റയിലും PalM 2 മോഡലിന് പരിശീലനം നൽകിയിട്ടുണ്ട്. ഒരു എൻട്രി ഇംഗ്ലീഷിലും മറ്റൊന്ന് മറ്റൊരു ഭാഷയിലുള്ള തത്തുല്യമായ ടെക്സ്റ്റും ഉള്ള ജോഡി വാചകങ്ങൾ ഡാറ്റയിൽ ഉൾപ്പെടുന്നു.
PalM 2 പരിശീലിപ്പിക്കാൻ ഉപയോഗിക്കുന്ന ബഹുഭാഷാ വെബ് ഡോക്യുമെന്റുകളുടെ ഭാഷാ വിതരണം മുകളിലെ പട്ടിക കാണിക്കുന്നു.
PalM 2 പ്രധാന സവിശേഷതകൾ
മറ്റ് ഭാഷാ മോഡലുകളെ അപേക്ഷിച്ച് PalM 2 മികവ് പുലർത്തുന്ന ചില പ്രധാന മേഖലകൾ ഇതാ.
ന്യായവാദം
PalM 2-ന്റെ ഡാറ്റാസെറ്റിൽ സയന്റിഫിക് പേപ്പറുകളും ഗണിതശാസ്ത്ര പദപ്രയോഗങ്ങളുള്ള വെബ് ഉള്ളടക്കവും പോലുള്ള ഉറവിടങ്ങൾ ഉൾപ്പെടുന്നു. ഇത് മോഡലിന് ഗണിതശാസ്ത്രം, സാമാന്യബുദ്ധി യുക്തി, യുക്തി എന്നിവയിൽ മെച്ചപ്പെട്ട കഴിവുകൾ നൽകുന്നു.
GPT-4 ന്റെ ഗണിത ശേഷിയുമായി താരതമ്യപ്പെടുത്താവുന്ന ഫലങ്ങൾ കാണിക്കുന്ന ഗ്രേഡ് സ്കൂൾ, ഹൈസ്കൂൾ ഗണിത ചോദ്യങ്ങളിൽ ഗവേഷകർ മോഡലിന്റെ ഗണിതശാസ്ത്രപരമായ ന്യായവാദ കഴിവുകൾ പരീക്ഷിച്ചു.
കോഡിംഗ്
പലതരം പ്രോഗ്രാമിംഗ് ഭാഷകളിൽ കോഡ് സൃഷ്ടിക്കാനുള്ള കഴിവും PalM 2-ന്റെ പരിശീലന ഡാറ്റ നൽകുന്നു. PALM 2 ടീം ഒരു കോഡിംഗ്-നിർദ്ദിഷ്ട PalM 2 മോഡൽ സൃഷ്ടിച്ചു, ഇത് ഒരു കോഡ്-ഹെവി ബഹുഭാഷാ ഡാറ്റാസെറ്റിൽ പരിശീലിപ്പിക്കപ്പെട്ടു.
മോഡലിന് കോഡ് സൃഷ്ടിക്കാൻ കഴിയുമെന്ന് മാത്രമല്ല, ഒന്നിലധികം ഭാഷകൾ ഉൾപ്പെടുന്ന ടാസ്ക്കുകൾ കൈകാര്യം ചെയ്യാനും ഇതിന് കഴിയും. ഉദാഹരണത്തിന്, സ്പാനിഷ് ഭാഷയിൽ വരി വരി അഭിപ്രായങ്ങൾ ചേർക്കുന്ന ഒരു പൈത്തൺ സോർട്ടിംഗ് ഫംഗ്ഷൻ സൃഷ്ടിക്കാൻ നിങ്ങൾക്ക് PalM 2-നോട് ആവശ്യപ്പെടാം.
ബഹുഭാഷ
100-ലധികം ഭാഷകൾ ഉൾപ്പെടുന്ന ഒരു ഡാറ്റാസെറ്റിൽ മോഡൽ പരിശീലിപ്പിച്ചതിനാൽ, ഒന്നിലധികം ഭാഷകളിലുടനീളം വാചകം മനസ്സിലാക്കുന്നതിലും സൃഷ്ടിക്കുന്നതിലും വിവർത്തനം ചെയ്യുന്നതിലും PalM 2 പ്രാവീണ്യം കാണിക്കുന്നു.
ബഹുഭാഷാ കഴിവ് പരിശോധിക്കുന്നതിനായി, ഗവേഷകർ വിവിധ ഭാഷകളിലെ വിവിധ ഭാഷാ പ്രാവീണ്യ പരീക്ഷകളിൽ മാതൃക പരീക്ഷിച്ചു. PalM 2, PalM-നെ മറികടക്കുക മാത്രമല്ല, മൂല്യനിർണ്ണയിച്ച എല്ലാ ഭാഷകൾക്കും പാസിംഗ് ഗ്രേഡ് നേടുകയും ചെയ്തുവെന്ന് ഫലങ്ങൾ കാണിക്കുന്നു.
വ്യത്യസ്ത ഭാഷകളിലെ ഭാഷാഭേദങ്ങൾ മനസിലാക്കാനും തമാശകൾ വിശദീകരിക്കാനും അക്ഷരത്തെറ്റുകൾ പരിഹരിക്കാനുമുള്ള കഴിവ് വഴിയും അതിന്റെ ബഹുഭാഷാ കഴിവുകളും PalM 2 കാണിക്കുന്നു, കൂടാതെ ഔപചാരികമായ വാചകം സംഭാഷണ ചാറ്റിലേക്ക് എങ്ങനെ പരിവർത്തനം ചെയ്യാമെന്ന് പഠിക്കാനും കഴിയും.
PalM 2 Google ഉൽപ്പന്നങ്ങൾക്ക് ശക്തി നൽകുന്നു
മറ്റ് ഉൽപ്പന്നങ്ങളുമായി മോഡലിനെ സമന്വയിപ്പിച്ചുകൊണ്ട് Google ഇതിനകം തന്നെ PalM 2-ന്റെ മുന്നേറ്റങ്ങൾ പ്രയോജനപ്പെടുത്തുന്നു.
ബാർഡ്
ബഹുഭാഷാ ജോലികൾ കൈകാര്യം ചെയ്യാനുള്ള മോഡലിന്റെ കഴിവ് ഇപ്പോൾ ഗൂഗിളിനെ ശക്തിപ്പെടുത്തുന്നു ബാർഡ് പരീക്ഷണം ഇത് 180-ലധികം രാജ്യങ്ങളിലേക്കും പ്രദേശങ്ങളിലേക്കും വ്യാപിക്കുന്നു.
കോഡ് ജനറേഷൻ, കോഡ് ഡീബഗ്ഗിംഗ് തുടങ്ങിയ പ്രോഗ്രാമിംഗ്, സോഫ്റ്റ്വെയർ ഡെവലപ്മെന്റ് ടാസ്ക്കുകളിൽ സഹായിക്കാൻ ബാർഡ് ഇപ്പോൾ PalM 2-ന്റെ കോഡിംഗ് കഴിവുകളും ഉപയോഗിക്കുന്നു.
Google Workspace-നുള്ള ഡ്യുയറ്റ് AI
ഗൂഗിൾ അതിന്റെ ഗൂഗിൾ വർക്ക്സ്പേസ് ഗ്രൂപ്പിൽ ജനറേറ്റീവ് എഐ ഫീച്ചറുകൾ ചേർക്കാനും പദ്ധതിയിടുന്നുണ്ട്. ജിമെയിലിലും ഡോക്സിലും ഉടൻ ഒരു ഫീച്ചർ ഉൾപ്പെടുത്തും ഡ്യുയറ്റ് AI അത് ഉപയോക്താവിനെ അവരുടെ മറുപടികൾ തയ്യാറാക്കാനും നിർദ്ദേശങ്ങൾ ഉപയോഗിച്ച് എഴുതാനും സഹായിക്കും.
ഉപയോക്താവ് നൽകുന്ന നിർദ്ദേശങ്ങളെ അടിസ്ഥാനമാക്കി ടാസ്ക്കുകൾക്കും പ്രോജക്റ്റുകൾക്കുമായി ഗൂഗിൾ ഷീറ്റിൽ ഇഷ്ടാനുസൃത പ്ലാനുകൾ സൃഷ്ടിക്കാൻ ഡ്യുയറ്റ് AI ഉപയോക്താക്കളെ അനുവദിക്കും.
തീരുമാനം
അവരുടെ PalM 2 ഭാഷാ മോഡൽ ഉപയോഗിച്ച് AI ഭാഷാ ഉപകരണങ്ങളുടെ വിപണിയിലെ വിടവ് നികത്താൻ Google തീർച്ചയായും പ്രതീക്ഷിക്കുന്നു. മോഡലിന്റെ sAPI ഇതുവരെ പൊതുവായി ലഭ്യമല്ലെങ്കിലും, GPT-4 ന്റെ പ്രകടനവുമായി പൊരുത്തപ്പെടാൻ മോഡൽ മത്സരക്ഷമതയുള്ളതാണെന്ന് അവരുടെ ഗവേഷണ ഫലങ്ങൾ കാണിക്കുന്നു.
ഗൂഗിളിന്റെ നിലവിലുള്ള ഉപയോക്തൃ അടിത്തറയിൽ, അവരുടെ സെർച്ച് എഞ്ചിൻ അല്ലെങ്കിൽ ഉൽപ്പാദനക്ഷമതാ ടൂളുകളുടെ സ്യൂട്ട് പോലുള്ള സേവനങ്ങളിൽ അവരുടെ AI സംയോജിപ്പിച്ചാൽ അവർക്ക് തീർച്ചയായും വലിയ അഡാപ്റ്റേഷന്റെ പ്രയോജനമുണ്ട്.
നിങ്ങളുടെ അഭിപ്രായങ്ങൾ രേഖപ്പെടുത്തുക