ഉള്ളടക്ക പട്ടിക[മറയ്ക്കുക][കാണിക്കുക]
ദി 23-ാമത്തെ Google I/O തികച്ചും ത്രില്ലിംഗ് ആയിരുന്നു! ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ മേഖലയിൽ അവർ നിരവധി സുപ്രധാന മുന്നേറ്റങ്ങൾ അവതരിപ്പിച്ചു.
OpenAI-യുടെ GPT-4-ഉം Google-ന്റെ Gemini-ഉം തമ്മിലുള്ള മത്സരം ഏറ്റവും പ്രധാനപ്പെട്ട വെളിപ്പെടുത്തലുകളിൽ ഒന്നാണ്. അവരുടെ നിലവിലുള്ളതിന് ശേഷം PalM 2 സിസ്റ്റം, അടുത്ത തലമുറയുടെ വലിയ ഭാഷാ മാതൃക (LLM) ആണ് ജെമിനി.
മെഷീൻ ലേണിംഗ് മോഡൽ ഗൂഗിൾ മെച്ചപ്പെടുത്തി, ഇത് കൂടുതൽ സങ്കീർണ്ണമാക്കുന്നു. മൈക്രോസോഫ്റ്റിന്റെ Bing മെച്ചപ്പെടുത്തലുകളുമായി മത്സരിക്കുന്നതിന്, അവർ ആൻഡ്രോയിഡിലേക്ക് ജനറേറ്റീവ് AI കഴിവുകൾ ചേർക്കുകയും AI ഉപയോഗിച്ച് Google തിരയൽ വർദ്ധിപ്പിക്കുകയും ചെയ്യുന്നു.
Google ബാർഡിനെ മറ്റുള്ളവരുമായി കൂടുതൽ മത്സരാധിഷ്ഠിതമാക്കാൻ ChatGPT പോലുള്ള ചാറ്റ്ബോട്ടുകൾ, അവർ ഇവന്റിൽ കാര്യമായ മെച്ചപ്പെടുത്തൽ പ്രഖ്യാപിച്ചു. ബാർഡ് ഒടുവിൽ കൊറിയൻ, ജാപ്പനീസ് ഉൾപ്പെടെ 40 ഭാഷകളെ പിന്തുണയ്ക്കും. ഈ വിപുലീകരണത്തിലൂടെ, ബാർഡിന് എവിടെയും devs-നെ പിന്തുണയ്ക്കാൻ കഴിയും.
കൂടാതെ, ഉപയോക്തൃ അഭ്യർത്ഥനകൾക്കുള്ള മറുപടികൾ മെച്ചപ്പെടുത്തുന്നതിനായി, ബാർഡ് ഇപ്പോൾ ചിത്രങ്ങളും മാപ്പുകളും മറ്റ് ഗ്രാഫിക്സും വാഗ്ദാനം ചെയ്യും. അവിടെയുള്ള എല്ലാ ഡെവലപ്പർമാർക്കും, അത് വലിയ സഹായമായിരിക്കും. ഇവിടെ, ഞങ്ങൾ LLM ജെമിനിയുടെ പ്രത്യേകതകൾ പരിശോധിക്കും.
എന്താണ് ജെമിനി?
അതുപ്രകാരം ഗൂഗിൾ, ജെമിനി അടിസ്ഥാനപരമായി ഉദ്ദേശിച്ചത് മൾട്ടിമോഡൽ, കണക്റ്റിംഗ് ടൂളുകളുടെയും API-കളുടെയും കാര്യത്തിൽ വളരെ കാര്യക്ഷമവും, മെമ്മറി, പ്ലാനിംഗ് തുടങ്ങിയ ഭാവി മുന്നേറ്റങ്ങൾക്ക് തയ്യാറുള്ളതുമാണ്. മുൻ മോഡലുകൾക്ക് ഇല്ലാതിരുന്ന മികച്ച മൾട്ടിമോഡൽ കഴിവുകൾ ജെമിനിക്കുണ്ടെന്ന് ഗൂഗിൾ അവരുടെ ബ്ലോഗ് പോസ്റ്റിൽ പറഞ്ഞു.
"സുരക്ഷയ്ക്കായി ഞങ്ങൾ ജെമിനിയെ നന്നായി ട്യൂൺ ചെയ്യുകയും സമഗ്രമായി പരിശോധിക്കുകയും ചെയ്തുകഴിഞ്ഞാൽ, ഞങ്ങൾ ഇത് വിവിധ വലുപ്പത്തിലും കഴിവുകളിലും പാൽഎം 2-ന് സമാനമായി വാഗ്ദാനം ചെയ്യും," ഗൂഗിൾ പറഞ്ഞു.
തൽഫലമായി, എല്ലാവർക്കും പ്രയോജനപ്പെടുന്നതിന് ഒന്നിലധികം ഉൽപ്പന്നങ്ങൾ, ആപ്പുകൾ, ഉപകരണങ്ങൾ എന്നിവയിലുടനീളം ഇത് നടപ്പിലാക്കാൻ കഴിയും.
വിപുലീകരിച്ച ബഹുഭാഷാ, ന്യായവാദം, കോഡിംഗ് കഴിവുകൾ എന്നിവയുള്ള അത്യാധുനിക ഭാഷാ മോഡലായ PalM 2 അവർ കോൺഫറൻസിൽ അവതരിപ്പിച്ചു. 100-ലധികം ഭാഷകളിൽ നിന്നുള്ള ബഹുഭാഷാ സാമഗ്രികൾ ഉപയോഗിച്ച് ഇത് വിപുലമായി പരിശീലിപ്പിക്കപ്പെട്ടു.
വിവിധ ഭാഷകളിൽ ഭാഷാശൈലികൾ, കവിതകൾ, കടങ്കഥകൾ എന്നിവ പോലുള്ള സൂക്ഷ്മമായ ഉള്ളടക്കം നിർമ്മിക്കാനും വിവർത്തനം ചെയ്യാനും PalM 2 ന് കഴിയും.
ജെമിനി ഗൂഗിളിന്റെ AI ശ്രമങ്ങൾ വർധിപ്പിക്കാനും പയനിയർ ആയ OpenAI യുടെ ChatGPT യെ വെല്ലുവിളിക്കാനും സാധ്യതയുണ്ട്. ChatGPT കൂടുതലും ടെക്സ്റ്റ് അധിഷ്ഠിത സംഭാഷണങ്ങൾക്കായി ഉപയോഗിക്കുമ്പോൾ, ജെമിനി മൾട്ടിമോഡൽ ആണ്, അതായത് ടെക്സ്റ്റിനോടും ദൃശ്യങ്ങളോടും പ്രതികരിക്കാൻ ഇതിന് കഴിയും. ഒരിക്കൽ ഗൂഗിൾ സെർച്ചുമായി സംയോജിപ്പിച്ചാൽ, ജനപ്രിയ സെർച്ച് എഞ്ചിനുമായി ഉപഭോക്താക്കൾ എങ്ങനെ ഇടപഴകുന്നു എന്നതിനെ പരിവർത്തനം ചെയ്യാൻ ഇതിന് കഴിവുണ്ട്.
ജെമിനിയെ കുറിച്ചുള്ള കൂടുതൽ വിശദാംശങ്ങൾ ഇതുവരെ ലഭ്യമല്ലെങ്കിലും, ഇതിന് ChatGPT, Bing AI എന്നിവയെ മറികടക്കാൻ കഴിയും, ഇത് AI ഫീൽഡിന്റെ തലപ്പത്തേക്ക് Google-നെ പ്രേരിപ്പിക്കുന്നു.
ഗൂഗിളിന്റെ സിഇഒ സുന്ദർ പിച്ചൈ കോൺഫറൻസിൽ പറഞ്ഞു, "ഏഴ് വർഷത്തെ AI-ആദ്യ കമ്പനിയായതിന് ശേഷം, ഞങ്ങൾ ഒരു ആവേശകരമായ വഴിത്തിരിവിലാണ്."
ജെമിനി ഇപ്പോൾ പരിശീലനത്തിലാണ്, പിച്ചൈയുടെ അഭിപ്രായത്തിൽ, അത് വളരെ ഫലപ്രദവും മെമ്മറിയും ആസൂത്രണവും പോലെയുള്ള ഭാവി മുന്നേറ്റങ്ങൾക്കുള്ള വാതിൽ തുറക്കുന്നതുമായ ഒരു മൾട്ടിമോഡൽ സമീപനത്തോടെയാണ് ഇത് സൃഷ്ടിക്കുന്നത്. പിച്ചൈയുടെ അഭിപ്രായത്തിൽ, അതിന്റെ പ്രാരംഭ ഘട്ടത്തിലാണെങ്കിലും, മുൻ പതിപ്പുകളിൽ നിന്ന് ഇല്ലാതിരുന്ന മികച്ച മൾട്ടിമോഡൽ കഴിവുകൾ ജെമിനി ഇതിനകം തന്നെ കാണിക്കുന്നുണ്ട്.
ഗൂഗിൾ ജെമിനിയെ അതിന്റെ ടിപിയു (ചിപ്പുകൾ) വഴി നിർദേശിക്കുന്നു. ജെമിനി ഒപ്റ്റിമൈസ് ചെയ്യുകയും സുരക്ഷാ പരിശോധനകൾ വിജയിക്കുകയും ചെയ്ത ശേഷം, പ്രത്യേക റിലീസ് തീയതി സൂചിപ്പിച്ചിട്ടില്ലെങ്കിലും, വലുപ്പത്തിലും ശേഷിയിലും അത് ആക്സസ് ചെയ്യാൻ കഴിയുമെന്ന് പിച്ചൈ പ്രസ്താവിച്ചു.
തെറ്റായ വിവരങ്ങൾ പ്രചരിപ്പിക്കുന്നത് തടയാൻ ഗൂഗിളിന്റെ എല്ലാ AI മോഡലുകളും വാട്ടർമാർക്കിംഗും മെറ്റാഡാറ്റയും ചിത്രങ്ങൾ പോലുള്ള ഔട്ട്പുട്ടുകളിൽ ഉൾപ്പെടുത്തുമെന്ന് പിച്ചൈ വ്യക്തമാക്കി.
എന്താണ് മിഥുനത്തെ ശ്രേഷ്ഠമാക്കുന്നത് ചാറ്റ് GPT കൂടാതെ BingAI?
ജെമിനിക്ക് നിരവധി കൗതുകകരമായ "മൾട്ടിമോഡൽ" സവിശേഷതകളുണ്ട്. ജെമിനി, വാചകം വായിക്കാനും നിർമ്മിക്കാനും മാത്രം കഴിയുന്ന ChatGPT-യിൽ നിന്ന് വ്യത്യസ്തമായി, ഒരു മൾട്ടിമോഡൽ മാതൃകയെ അടിസ്ഥാനമാക്കിയുള്ളതാണ്, കൂടാതെ ടെക്സ്റ്റ്, കോഡ്, ചിത്രങ്ങൾ എന്നിവ മനസ്സിലാക്കാനും നിർമ്മിക്കാനും കഴിയും.
ഈ വൈവിധ്യമാർന്ന വൈദഗ്ധ്യം വഴി നിരവധി അവസരങ്ങൾ സാധ്യമാക്കുന്നു. ഉദാഹരണത്തിന്, ജെമിനി, ടെക്സ്റ്റും വിഷ്വലുകളും മനസ്സിലാക്കാനും പ്രതികരിക്കാനും കഴിയുന്ന AI ചാറ്റ്ബോട്ടുകളുടെ ഒരു നോവൽ ക്ലാസ് സൃഷ്ടിക്കാൻ ഉപയോഗിക്കാം.
എന്നിരുന്നാലും, ChatGPT-യും Bing-ഉം ടെക്സ്റ്റ് അധിഷ്ഠിത ആശയവിനിമയം മാത്രമേ നൽകുന്നുള്ളൂ, Bing ഇമേജുകൾ സൃഷ്ടിക്കുന്നതിന് ഒരു പ്രത്യേക ലിങ്ക് നൽകുന്നു, പക്ഷേ ഇൻ-ചാറ്റ് ചിത്ര പിന്തുണ ഇല്ല.
ChatGPT-യിൽ നിന്ന് വ്യത്യസ്തമായി ജെമിനിക്ക് വൈവിധ്യമാർന്ന ഉൽപ്പന്നങ്ങളും ആപ്ലിക്കേഷനുകളും കൈകാര്യം ചെയ്യാൻ കഴിയും. ഉദാഹരണത്തിന്, Google തിരയൽ അപ്ഗ്രേഡ് ചെയ്യാനോ AI ഉപയോഗിക്കുന്ന ഒരു അത്യാധുനിക വെർച്വൽ അസിസ്റ്റന്റ് സൃഷ്ടിക്കാനോ ഇത് ഉപയോഗിക്കാം. BingAI, ChatGPT എന്നിവയിൽ ഈ ഫീച്ചറുകൾ കുറവാണ്. എന്നിരുന്നാലും, ChatGPT, ഫലങ്ങൾ മെച്ചപ്പെടുത്തുന്ന പ്ലഗിനുകൾ നൽകുന്നു.
മെമ്മറി, ആസൂത്രണം തുടങ്ങിയ സവിശേഷതകളും മിഥുനത്തിനുണ്ട്, ഇത് ചാറ്റ്ജിപിടിക്ക് കഴിയുന്നതിലും അപ്പുറമുള്ള AI- പവർ ആപ്പുകൾ വികസിപ്പിക്കാൻ അനുവദിക്കുന്നു.
നിങ്ങളുടെ മുൻഗണനകളും ദൈനംദിന ആസൂത്രണത്തിൽ സഹായവും സൂക്ഷിക്കുന്ന ജെമിനി നൽകുന്ന ഒരു വ്യക്തിഗത അസിസ്റ്റന്റ് നിങ്ങൾ പരിഗണിക്കുമ്പോൾ ആവേശകരമായ സാധ്യതകൾ ഉയർന്നുവരുന്നു. എന്നിരുന്നാലും, ജെമിനിയുടെ മുഴുവൻ സാധ്യതകളും കാണാനും അത് തുറക്കുന്ന അവസരങ്ങളെക്കുറിച്ച് അന്വേഷിക്കാനും, ഞങ്ങൾ ആദ്യം അതിന്റെ പൊതു റിലീസിനായി അക്ഷമയോടെ കാത്തിരിക്കണം.
തീരുമാനം
ഗൂഗിളിന്റെ അടുത്ത തലമുറ ഭാഷാ മോഡലായ ജെമിനി, അതിന്റെ ടെക്സ്റ്റ് മാത്രമുള്ള എതിരാളിയായ ChatGPT-യെക്കാൾ മികച്ച മൾട്ടിമോഡൽ ഫീച്ചറുകൾ കാണിക്കുന്നു.
ടെക്സ്റ്റ്, കോഡ്, ഗ്രാഫിക്സ് എന്നിവ വായിക്കാനും നിർമ്മിക്കാനും പ്രാപ്തമാക്കുന്നതിലൂടെ ചാറ്റ്ബോട്ടുകൾക്കും AI ആപ്പുകൾക്കും ജെമിനി പുതിയ അവസരങ്ങൾ സൃഷ്ടിക്കുന്നു. ഈ ആപ്ലിക്കേഷനുകൾക്ക് ഇപ്പോൾ ഒരു വലിയ പ്രവർത്തന ശ്രേണി നിയന്ത്രിക്കാനാകും. ചിത്രങ്ങളെയും മൾട്ടിമോഡൽ ഇടപെടലുകളെയും പിന്തുണയ്ക്കുന്ന ജെമിനിക്ക് വിപരീതമായി, ChatGPT, BingAI എന്നിവയ്ക്ക് ടെക്സ്റ്റ് അധിഷ്ഠിത ഇടപെടലുകൾക്ക് മാത്രമേ കഴിയൂ.
ജെമിനിയെ സംബന്ധിച്ച കൂടുതൽ വ്യക്തമായ വിവരങ്ങൾ ഇതുവരെ പരസ്യമാക്കിയിട്ടില്ലെങ്കിലും, AI സാങ്കേതികവിദ്യ വികസിപ്പിക്കുന്നതിനും ഈ രംഗത്ത് അതിന്റെ മുൻതൂക്കം നിലനിർത്തുന്നതിനും Google പ്രതിജ്ഞാബദ്ധമാണെന്ന് വ്യക്തമാണ്.
ഔപചാരികമായ ലോഞ്ചിനായി ഞങ്ങൾ ആവേശത്തോടെ കാത്തിരിക്കുമ്പോൾ ജെമിനിയുടെ മുഴുവൻ സാധ്യതകളും അത് തുറക്കുന്ന ക്രിയാത്മകമായ സാധ്യതകളും കാണുമെന്ന് ഞങ്ങൾ പ്രതീക്ഷിക്കുന്നു.
നിങ്ങളുടെ അഭിപ്രായങ്ങൾ രേഖപ്പെടുത്തുക