AI పరిశోధనలో Google నిలకడగా ముందంజలో ఉంది, దాని విస్తారమైన వనరులను ఉపయోగించుకుంటుంది మరియు గణనీయమైన సంఖ్యలో అత్యుత్తమ ప్రతిభ గల ఇంజనీర్లను నియమించుకుంది. అయితే, భాషా నమూనాల పరంగా, Google యొక్క ప్రయత్నాలు గేమ్కు ఆలస్యం అయ్యాయి.
టెక్ దిగ్గజం మైక్రోసాఫ్ట్ ఇప్పటికే OpenAIతో ఫలవంతమైన భాగస్వామ్యం నుండి లబ్ది పొందుతున్నందున, Googleకి చేరుకోవడం తప్ప వేరే మార్గం లేదు.
ఈ సంవత్సరం Google I/O కాన్ఫరెన్స్లో, ఉత్పాదక AI ఆయుధ పోటీకి కంపెనీ తన సమాధానాన్ని ప్రకటించింది: PalM 2. OpenAI యొక్క GPT-4తో పాటుగా ఈ కొత్త మోడల్ పనితీరును అంచనా వేస్తుందా?
PalM 2 అంటే ఏమిటి?
Google వివరిస్తుంది పాల్ఎమ్ 2 2022లో మొదటిసారిగా ప్రకటించిన వారి ప్రస్తుత PalM మోడల్ను మెరుగుపరిచే స్టేట్ ఆఫ్ ది ఆర్ట్ లాంగ్వేజ్ మోడల్గా ఉంది. ఇతర భాషా నమూనాల మాదిరిగానే, PalM 2 అనేక టెక్స్ట్ జనరేషన్ టాస్క్లను చేయగలదు, అంటే PalM విస్తృత శ్రేణి పనులను చేయగలదు. , ప్రశ్నలకు సమాధానం ఇవ్వడం, వచనాన్ని అనువదించడం, కోడ్ని ఉత్పత్తి చేస్తోంది, ఇవే కాకండా ఇంకా.
PalM 2 ఇప్పటికే గణనీయమైన మెరుగుదలలను చూపుతుందని పరీక్షలు చూపించాయి, చాలా తక్కువ సంఖ్యలో పారామితులను ఉపయోగిస్తున్నప్పుడు PalM మోడల్ను అధిగమించింది.
PalM 2 అనేది మోడల్స్ కుటుంబం
ఇతర భాషా నమూనాల వలె, PalM 2 ప్రాజెక్ట్ నిజానికి పరిమాణంలో ఉండే మోడల్ల కుటుంబం. Google PalM 2 మోడల్ను నాలుగు పరిమాణాలలో అందిస్తుంది: గెక్కో, ఓటర్, బైసన్ మరియు యునికార్న్.
వివిధ రకాల పరిమాణాలు PalM 2ని వివిధ వినియోగ సందర్భాలలో అమలు చేయడాన్ని సులభతరం చేస్తాయి. ఉదాహరణకు, గెక్కో మోడల్ తగినంత తేలికగా ఉంటుంది, మొత్తం మోడల్ మొబైల్ పరికరంలో సరిపోతుంది మరియు ఆఫ్లైన్లో కూడా నడుస్తుంది.
PalM 2 యొక్క శిక్షణ డేటాసెట్
విజయవంతమైన భాషా నమూనా యొక్క అత్యంత ముఖ్యమైన అంశాలలో ఒకటి శిక్షణ డేటాసెట్. శిక్షణ డేటాసెట్ రూపొందించబడిన విషయంపై లోతైన అవగాహన కలిగి ఉండటానికి మోడల్ను అనుమతించేంత వైవిధ్యంగా ఉండాలి.
పెద్ద భాషా నమూనాల (LLMలు) కోసం, మోడల్ తప్పనిసరిగా శిక్షణ ఇవ్వాల్సిన నిర్దిష్ట అంశం ఉండదు. బదులుగా LLMలు సాధారణ-ప్రయోజన నమూనాలుగా నిర్మించబడ్డాయి, ఇవి విస్తృత సంఖ్యలో విధులను నిర్వహించడానికి సరిపోతాయి. ఈ మోడల్లు వెబ్లో ఎక్కువ భాగాన్ని అలాగే ప్రచురించిన రిఫరెన్స్ మెటీరియల్, సాహిత్యం మరియు సోర్స్ కోడ్ను క్యాప్చర్ చేసే పెద్ద టెక్స్ట్యువల్ డేటాసెట్లను ఉపయోగిస్తాయి.
PalM 2 యొక్క శిక్షణ డేటాసెట్ మరియు ఇతర నమూనాల మధ్య ప్రధాన వ్యత్యాసం ఆంగ్లేతర డేటాలో అధిక శాతం చేర్చడం. వారి ప్రకారం సాంకేతిక నివేదిక, ఆంగ్లేతర పాఠాలను చేర్చడానికి డేటాసెట్ను విస్తరించడం మోడల్ను అనేక రకాల భాషలు మరియు సంస్కృతులకు బహిర్గతం చేస్తుంది.
PalM 2 మోడల్ కూడా సమాంతర బహుభాషా డేటాపై శిక్షణ పొందింది, మోడల్ ఒక భాష నుండి మరొక భాషకు అనువదించే సామర్థ్యాన్ని పొందడంలో సహాయపడుతుంది. డేటా జత టెక్స్ట్ను కలిగి ఉంటుంది, ఇక్కడ ఒక ఎంట్రీ ఆంగ్లంలో ఉంటుంది మరియు మరొకటి మరొక భాషలో సమానమైన వచనం.
పై పట్టిక PalM 2కి శిక్షణ ఇవ్వడానికి ఉపయోగించే బహుభాషా వెబ్ పత్రాల భాషా పంపిణీని చూపుతుంది.
PalM 2 ముఖ్య లక్షణాలు
ఇతర భాషా నమూనాలతో పోలిస్తే PalM 2 అత్యుత్తమంగా ఉన్న కొన్ని ప్రధాన ప్రాంతాలు ఇక్కడ ఉన్నాయి.
రీజనింగ్
PalM 2 యొక్క డేటాసెట్లో శాస్త్రీయ పత్రాలు మరియు గణిత వ్యక్తీకరణలతో కూడిన వెబ్ కంటెంట్ వంటి మూలాలు ఉన్నాయి. ఇది మోడల్కు గణితం, ఇంగితజ్ఞానం తార్కికం మరియు తర్కంలో మెరుగైన సామర్థ్యాలను అందిస్తుంది.
పరిశోధకులు మోడల్ యొక్క గణిత తార్కిక సామర్థ్యాలను గ్రేడ్ స్కూల్ మరియు హైస్కూల్ గణిత ప్రశ్నలపై పరీక్షించారు, ఇక్కడ ఇది GPT-4 యొక్క గణిత సామర్థ్యాలతో పోల్చదగిన ఫలితాలను చూపుతుంది.
కోడింగ్
PalM 2 యొక్క శిక్షణ డేటా వివిధ రకాల ప్రోగ్రామింగ్ భాషలలో కోడ్ను రూపొందించే సామర్థ్యాన్ని కూడా ఇస్తుంది. PALM 2 బృందం ఒక కోడ్-భారీ బహుభాషా డేటాసెట్పై శిక్షణ పొందిన PalM 2-S* అనే కోడింగ్-నిర్దిష్ట PalM 2 మోడల్ను సృష్టించింది.
మోడల్ కోడ్ ఉత్పత్తి చేయగల సామర్థ్యాన్ని కలిగి ఉండటమే కాకుండా, బహుళ భాషలను కలిగి ఉన్న పనులను కూడా నిర్వహించగలదు. ఉదాహరణకు, మీరు స్పానిష్లో లైన్-బై-లైన్ వ్యాఖ్యలను జోడించే పైథాన్ సార్టింగ్ ఫంక్షన్ని సృష్టించమని PalM 2ని అడగవచ్చు.
బహుభాషాత్వం
మోడల్ 100 కంటే ఎక్కువ భాషలను కలిగి ఉన్న డేటాసెట్లో శిక్షణ పొందినందున, పలు భాషల్లోని పాఠాన్ని అర్థం చేసుకోవడం, రూపొందించడం మరియు అనువదించడంలో PalM 2 నైపుణ్యాన్ని చూపుతుంది.
బహుభాషాత్వాన్ని పరీక్షించడానికి, పరిశోధకులు వివిధ భాషలలోని వివిధ భాషా ప్రావీణ్యత పరీక్షలలో నమూనాను పరీక్షించారు. PalM 2 PalMని అధిగమించడమే కాకుండా ప్రతి మూల్యాంకనం చేయబడిన భాషకు ఉత్తీర్ణత గ్రేడ్ను కూడా సాధించిందని ఫలితాలు చూపిస్తున్నాయి.
PalM 2 దాని బహుభాషా సామర్థ్యాలను వివిధ భాషలలోని ఇడియమ్లను అర్థం చేసుకోవడం, జోకులను వివరించడం, అక్షరదోషాలను పరిష్కరించడం మరియు అధికారిక వచనాన్ని సంభాషణ చాట్గా ఎలా మార్చాలో కూడా నేర్చుకోగలదు.
PalM 2 Google ఉత్పత్తులకు శక్తినిస్తుంది
ఇతర ఉత్పత్తులతో మోడల్ను ఏకీకృతం చేయడం ద్వారా Google ఇప్పటికే PalM 2 యొక్క పురోగతిని పొందుతోంది.
బార్డ్
బహుభాషా టాస్క్లను నిర్వహించగల మోడల్ సామర్థ్యం ఇప్పుడు Googleకి శక్తినిస్తోంది బార్డ్ ప్రయోగం ఇది 180 దేశాలు మరియు భూభాగాలకు విస్తరించింది.
బార్డ్ ఇప్పుడు పాల్ఎమ్ 2 యొక్క కోడింగ్ సామర్థ్యాలను ప్రోగ్రామింగ్ మరియు కోడ్ జనరేషన్ మరియు కోడ్ డీబగ్గింగ్ వంటి సాఫ్ట్వేర్ డెవలప్మెంట్ టాస్క్లలో సహాయం చేయడానికి ఉపయోగిస్తున్నారు.
Google Workspace కోసం డ్యూయెట్ AI
గూగుల్ తన గూగుల్ వర్క్స్పేస్ గ్రూప్ అప్లికేషన్లకు జెనరేటివ్ AI ఫీచర్లను జోడించాలని కూడా ప్లాన్ చేస్తోంది. Gmail మరియు డాక్స్ అనే ఫీచర్ని త్వరలో చేర్చనున్నారు డ్యూయెట్ AI ఇది వినియోగదారు వారి ప్రత్యుత్తరాలను మరియు ప్రాంప్ట్లను ఉపయోగించి వ్రాయడంలో సహాయం చేస్తుంది.
డ్యూయెట్ AI యూజర్లు అందించిన ప్రాంప్ట్ల ఆధారంగా టాస్క్లు మరియు ప్రాజెక్ట్ల కోసం Google షీట్లలో అనుకూల ప్లాన్లను రూపొందించడానికి వినియోగదారులను అనుమతిస్తుంది.
ముగింపు
Google వారి PalM 2 భాషా మోడల్తో AI భాషా సాధనాల మార్కెట్లోని అంతరాన్ని ఖచ్చితంగా మూసివేయాలని భావిస్తోంది. మోడల్ యొక్క sAPI ఇంకా పబ్లిక్గా అందుబాటులో లేనప్పటికీ, వారి పరిశోధన ఫలితాలు GPT-4 పనితీరుకు సరిపోలేంత పోటీని కలిగి ఉన్నాయని చూపుతున్నాయి.
Google యొక్క ప్రస్తుత వినియోగదారు బేస్తో, వారి శోధన ఇంజిన్ లేదా ఉత్పాదకత సాధనాల సూట్ వంటి వారి సేవలలో వారి AI విలీనం చేయబడితే వారు ఖచ్చితంగా భారీ అనుసరణ యొక్క ప్రయోజనాన్ని కలిగి ఉంటారు.
సమాధానం ఇవ్వూ