گوگل مسلسل AI تحقیق میں سب سے آگے رہا ہے، اپنے وسیع وسائل سے استفادہ کرتا ہے اور کافی تعداد میں اعلیٰ ہنر مند انجینئرز کو ملازمت دیتا ہے۔ تاہم، لینگویج ماڈلز کے حوالے سے گوگل کی کوششیں اس گیم میں دیر سے آئیں۔
ٹیک دیو مائیکروسافٹ کے ساتھ پہلے ہی OpenAI کے ساتھ ایک نتیجہ خیز شراکت سے فائدہ اٹھا رہا ہے، گوگل کے پاس پکڑنے کے سوا کوئی چارہ نہیں تھا۔
اس سال کی Google I/O کانفرنس میں، کمپنی نے پیدا ہونے والی AI ہتھیاروں کی دوڑ کے بارے میں اپنے جواب کا اعلان کیا: PaLM 2۔ کیا یہ نیا ماڈل OpenAI کے GPT-4 کے ساتھ کارکردگی میں اضافہ کرے گا؟
PaLM 2 کیا ہے؟
گوگل بیان کرتا ہے۔ PaLM 2 ایک جدید ترین زبان کے ماڈل کے طور پر جو 2022 میں پہلے اعلان کردہ اپنے موجودہ PaLM ماڈل میں بہتری لاتا ہے۔ بشمول سوالات کا جواب دینا، متن کا ترجمہ کرنا، پیدا کرنے والا کوڈ، اور بہت کچھ.
ٹیسٹ سے پتہ چلتا ہے کہ PaLM 2 پہلے ہی نمایاں بہتری دکھاتا ہے، بہت کم تعداد میں پیرامیٹرز استعمال کرتے ہوئے PaLM ماڈل سے بہتر کارکردگی کا مظاہرہ کرتا ہے۔
PaLM 2 ماڈلز کا خاندان ہے۔
زبان کے دیگر ماڈلز کی طرح، PaLM 2 پروجیکٹ دراصل ماڈلز کا ایک خاندان ہے جس کا سائز ہے۔ گوگل چار سائزوں میں PaLM 2 ماڈل فراہم کرے گا: Gecko، Otter، Bison، اور Unicorn۔
سائز میں مختلف قسم کے استعمال کے مختلف معاملات میں PaLM 2 کو تعینات کرنا آسان بناتا ہے۔ مثال کے طور پر، گیکو ماڈل اتنا ہلکا ہے کہ پورا ماڈل موبائل ڈیوائس میں فٹ ہو سکتا ہے اور آف لائن بھی چل سکتا ہے۔
PaLM 2 کا ٹریننگ ڈیٹا سیٹ
ایک کامیاب زبان کے ماڈل کے سب سے اہم پہلوؤں میں سے ایک ہے۔ تربیتی ڈیٹاسیٹ. ٹریننگ ڈیٹا سیٹ کافی متنوع ہونا چاہیے تاکہ ماڈل کو اس موضوع کی گہری سمجھ حاصل ہو سکے جس کے لیے اسے ڈیزائن کیا گیا ہے۔
بڑے لینگوئج ماڈلز (LLMs) کے لیے، عام طور پر کوئی خاص موضوع نہیں ہے جس پر ماڈل کو تربیت دینی چاہیے۔ LLMs اس کے بجائے عام مقصد کے ماڈل بننے کے لیے بنائے گئے ہیں جو کہ بہت سے کاموں کو انجام دینے کے لیے موزوں ہونا چاہیے۔ یہ ماڈل بڑے متنی ڈیٹا سیٹس کا استعمال کرتے ہیں جو ویب کے ایک بڑے حصے کے ساتھ ساتھ شائع شدہ حوالہ جاتی مواد، ادب، اور یہاں تک کہ سورس کوڈ کو بھی حاصل کرتے ہیں۔
PaLM 2 کے تربیتی ڈیٹاسیٹ اور دیگر ماڈلز کے درمیان بنیادی فرق غیر انگریزی ڈیٹا کے زیادہ فیصد کو شامل کرنا ہے۔ ان کے مطابق تکنیکی رپورٹغیر انگریزی متن کو شامل کرنے کے لیے ڈیٹاسیٹ کو پھیلانا اس ماڈل کو زبانوں اور ثقافتوں کی وسیع اقسام کے سامنے لاتا ہے۔
PaLM 2 ماڈل کو متوازی کثیر لسانی ڈیٹا پر بھی تربیت دی گئی تاکہ ماڈل کو ایک زبان سے دوسری زبان میں ترجمہ کرنے کی صلاحیت حاصل کرنے میں مدد ملے۔ ڈیٹا میں متن کے جوڑے شامل ہیں جہاں ایک اندراج انگریزی میں ہے اور دوسرا دوسری زبان میں مساوی متن ہے۔
مندرجہ بالا جدول PaLM 2 کو تربیت دینے کے لیے استعمال ہونے والی کثیر لسانی ویب دستاویزات کی زبان کی تقسیم کو ظاہر کرتا ہے۔
PaLM 2 کلیدی خصوصیات
یہاں کچھ اہم شعبے ہیں جن میں PaLM 2 دوسرے زبان کے ماڈلز کے مقابلے میں بہتر ہے۔
استدلال۔
PaLM 2 کے ڈیٹاسیٹ میں سائنسی کاغذات اور ریاضی کے تاثرات کے ساتھ ویب مواد جیسے ذرائع شامل ہیں۔ اس سے ماڈل کو ریاضی، عقلی استدلال اور منطق میں بہتر صلاحیتیں ملتی ہیں۔
محققین نے گریڈ اسکول اور ہائی اسکول کے ریاضی کے سوالات پر ماڈل کی ریاضیاتی استدلال کی صلاحیتوں کا تجربہ کیا جہاں یہ GPT-4 کی ریاضی کی صلاحیتوں کے مقابلے کے نتائج دکھاتا ہے۔
کوڈنگ
PaLM 2 کا تربیتی ڈیٹا اسے مختلف پروگرامنگ زبانوں میں کوڈ بنانے کی صلاحیت بھی دیتا ہے۔ PALM 2 ٹیم نے کوڈنگ کے لیے مخصوص PaLM 2 ماڈل بنایا جسے PaLM 2-S* کہا جاتا ہے جسے ایک کوڈ ہیوی کثیر لسانی ڈیٹاسیٹ پر تربیت دی گئی تھی۔
ماڈل نہ صرف کوڈ جنریشن کے قابل ہے بلکہ یہ ان کاموں کو بھی سنبھالنے کے قابل ہے جن میں متعدد زبانیں شامل ہیں۔ مثال کے طور پر، آپ PaLM 2 سے Python چھانٹنے کا فنکشن بنانے کے لیے کہہ سکتے ہیں جو ہسپانوی میں لائن بہ لائن تبصرے شامل کرتا ہے۔
کثیر لسانی
چونکہ ماڈل کو ایک ڈیٹا سیٹ پر تربیت دی گئی تھی جس میں 100 سے زیادہ زبانیں شامل ہیں، PaLM 2 متعدد زبانوں میں متن کو سمجھنے، تخلیق کرنے اور ترجمہ کرنے میں مہارت دکھاتا ہے۔
کثیر لسانی کو جانچنے کے لیے، محققین نے مختلف زبانوں میں مختلف زبانوں کی مہارت کے ٹیسٹ پر ماڈل کا تجربہ کیا۔ نتائج سے پتہ چلتا ہے کہ نہ صرف PaLM 2 نے PaLM کو پیچھے چھوڑ دیا ہے بلکہ ہر جانچی ہوئی زبان کے لیے پاسنگ گریڈ بھی حاصل کیا ہے۔
PaLM 2 اپنی کثیر لسانی صلاحیتوں کو مختلف زبانوں میں محاورے کو سمجھنے، لطیفوں کی وضاحت کرنے، ٹائپنگ کی غلطیوں کو ٹھیک کرنے کی صلاحیت سے بھی ظاہر کرتا ہے، اور یہاں تک کہ رسمی متن کو بول چال میں تبدیل کرنے کا طریقہ بھی سیکھ سکتا ہے۔
PaLM 2 گوگل پروڈکٹس کو طاقت دیتا ہے۔
گوگل پہلے ہی ماڈل کو دیگر پروڈکٹس کے ساتھ مربوط کرکے PaLM 2 کی ترقی سے فائدہ اٹھا رہا ہے۔
بارڈ
کثیر لسانی کاموں کو سنبھالنے کی ماڈل کی صلاحیت اب گوگل کو طاقت دے رہی ہے۔ بارڈ تجربہ جیسا کہ یہ 180 سے زیادہ ممالک اور خطوں تک پھیلا ہوا ہے۔
بارڈ اب پروگرامنگ اور سافٹ ویئر ڈویلپمنٹ کے کاموں جیسے کوڈ جنریشن اور کوڈ ڈیبگنگ میں مدد کے لیے PaLM 2 کی کوڈنگ صلاحیتوں کو بھی استعمال کر رہا ہے۔
Duet AI برائے Google Workspace
گوگل اپنے گوگل ورک اسپیس گروپ آف ایپلی کیشنز میں تخلیقی AI خصوصیات شامل کرنے کا بھی منصوبہ بنا رہا ہے۔ Gmail اور Docs میں جلد ہی ایک فیچر شامل کیا جائے گا جسے کہا جاتا ہے۔ ڈوئٹ AI جو صارف کو اپنے جوابات کا مسودہ تیار کرنے اور اشارے کے استعمال سے لکھنے میں مدد کرے گا۔
Duet AI صارفین کو گوگل شیٹس میں صارف کی طرف سے دیے گئے اشارے کی بنیاد پر کاموں اور پروجیکٹس کے لیے اپنی مرضی کے منصوبے بنانے کی بھی اجازت دے گا۔
نتیجہ
گوگل یقینی طور پر اپنے PaLM 2 لینگویج ماڈل کے ساتھ AI لینگویج ٹولز کی مارکیٹ میں موجود خلا کو ختم کرنے کی امید کر رہا ہے۔ اگرچہ ماڈل کا sAPI ابھی تک عوامی طور پر دستیاب نہیں ہے، لیکن ان کی تحقیق کے نتائج سے پتہ چلتا ہے کہ ماڈل GPT-4 کی کارکردگی سے مماثل ہے۔
گوگل کے موجودہ صارف کی بنیاد کے ساتھ، انہیں یقینی طور پر بڑے پیمانے پر موافقت کا فائدہ ہوگا اگر ان کا AI ان کی خدمات جیسے کہ ان کے سرچ انجن یا ان کے پیداواری ٹولز کے سوٹ میں ضم ہوجاتا ہے۔
جواب دیجئے