کی میز کے مندرجات[چھپائیں][دکھائیں]
۔ 23 واں گوگل I/O کافی سنسنی خیز تھا! مصنوعی ذہانت کے شعبے میں انہوں نے کئی اہم پیشرفتیں پیش کیں۔
OpenAI کے GPT-4 اور Google کے Gemini کے درمیان مقابلہ سب سے اہم انکشافات میں سے ایک تھا۔ ان کے موجود ہونے کے بعد PaLM 2 نظام، جیمنی اگلی نسل کا بڑی زبان کا ماڈل (LLM) ہے۔
مشین لرننگ ماڈل کو گوگل نے مزید بہتر بنا کر اسے مزید بہتر بنایا ہے۔ مائیکروسافٹ کی بنگ کی بہتری کے ساتھ مقابلہ کرنے کے لیے، وہ اینڈرائیڈ میں تخلیقی AI صلاحیتیں بھی شامل کر رہے ہیں اور AI کے ساتھ Google تلاش کو بڑھا رہے ہیں۔
گوگل بارڈ کو دوسرے کے ساتھ زیادہ مسابقتی بنانے کے لیے چیٹ بوٹس جیسے ChatGPT، انہوں نے تقریب کے دوران اس میں نمایاں بہتری کا اعلان کیا۔ بارڈ آخر کار کورین اور جاپانی سمیت 40 مزید زبانوں کی حمایت کرے گا۔ اس توسیع کے ساتھ، Bard کہیں بھی devs کو سپورٹ کر سکے گا۔
مزید برآں، صارف کی درخواستوں پر اپنے جوابات کو بہتر بنانے کے لیے، بارڈ اب تصاویر، نقشے اور دیگر گرافکس پیش کرے گا۔ وہاں موجود تمام ڈویلپرز کے لیے، یہ بہت مددگار ثابت ہوگا۔ یہاں، ہم LLM Gemini کی تفصیلات کا جائزہ لیں گے۔
جیمنی کیا ہے؟
کے مطابق گوگل, Gemini کا مقصد زمین سے ملٹی موڈل، کنیکٹنگ ٹولز اور APIs کے لحاظ سے بہت موثر، اور میموری اور منصوبہ بندی جیسی مستقبل کی ترقی کے لیے تیار تھا۔ گوگل نے اپنے بلاگ پوسٹ میں کہا کہ جیمنی کے پاس پہلے سے ہی شاندار ملٹی موڈل صلاحیتیں ہیں جو پہلے ماڈلز میں نہیں تھیں۔
گوگل نے کہا، "ایک بار جب ہم جیمنی کی حفاظت کے لیے اچھی طرح سے جانچ کر لیں گے، تو ہم اسے PaLM 2 کی طرح مختلف سائز اور صلاحیتوں میں پیش کریں گے۔"
نتیجتاً، اس کو متعدد پروڈکٹس، ایپس اور آلات پر لاگو کیا جا سکتا ہے تاکہ ہر کسی کو فائدہ پہنچے۔"
انہوں نے کانفرنس میں PaLM 2 پیش کیا، ایک جدید زبان کا ماڈل جس میں کثیر لسانی، استدلال، اور کوڈنگ کی صلاحیتوں کو بڑھایا گیا ہے۔ اسے 100 سے زیادہ زبانوں کے کثیر لسانی مواد کے ساتھ بڑے پیمانے پر تربیت دی گئی۔
PaLM 2 مختلف زبانوں میں لطیف مواد جیسے محاورات، شاعری، اور پہیلیوں کو تیار اور ترجمہ کر سکتا ہے۔
جیمنی ممکنہ طور پر گوگل کی AI کوششوں کو فروغ دے گا اور سرخیل، OpenAI کے ChatGPT کو چیلنج کرے گا۔ اگرچہ ChatGPT زیادہ تر ٹیکسٹ پر مبنی بات چیت کے لیے استعمال ہوتا ہے، جیمنی ملٹی موڈل ہے، یعنی یہ متن اور بصری دونوں کا جواب دے سکتی ہے۔ گوگل سرچ کے ساتھ مربوط ہونے کے بعد، اس میں صارفین کے مقبول سرچ انجن کے ساتھ تعامل کے طریقے کو تبدیل کرنے کی صلاحیت ہے۔
اگرچہ Gemini کے بارے میں مزید تفصیلات ابھی تک دستیاب نہیں ہیں، لیکن یہ ChatGPT اور Bing AI کو پیچھے چھوڑ سکتا ہے، جو گوگل کو AI فیلڈ کے سربراہ تک پہنچا سکتا ہے۔
گوگل کے سی ای او سندر پچائی نے کانفرنس کے دوران ریمارکس دیے، "ایک AI-پہلی کمپنی ہونے کے سات سال بعد، ہم خود کو ایک دلچسپ موڑ پر پا رہے ہیں۔"
پچائی کے مطابق، جیمنی اب تربیت سے گزر رہی ہے، اور اسے انتہائی موثر ہونے اور مستقبل کی ترقی جیسے میموری اور منصوبہ بندی کے دروازے کھولنے کے مقصد کے ساتھ ملٹی موڈل اپروچ کے ساتھ بنایا جا رہا ہے۔ جیمنی پہلے سے ہی شاندار ملٹی موڈل صلاحیتوں کو ظاہر کر رہا ہے جو پہلے کے ورژن سے غائب تھیں، پچائی کے مطابق، چاہے یہ ابھی بھی اپنے ابتدائی مراحل میں ہے۔
گوگل اپنے TPU (چپس) کے ذریعے جیمنی کو ہدایت دیتا ہے۔ پچائی نے کہا کہ جیمنی کو بہتر بنانے اور حفاظتی معائنہ سے گزرنے کے بعد، یہ مختلف سائز اور صلاحیتوں میں قابل رسائی ہو گا، حالانکہ کسی مخصوص ریلیز کی تاریخ کا ذکر نہیں کیا گیا تھا۔
پچائی نے واضح کیا کہ گوگل کے تمام اے آئی ماڈلز میں واٹر مارکنگ اور میٹا ڈیٹا کو آؤٹ پٹ میں شامل کیا جائے گا، جیسے کہ تصویریں، غلط معلومات کے پھیلاؤ کو روکنے کے لیے۔
کیا چیز جیمنی کو برتر بناتی ہے۔ چیٹ جی پی ٹی اور BingAI؟
جیمنی میں کئی دلچسپ "ملٹی موڈل" خصوصیات ہیں۔ جیمنی، ChatGPT کے برعکس، جو صرف متن کو پڑھ اور تیار کر سکتا ہے، ایک ملٹی موڈل پیراڈائم پر مبنی ہے اور متن، کوڈ اور تصویروں کو سمجھ اور تیار کر سکتا ہے۔
اس وسیع قسم کی مہارتوں سے متعدد مواقع ممکن ہوتے ہیں۔ جیمنی، مثال کے طور پر، AI چیٹ بوٹس کی ایک نئی کلاس بنانے کے لیے استعمال کیا جا سکتا ہے جو متن اور بصری دونوں کو سمجھ سکتا ہے اور ان پر رد عمل ظاہر کر سکتا ہے۔
تاہم، ChatGPT اور Bing دونوں صرف متن پر مبنی مواصلت فراہم کرتے ہیں، Bing تصاویر بنانے کے لیے ایک علیحدہ لنک فراہم کرتا ہے لیکن چیٹ میں تصویر کی حمایت کا فقدان ہے۔
Gemini ChatGPT کے برعکس مصنوعات اور ایپلیکیشنز کی وسیع اقسام کو سنبھال سکتا ہے۔ اسے استعمال کیا جا سکتا ہے، مثال کے طور پر، گوگل سرچ کو اپ گریڈ کرنے یا ایک جدید ترین ورچوئل اسسٹنٹ بنانے کے لیے جو AI استعمال کرتا ہے۔ BingAI اور ChatGPT میں ان خصوصیات کی کمی ہے۔ تاہم، ChatGPT پلگ ان فراہم کرتا ہے جو نتائج کو بڑھاتا ہے۔
جیمنی میں میموری اور منصوبہ بندی جیسی خصوصیات بھی ہیں، جو AI سے چلنے والی ایپس کو تیار کرنے کی اجازت دیتی ہیں جو ChatGPT کی صلاحیت سے کہیں زیادہ ہیں۔
پرجوش امکانات اس وقت پیدا ہوتے ہیں جب آپ جیمنی سے چلنے والے پرسنل اسسٹنٹ رکھنے پر غور کرتے ہیں جو آپ کی ترجیحات پر نظر رکھتا ہے اور روزانہ کی منصوبہ بندی میں مدد کرتا ہے۔ جیمنی کی مکمل صلاحیت کو دیکھنے اور اس کے کھلنے والے مواقع کی چھان بین کرنے کے لیے، تاہم، ہمیں پہلے اس کی عوامی ریلیز کا بے صبری سے انتظار کرنا چاہیے۔
نتیجہ
جیمنی، گوگل کے اگلی نسل کے لینگویج ماڈل نے شاندار ملٹی موڈل فیچرز دکھائے ہیں، جو اسے صرف ٹیکسٹ کے حریف چیٹ جی پی ٹی سے زیادہ قابل موافق بناتا ہے۔
جیمنی چیٹ بوٹس اور AI ایپس کو متن، کوڈ اور گرافکس پڑھنے اور تیار کرنے کے قابل بنا کر ان کے لیے نئے مواقع پیدا کرتی ہے۔ یہ ایپلیکیشنز اب سرگرمیوں کی ایک بڑی رینج کا انتظام کر سکتی ہیں۔ جیمنی کے برخلاف، جو تصاویر اور ملٹی موڈل تعاملات دونوں کو سپورٹ کرتا ہے، ChatGPT اور BingAI صرف متن پر مبنی تعاملات کے قابل ہیں۔
اگرچہ Gemini کے حوالے سے مزید مخصوص معلومات کو ابھی تک عام نہیں کیا گیا ہے، لیکن یہ واضح ہے کہ Google AI ٹیکنالوجی کو آگے بڑھانے اور اس شعبے میں اپنی برتری کو برقرار رکھنے کے لیے پرعزم ہے۔
ہم جیمنی کی مکمل صلاحیت اور اس کے کھلنے والے تخلیقی امکانات کو دیکھنے کی توقع رکھتے ہیں جب ہم اس کے رسمی آغاز کا پرجوش طریقے سے انتظار کر رہے ہیں۔
جواب دیجئے