ہم ہر ہفتے جدید ٹیکنالوجی کے بارے میں اعلانات کے ساتھ، دلچسپ اوقات میں رہتے ہیں۔ OpenAI نے ابھی ابھی جدید ٹیکسٹ ٹو امیج ماڈل DALLE 2 جاری کیا ہے۔
صرف چند لوگوں نے ایک نئے AI سسٹم تک ابتدائی رسائی حاصل کی ہے جو قدرتی زبان کی وضاحت سے حقیقت پسندانہ گرافکس تیار کر سکتا ہے۔ یہ اب بھی عوام کے لیے بند ہے۔
استحکام AI پھر جاری کیا مستحکم بازی ماڈل، DALLE2 کا ایک اوپن سورس ویرینٹ۔ اس لانچ نے سب کچھ بدل کر رکھ دیا ہے۔ پورے انٹرنیٹ پر لوگ فوری نتائج شائع کر رہے تھے اور حقیقت پسندانہ فن سے حیران ہو رہے تھے۔
مستحکم بازی کیا ہے؟
مستحکم بازی ایک مشین لرننگ ماڈل ہے جو متن سے تصاویر بنانے، متن کے لحاظ سے تصاویر کو تبدیل کرنے، اور کم ریزولوشن یا کم تفصیل والی تصاویر پر تفصیلات بھرنے کے قابل ہے۔
اسے اربوں تصاویر پر تربیت دی گئی تھی اور اس کے مساوی نتائج فراہم کر سکتے ہیں۔ DALL-E2 اور درمیانی سفر. استحکام AI نے اسے ایجاد کیا، اور اسے 22 اگست 2022 کو عام کیا گیا۔
لیکن محدود مقامی کمپیوٹیشنل وسائل کے ساتھ، مستحکم ڈفیوژن ماڈل کو اعلیٰ معیار کی تصاویر بنانے میں کافی وقت لگتا ہے۔ کلاؤڈ فراہم کنندہ کا استعمال کرتے ہوئے ماڈل کو آن لائن چلانا ہمیں تقریباً لامحدود کمپیوٹیشنل وسائل فراہم کرتا ہے اور ہمیں بہت تیزی سے بہترین نتائج حاصل کرنے کی اجازت دیتا ہے۔
مائیکرو سروس کے طور پر ماڈل کی میزبانی دیگر تخلیقی ایپس کو ML ماڈلز کو آن لائن چلانے کی پیچیدگیوں سے نمٹنے کے بغیر ماڈل کی صلاحیت کا زیادہ آسانی سے فائدہ اٹھانے کی اجازت دیتی ہے۔
اس پوسٹ میں، ہم یہ ظاہر کرنے کی کوشش کریں گے کہ کس طرح ایک مستحکم ڈفیوژن ماڈل تیار کیا جائے اور اسے AWS میں تعینات کیا جائے۔
مستحکم بازی کی تعمیر اور تعیناتی۔
بینٹو ایم ایل اور Amazon Web Services EC2 Stable Diffusion ماڈل کی آن لائن میزبانی کے لیے دو اختیارات ہیں۔ BentoML اسکیلنگ کے لیے ایک اوپن سورس فریم ورک ہے۔ مشین لرننگ خدمات BentoML کے ساتھ، ہم ایک قابل اعتماد ڈسپریشن سروس بنائیں گے اور اسے AWS EC2 پر تعینات کریں گے۔
ماحول کی تیاری اور مستحکم بازی ماڈل ڈاؤن لوڈ کریں۔
ضروریات کو انسٹال کریں اور ریپوزٹری کو کلون کریں۔
آپ Stable Diffusion ماڈل کو منتخب اور ڈاؤن لوڈ کر سکتے ہیں۔ واحد درستگی 10GB VRAM سے زیادہ والے CPUs یا GPUs کے لیے موزوں ہے۔ نصف درستگی 10GB VRAM سے کم والے GPUs کے لیے مثالی ہے۔
مستحکم بازی کی تعمیر
ہم ایک کے پیچھے ماڈل کی خدمت کے لیے ایک BentoML سروس بنائیں گے۔ RESTful API. درج ذیل مثال پیشین گوئی کے لیے واحد درستگی کا ماڈل اور سروس کو کاروباری منطق سے مربوط کرنے کے لیے service.py ماڈیول کا استعمال کرتی ہے۔ ہم APIs کے طور پر افعال کو @svc.api کے ساتھ ٹیگ کرکے ان کو بے نقاب کرسکتے ہیں۔
مزید برآں، ہم پیرامیٹرز میں APIs کے ان پٹ اور آؤٹ پٹ کی اقسام کی وضاحت کر سکتے ہیں۔ txt2img اینڈ پوائنٹ، مثال کے طور پر، JSON ان پٹ حاصل کرتا ہے اور ایک امیج آؤٹ پٹ تیار کرتا ہے، جب کہ img2img اینڈ پوائنٹ ایک امیج اور JSON ان پٹ کو قبول کرتا ہے اور امیج آؤٹ پٹ واپس کرتا ہے۔
ایک StableDiffusionRunnable ضروری انفرنس منطق کی وضاحت کرتا ہے۔ رن ایبل ماڈل کے txt2img پائپ طریقوں کو چلانے اور متعلقہ ان پٹ بھیجنے کا انچارج ہے۔ APIs میں ماڈل انفرنس منطق کو چلانے کے لیے، StableDiffusionRunnable سے ایک کسٹم رنر بنایا گیا ہے۔
پھر، جانچ کے لیے BentoML سروس شروع کرنے کے لیے درج ذیل کمانڈ کا استعمال کریں۔ مقامی طور پر چل رہا ہے۔ مستحکم بازی ماڈل CPUs پر اندازہ کافی سست ہے۔ ہر درخواست پر کارروائی میں تقریباً 5 منٹ لگیں گے۔
تصویر سے متن
ٹیکسٹ ٹو امیج آؤٹ پٹ
bentofile.yaml فائل مطلوبہ فائلوں اور انحصار کی وضاحت کرتی ہے۔
بینٹو بنانے کے لیے نیچے دی گئی کمانڈ کا استعمال کریں۔ بینٹو بینٹو ایم ایل سروس کے لیے تقسیم کا فارمیٹ ہے۔ یہ ایک خود ساختہ آرکائیو ہے جس میں سروس شروع کرنے کے لیے درکار تمام ڈیٹا اور کنفیگریشنز شامل ہیں۔
مستحکم بازی بینٹو مکمل ہو چکا ہے۔ اگر آپ بینٹو کو صحیح طریقے سے تیار کرنے سے قاصر تھے، تو گھبرائیں نہیں۔ آپ اگلے حصے میں درج کمانڈز کا استعمال کرتے ہوئے پہلے سے بنایا ہوا ماڈل ڈاؤن لوڈ کر سکتے ہیں۔
پری بلڈ ماڈلز
مندرجہ ذیل پری بلڈ ماڈلز ہیں:
EC2 پر مستحکم ڈفیوژن ماڈل تعینات کریں۔
بینٹو کو EC2 پر تعینات کرنے کے لیے، ہم بینٹوکٹل استعمال کریں گے۔ bentoctl آپ کو اپنے بینٹو کو کسی بھی جگہ تعینات کرنے دے سکتا ہے۔ بادل پلیٹ فارم Terraform کا استعمال کرتے ہوئے. Terraform فائلیں بنانے اور لاگو کرنے کے لیے، AWS EC2 آپریٹر انسٹال کریں۔
تعیناتی config.yaml فائل میں، تعیناتی پہلے ہی ترتیب دی گئی ہے۔ براہ کرم بلا جھجھک اپنی ضروریات میں ترمیم کریں۔ بینٹو کو بطور ڈیفالٹ g4dn.xlarge میزبان پر تعینات کیا جاتا ہے۔ گہری سیکھنا AMI GPU PyTorch 1.12.0 (Ubuntu 20.04) AMI US-west-1 ریجن پر۔
ابھی Terraform فائلیں بنائیں۔ ڈوکر امیج بنائیں اور اسے AWS ECR پر اپ لوڈ کریں۔ آپ کی بینڈوتھ پر منحصر ہے، تصویر اپ لوڈ کرنے میں کافی وقت لگ سکتا ہے۔ بینٹو کو AWS EC2 پر تعینات کرنے پر، Terraform فائلوں کا استعمال کریں۔
Swagger UI تک رسائی حاصل کرنے کے لیے، EC2 کنسول سے جڑیں اور براؤزر میں عوامی IP ایڈریس کھولیں۔ آخر میں، اگر Stable Diffusion BentoML سروس کی مزید ضرورت نہیں ہے، تو تعیناتی کو ہٹا دیں۔
نتیجہ
آپ کو یہ دیکھنے کے قابل ہونا چاہئے کہ SD اور اس کے ساتھی ماڈل کتنے دلکش اور طاقتور ہیں۔ وقت بتائے گا کہ آیا ہم اس تصور پر مزید اعادہ کریں گے یا مزید نفیس طریقوں کی طرف بڑھیں گے۔
تاہم، اس وقت ماحول اور ہدایات کو بہتر طور پر سمجھنے کے لیے ایڈجسٹمنٹ کے ساتھ بڑے ماڈلز کو تربیت دینے کے لیے اقدامات جاری ہیں۔ ہم نے BentoML کا استعمال کرتے ہوئے Stable Diffusion سروس کو تیار کرنے کی کوشش کی اور اسے AWS EC2 پر تعینات کیا۔
ہم زیادہ طاقتور ہارڈ ویئر پر اسٹیبل ڈفیوژن ماڈل چلانے، کم تاخیر کے ساتھ تصویریں بنانے، اور AWS EC2 پر سروس کی تعیناتی کے ذریعے ایک کمپیوٹر سے آگے بڑھنے کے قابل تھے۔
جواب دیجئے