کی میز کے مندرجات[چھپائیں][دکھائیں]
بڑے ٹیکسٹ ٹو امیج ماڈلز نے دیے گئے ٹیکسٹ پرامپٹ سے اعلیٰ معیار اور متنوع تصویری ترکیب تیار کرکے AI کی ترقی میں نمایاں پیش رفت کی۔
یہ ماڈل مختلف سیٹنگز میں مضامین کی انوکھی نمائندگی کی ترکیب کرنے یا دیئے گئے حوالہ سیٹ میں مضامین کی ظاہری شکل کو نقل کرنے سے قاصر ہیں۔
OpenAI کی DALL.E2 یا StabilityAI جیسی نئی جاری کردہ ٹیکنالوجیز مستحکم بازی اور Midjourney پہلے ہی طوفان کے ذریعے انٹرنیٹ لے رہے ہیں۔ اب نتائج کو اپنی مرضی کے مطابق کرنے کا وقت آگیا ہے۔ پھر بھی کیسے؟
گوگل ڈریم بوتھ اے آئی آ گیا ہے۔
ڈریم بوتھ تصویر کے موضوع کو پہچاننے، اسے اس کے اصل سیاق و سباق سے ڈی کنسٹریکٹ کرنے، اور پھر اسے ایک نئے مطلوبہ سیاق و سباق میں درست طریقے سے ترکیب کرنے کی صلاحیت رکھتا ہے۔ مزید برآں، یہ موجودہ AI پکچر جنریٹرز کے ساتھ استعمال کیا جا سکتا ہے۔
اس مضمون میں، ہم ڈریم بوتھ، اس کے استعمال، اس کے ٹیوٹوریل، اس کی حدود، اور بہت کچھ پر گہری نظر ڈالیں گے۔
ڈریم بوتھ کیا ہے؟
ڈریم بوتھگوگل کی طرف سے ایک بالکل نیا ٹیکسٹ ٹو امیج ڈفیوژن ماڈل پیش کیا گیا۔ مختلف سیٹنگز میں صارف کے منتخب کردہ مضمون کی تصاویر کی ایک وسیع رینج تیار کرنے کے لیے گوگل ڈریم بوتھ AI کی رہنمائی کے طور پر ایک تحریری پرامپٹ استعمال کیا جا سکتا ہے۔
بوسٹن یونیورسٹی اور گوگل کے ایک تحقیقی گروپ نے ڈریم بوتھ تیار کیا، جو کہ متن سے تصویری ماڈلز کو تبدیل کرنے کے لیے ایک جدید تکنیک ہے جس کی وسیع پیمانے پر پری ٹریننگ ہوئی ہے۔
مجموعی تصور بہت سیدھا ہے: وہ زبان کے نقطہ نظر کی لغت کو اس طرح بڑھانا چاہتے ہیں کہ غیر معمولی ٹوکن آئی ڈیز حسب ضرورت عنوانات سے منسلک ہوں جن کی صارف تعریف کر سکتے ہیں۔
ماڈل کا بنیادی مقصد صارفین کو جوڑنا ہے۔ متن سے تصویر کے پھیلاؤ کا ماڈل انہیں وہ وسائل دے کر جن کی انہیں اپنے منتخب موضوع کی مثالوں کی تصویری حقیقت پسندانہ نمائندگی کرنے کی ضرورت ہے۔
نتیجے کے طور پر، یہ تکنیک مختلف حالات میں چیلنجوں کا خلاصہ کرنے کے لیے اچھی طرح سے کام کرتی نظر آتی ہے۔
گوگل کا ڈریم بوتھ پچھلے ٹیکسٹ ٹو امیج ٹولز سے مختلف ہے، جیسے DALL-E2, مستحکم بازی، اور درمیانی سفر، اس میں یہ صارفین کو متن پر مبنی ان پٹس کا استعمال کرتے ہوئے بازی ماڈل میں ہیرا پھیری کرنے سے پہلے موضوع کی تصویر پر زیادہ کنٹرول فراہم کرتا ہے۔
خصوصیات
- DreamBooth AI 3-5 امیجز کے ساتھ ٹیکسٹ ٹو امیج ماڈل کو بہتر بنا سکتا ہے۔
- ڈریم بوتھ اے آئی کے ساتھ اصلی فوٹو ریئلسٹک تصاویر بنائی جا سکتی ہیں۔
- اس کے علاوہ ڈریم بوتھ اے آئی متعدد زاویوں سے کسی موضوع کی تصاویر بنا سکتا ہے۔
درخواست
فن پارے
یہ کام خاص طور پر انداز کی منتقلی سے مختلف ہے، جو اصل منظر میں کسی اور تصویر کے انداز کو شامل کرتے ہوئے ماخذ منظر کے سیمنٹکس کو برقرار رکھتا ہے۔
تخلیقی نقطہ نظر کی بنیاد پر، AI شناخت اور موضوع کی مثال کی تفصیلات کو برقرار رکھتے ہوئے منظر میں اہم تبدیلیاں کر سکتا ہے۔
پراپرٹی میں ترمیم
ڈریم بوتھ AI کے ذریعے موضوع کی مثال کی خصوصیات میں ترمیم کی جا سکتی ہے۔
رسائی حاصل کرنا
جنریشن ماڈل سے پہلے کی مضبوط ساخت وہی ہے جو ڈریم بوتھ AI کی اشیاء کو سجانے کی صلاحیت کو بہت دلچسپ بناتی ہے۔
ری سیاق و سباق
DreamBooth AI کسی خاص مضمون کے لیے مخصوص تصویریں تیار کر سکتا ہے ایک تربیت یافتہ ماڈل کو ایک جملہ دے کر جس میں منفرد شناخت کنندہ اور کلاس اسم شامل ہو۔
یہ ماحول کو تبدیل کرنے کے بجائے منفرد، پہلے غیر سننے والے کرنسیوں، بیانات، اور منظر کی ساخت میں موضوع پیدا کر سکتا ہے۔ حقیقت پسندانہ عکاسی اور سائے، نیز موضوع اور آس پاس کی اشیاء کے درمیان تعامل۔
ڈریم بوتھ ٹیوٹوریل
اس ٹیوٹوریل میں، ہم اس کی پیروی کریں گے۔ گوگل کولیب نوٹ بک، اور میں آپ کو اس میں سے گزروں گا، جو آپ کو خود سمجھے گا اور اسے استعمال کرے گا۔
GPU ترتیب دینا اور لائبریریاں انسٹال کرنا
یہ معلوم کرنا کہ GPU اور VRAM کی کون سی قسمیں دستیاب ہیں پہلا قدم ہے۔ کچھ ضروریات اور انحصار کو انسٹال کرنا بھی ضروری ہے۔ بس پلے بٹن دبائیں، پھر اس کے ختم ہونے کا انتظار کریں۔
Huggingface پر ایک اکاؤنٹ بنائیں اور ایک ٹوکن بنائیں
اگلا مرحلہ Huggingface اکاؤنٹ کے لیے رجسٹر کرنا ہے۔ جب آپ ختم کر لیں، اوپر دائیں کونے میں ترتیبات پر کلک کریں۔ آپ اگلے صفحے پر پہنچ جائیں گے۔
یہاں سے درخواست کے مطابق ٹوکن اور نام بنائیں۔ ٹوکن کو کاپی کر کے نیچے دیے گئے سیل میں گوگل کولیب میں چسپاں کیا جانا چاہیے۔
xformers انسٹال کریں۔
اس مرحلے میں، آپ رن ٹائم پر کلک کرکے xformers کو انسٹال کرنے کے لیے صرف پلے بٹن دبا سکتے ہیں۔
Drive سے جڑیں۔
اب، آپ کو گوگل ڈرائیو سے جڑنے کے لیے صرف اس سیل کو چلانا ہوگا۔
پرامپٹ درج کریں۔
مندرجہ ذیل سیل میں، آپ کو صرف پرامپٹ درج کرنا ہوگا۔
تصاویر اپ لوڈ کرنا
اس مرحلے میں، آپ کو صرف وہ تصاویر اپ لوڈ کرنی ہوں گی جنہیں آپ تربیت دینا چاہتے تھے۔
ٹرین AI ماڈل
یہ سب سے اہم مرحلہ ہے، کیونکہ آپ اپنی جمع کرائی گئی تمام حوالہ جات کی تصاویر کی بنیاد پر ایک نئے AI ماڈل کی تربیت کے لیے ڈریم بوتھ کا استعمال کریں گے۔ آپ کو اپنی توجہ دو ان پٹ فیلڈز تک محدود کرنی چاہیے۔ "-مثال پرامپٹ" پہلا پیرامیٹر ہے۔ آپ کو یہاں ایک انتہائی الگ نام فراہم کرنا چاہیے۔
'تصور کی فہرست' دلیل دوسری اہم ان پٹ فیلڈ ہے۔ 'پرامپٹ کو تبدیل کریں' سیکشن میں استعمال کردہ نام سے مماثل ہونے کے لیے اس کا نام تبدیل کرنا ضروری ہے۔
AI امیجز بنائیں
AI تصاویر اس مرحلے پر بنائی جائیں گی، جہاں آپ ٹیکسٹ ہدایات کو ان پٹ کر سکتے ہیں۔
ڈریم بوتھ کی حدود
- کمانڈ پرامپٹ اعلی درجے کی تفصیل کے ساتھ موضوع میں تکرار کرنے میں رکاوٹ بن جاتا ہے۔ DreamBooth موضوع کے سیاق و سباق کو تبدیل کر سکتا ہے، لیکن اگر ماڈل خود موضوع کو تبدیل کرنا چاہتا ہے، تو فریم کے ساتھ مسائل ہیں۔
- ایک اور مسئلہ آؤٹ پٹ تصویر کو ان پٹ امیج پر اوور فٹ کرنا ہے۔ اگر کافی تصاویر فراہم نہیں کی گئی ہیں، تو موضوع پر غور نہیں کیا جا سکتا یا جمع کرائی گئی تصاویر کے سیاق و سباق کے ساتھ ملایا جا سکتا ہے۔ جب ایک طاق نسل کا سیاق و سباق پوچھا جاتا ہے تو وہی بات ہوتی ہے۔
نتیجہ
ایک ٹیکسٹ ان پٹ سے آؤٹ پٹس تیار کرنے کے لیے، ٹیکسٹ ٹو امیج ماڈلز کی بڑی تعداد کو لاکھوں پیرامیٹرز اور لائبریریوں کی ضرورت ہوتی ہے۔
ڈریم بوتھ صارفین کے لیے مواد کے حصول اور استعمال کو آسان بناتا ہے جس میں متنی پس منظر کے ساتھ صرف تین سے پانچ موضوعی تصویروں کے ان پٹ کی ضرورت ہوتی ہے۔
جواب دیجئے