مواد جي جدول[لڪ][ڏسو]
وڏن ٽيڪسٽ کان تصويري ماڊلز AI جي ترقي ۾ هڪ اهم پيش رفت ڪئي آهي هڪ ڏنل ٽيڪسٽ پرامپٽ مان اعليٰ معيار ۽ متنوع تصويري جوڙجڪ پيدا ڪندي.
اهي ماڊل مختلف سيٽنگن ۾ مضمونن جي منفرد نمائندگي کي ترتيب ڏيڻ يا ڏنل حوالن جي سيٽ ۾ مضمونن جي ظاهري کي نقل ڪرڻ جي قابل نه هوندا آهن.
نئين جاري ڪيل ٽيڪنالاجيون جهڙوڪ OpenAI جي DALL.E2 يا StabilityAI جي مستحڪم پکيڙ ۽ Midjourney اڳ ۾ ئي انٽرنيٽ وٺي رهيا آهن طوفان سان. اهو هاڻي وقت آهي نتيجن کي ترتيب ڏيڻ لاء. اڃان ڪيئن؟
Google DreamBooth AI اچي ويو آهي.
DreamBooth وٽ اها صلاحيت آهي ته اها تصوير جي موضوع کي سڃاڻي، ان کي ان جي اصل تناظر مان ٺهرائي، ۽ پوءِ صحيح طرح سان ان کي نئين گهربل تناظر ۾ ترتيب ڏئي. اضافي طور تي، اهو موجوده AI تصوير جنريٽر سان استعمال ڪري سگهجي ٿو.
هن آرٽيڪل ۾، اسان DreamBooth، ان جي استعمال، ان جي سبق، ان جي حدن، ۽ گهڻو ڪجهه تي هڪ گہری نظر ڪنداسين.
Dreambooth ڇا آهي؟
خواب بوٿ, گوگل طرفان پيش ڪيو ويو ھڪڙو نئون متن کان تصويري ڊفيوژن ماڊل. مختلف سيٽنگن ۾ استعمال ڪندڙ جي چونڊيل مضمون جي تصويرن جي وسيع رينج پيدا ڪرڻ لاءِ گوگل DreamBooth AI جي هدايتن جي طور تي هڪ تحريري پرامٽ استعمال ڪري سگهجي ٿو.
بوسٽن يونيورسٽي ۽ گوگل جي هڪ ريسرچ گروپ ڊريم بوٿ تيار ڪيو، ٽيڪسٽ کان تصويري ماڊلز کي تبديل ڪرڻ لاءِ هڪ جديد ٽيڪنڪ جنهن جي اڳڀرائي کان اڳ واري تربيت ٿي چڪي آهي.
مجموعي تصور بلڪل سادو آهي: اهي ٻولي-وژن ڊڪشنري کي وڌائڻ چاهيندا آهن جيئن ته غير معمولي ٽوڪن IDs سان لاڳاپيل موضوعن سان لاڳاپيل آهن جيڪي صارف بيان ڪري سگھن ٿا.
ماڊل جو بنيادي مقصد صارفين سان ڳنڍڻ آهي متن کان تصوير جي پکيڙ ماڊل انهن کي وسيلا ڏيڻ سان انهن کي انهن جي چونڊيل مضمونن جي مثالن جي فوٽو ريئلسٽڪ نمائندگي پيدا ڪرڻ جي ضرورت آهي.
نتيجي طور، هي ٽيڪنڪ چڱي طرح ڪم ڪرڻ لڳي ٿي مختلف حالتن ۾ چئلينج کي اختصار ڪرڻ لاء.
گوگل جو DreamBooth اڳئين متن کان تصويري اوزار کان مختلف آهي، جهڙوڪ ڊيل-اي2, مستحڪم پکيڙ، ۽ وچ وارو سفر, انهي ۾ اهو صارفين کي موضوع جي تصوير تي وڌيڪ ڪنٽرول ڏئي ٿو ان کان اڳ انهن کي متن جي بنياد تي ان پٽ استعمال ڪندي ڊفيوشن ماڊل کي هٿي ڏيڻ.
مضمونن جي
- DreamBooth AI 3-5 تصويرن سان ٽيڪسٽ کان تصويري ماڊل کي بهتر ڪري سگھي ٿو.
- DreamBooth AI سان اصل تصويرون حقيقي تصويرون ٺاهي سگھجن ٿيون.
- ان کان علاوه، DreamBooth AI ڪيترن ئي زاوين کان هڪ موضوع جون تصويرون ٺاهي سگھي ٿو.
درخواست
فن جي پيشڪش
هي ڪم خاص طور تي انداز جي منتقلي کان مختلف آهي، جيڪو اصل منظر ۾ ٻي تصوير جي انداز کي شامل ڪرڻ دوران ماخذ منظر جي سيمينٽڪس کي برقرار رکي ٿو.
تخليقي طريقي جي بنياد تي، AI سڃاڻپ ۽ موضوع جي مثال جي وضاحتن کي برقرار رکڻ دوران اهم منظر جي تبديلين کي پورو ڪري سگھي ٿو.
ملڪيت جي تبديلي
موضوع جي مثال جي خاصيتن کي تبديل ڪري سگھجي ٿو DreamBooth AI پاران.
پهچائڻ
نسل جي ماڊل کان اڳ جو مضبوط ٺهيل آهي جيڪو DreamBooth AI جي شين کي زينت ڏيڻ جي صلاحيت کي ايترو دلچسپ بڻائي ٿو.
Recontextualization
DreamBooth AI هڪ خاص مضمون لاءِ مخصوص تصويرون ٺاهي سگھي ٿو مثال طور هڪ تربيت يافته ماڊل کي هڪ جملو ڏئي جنهن ۾ منفرد سڃاڻپ ڪندڙ ۽ ڪلاس اسم شامل آهي.
اهو موضوع پيدا ڪري سگهي ٿو منفرد، اڳ ۾ اڻ ٻڌايل پوزيشن، آرٽيڪل، ۽ منظر جي جوڙجڪ جي بدران ماحول کي تبديل ڪرڻ جي. حقيقي عڪاسي ۽ پاڇا، گڏوگڏ موضوع ۽ آس پاس جي شين جي وچ ۾ رابطي.
Dreambooth سبق
هن سبق ۾، اسان هيٺ ڪنداسين Google Collab نوٽ بڪ، ۽ مان توھان کي ان جي ذريعي ھلائيندس، جيڪو توھان کي سمجھائيندو ۽ ان کي پنھنجو پاڻ تي استعمال ڪندو.
GPU ترتيب ڏيڻ ۽ لائبريرين کي نصب ڪرڻ
معلوم ڪرڻ ته ڇا GPU ۽ VRAM قسم موجود آهن پهريون قدم آهي. ڪجھ ضرورتن ۽ انحصار کي انسٽال ڪرڻ پڻ ضروري آھي. بس ادا بٽڻ کي دٻايو، پوء ان جي ختم ٿيڻ جو انتظار ڪريو.
Huggingface تي هڪ اڪائونٽ ٺاهيو ۽ هڪ ٽوڪن ٺاهيو
ايندڙ قدم هڪ Huggingface اڪائونٽ لاءِ رجسٽر ڪرڻ آهي. جڏهن توهان مڪمل ڪيو، ڪلڪ ڪريو سيٽنگون مٿي ساڄي ڪنڊ ۾. توهان ايندڙ صفحي تي پهچي ويندا.
ھتان کان درخواست ڪيل ٽوڪن ۽ نالو ٺاھيو. ٽوڪن کي هيٺ ڏنل سيل ۾ گوگل ڪولب ۾ ڪاپي ۽ پيسٽ ڪيو وڃي.
xformers انسٽال ڪريو
هن اسٽيج ۾، توهان صرف رن ٽائم تي ڪلڪ ڪندي xformers انسٽال ڪرڻ لاءِ پلي بٽڻ کي دٻائي سگهو ٿا.
ڊرائيو سان ڳنڍيو
هاڻي، توهان کي صرف هن سيل کي هلائڻو پوندو گوگل ڊرائيو سان ڳنڍڻ لاء.
پرامٽ داخل ڪريو
هيٺ ڏنل سيل ۾، توهان کي صرف پرامٽ داخل ڪرڻو پوندو.
تصويرون اپ لوڊ ڪندي
هن قدم ۾، توهان کي صرف انهن تصويرن کي اپلوڊ ڪرڻو پوندو جيڪو توهان ٽريننگ ڪرڻ چاهيو ٿا.
ٽرين AI ماڊل
هي سڀ کان اهم مرحلو آهي، جيئن توهان استعمال ڪندا ڊريم بوٿ هڪ نئين AI ماڊل کي تربيت ڏيڻ لاءِ توهان جي موڪليل سڀني حوالن جي تصويرن جي بنياد تي. توھان کي لازمي طور تي پنھنجي توجھ کي ٻن ان پٽ فيلڊن ڏانھن محدود ڪرڻ گھرجي. "-مثال پرامٽ" پهريون پيٽرولر آهي. توھان کي ھتي ھڪڙو خاص نالو ڏيڻ گھرجي.
'-تصور جي فهرست' دليل ٻيو نازڪ ان پٽ فيلڊ آهي. ان جو نالو مٽائڻ لازمي آھي ان سان ملائڻ لاءِ جيڪو استعمال ڪيو ويو آھي 'پرامپٽ تبديل ڪريو' سيڪشن ۾.
AI تصويرون ٺاھيو
AI تصويرون هن اسٽيج تي ٺاهيا ويندا، جتي توهان ٽيڪسٽ هدايتون داخل ڪري سگهو ٿا.
خواب بوٿ جون حدون
- ڪمانڊ پرامپٽ تفصيل جي اعلي درجي سان موضوع ۾ تکرار ڪرڻ ۾ رڪاوٽ بنجي ٿي. DreamBooth موضوع جي حوالي سان تبديل ڪري سگهي ٿو، پر جيڪڏهن ماڊل پاڻ کي موضوع کي تبديل ڪرڻ چاهي ٿو، اتي فريم سان مسئلا آهن.
- ٻيو مسئلو اهو آهي ته آئوٽ پٽ تصوير کي ان پٽ تصوير تي اوورفٽ ڪرڻ. جيڪڏهن ڪافي تصويرون مهيا نه ڪيون ويون آهن، موضوع تي غور نه ڪيو وڃي يا پيش ڪيل تصويرن جي حوالي سان ٺهيل هجي. جڏهن هڪ غير معمولي نسل جي حوالي سان پڇيو ويندو آهي، ساڳي شيء جاء وٺندو آهي.
ٿڪل
ھڪڙي ٽيڪسٽ ان پٽ مان ٻاھر پيدا ڪرڻ لاء، ٽيڪسٽ کان تصويري ماڊل جي وڏي تعداد ۾ لکين پيرا ميٽرز ۽ لائبريرين جي ضرورت آھي.
DreamBooth صارفين لاءِ مواد جي حصول ۽ استعمال کي آسان بڻائي ٿو صرف ٽن کان پنج عنوانن جي تصويرن جي ان پٽ جي ضرورت سان گڏ متن جي پس منظر سان.
جواب ڇڏي وڃو