Mundarija[Yashirish][Show]
Katta matndan tasvirga modellar berilgan matn taklifidan yuqori sifatli va xilma-xil tasvir sintezini ishlab chiqarish orqali AI rivojlanishida sezilarli yutuqlarga erishdi.
Ushbu modellar turli xil sozlamalardagi sub'ektlarning noyob tasvirlarini sintez qila olmaydi yoki berilgan mos yozuvlar to'plamidagi sub'ektlarning ko'rinishini takrorlay olmaydi.
OpenAI-ning DALL.E2 yoki StabilityAI kabi yangi chiqarilgan texnologiyalar Barqaror diffuziya va Midjourney allaqachon internetni bo'ron bilan qabul qilmoqda. Endi natijalarni sozlash vaqti keldi. Ammo qanday qilib?
Google DreamBooth AI keldi.
DreamBooth rasm mavzusini tanib olish, uni asl kontekstdan ajratish va keyin uni yangi kerakli kontekstda aniq sintez qilish qobiliyatiga ega. Bundan tashqari, u hozirgi AI tasvir generatorlari bilan ishlatilishi mumkin.
Ushbu maqolada biz DreamBooth-ni, undan foydalanishni, o'quv qo'llanmasini, cheklovlarini va boshqa ko'p narsalarni ko'rib chiqamiz.
Dreambooth nima?
tushlar kabinasi, yangi matndan tasvirga diffuziya modeli Google tomonidan taqdim etildi. Yozma taklif Google DreamBooth AI tomonidan turli xil sozlamalarda foydalanuvchi tanlagan mavzuning keng doiradagi fotosuratlarini yaratish uchun ko'rsatma sifatida ishlatilishi mumkin.
Boston universiteti va Google tadqiqot guruhi oldindan tayyorgarlikdan oʻtgan matndan tasvirga modellarni oʻzgartirish uchun eng ilgʻor uslub boʻlgan DreamBooth-ni ishlab chiqdi.
Umumiy kontseptsiya juda oddiy: ular tilni ko'rish lug'atini shunday ko'paytirishni xohlaydilarki, odatiy token identifikatorlari foydalanuvchilar belgilashi mumkin bo'lgan maxsus mavzular bilan bog'lanadi.
Modelning asosiy maqsadi foydalanuvchilarni tarmoqqa ulashdir matndan tasvirga diffuziya modeli ularga o'zlarining tanlangan mavzulari misollarining fotorealistik tasvirlarini yaratish uchun zarur bo'lgan resurslarni berish orqali.
Natijada, ushbu uslub turli vaziyatlarda qiyinchiliklarni umumlashtirish uchun yaxshi ishlaydi.
Google DreamBooth oldingi matndan tasvirga o'tkazish vositalaridan farq qiladi, masalan DALL-E2, Barqaror diffuziyava O'rta sayohat, bu foydalanuvchilarga matnga asoslangan kirishlar yordamida diffuziya modelini boshqarishga ruxsat berishdan oldin mavzu tasvirini ko'proq nazorat qilish imkonini beradi.
Xususiyatlari
- DreamBooth AI 3-5 tasvirli matndan tasvirga modelni yaxshilashi mumkin.
- Original fotoreal suratlar DreamBooth AI yordamida yaratilishi mumkin.
- Bundan tashqari, DreamBooth AI mavzuning bir nechta burchaklaridan fotosuratlarini yaratishi mumkin.
ariza
Badiiy ijrolar
Bu vazifa, ayniqsa, boshqa tasvirning uslubini asl sahnaga kiritgan holda, manba sahnasining semantikasini saqlaydigan uslubni uzatishdan farq qiladi.
Ijodiy yondashuvga asoslanib, AI identifikatsiya va mavzu namunasining o'ziga xos xususiyatlarini saqlab qolgan holda sahnani sezilarli o'zgartirishni amalga oshirishi mumkin.
Mulkni o'zgartirish
Mavzu namunasining xarakteristikalari DreamBooth AI tomonidan o'zgartirilishi mumkin.
Aksessuarlar
Avlod modelidan oldingi kuchli kompozitsiya DreamBooth AI-ning ob'ektlarni bezash qobiliyatini juda qiziqarli qiladi.
Qayta kontekstualizatsiya
DreamBooth AI o'qitilgan modelga o'ziga xos identifikator va sinf nomini o'z ichiga olgan jumla berish orqali ma'lum bir mavzu misoli uchun o'ziga xos tasvirlarni ishlab chiqishi mumkin.
U ob'ektni atrofni o'zgartirishdan ko'ra o'ziga xos, ilgari eshitilmagan postlar, artikulyatsiyalar va sahna tuzilishida yaratishi mumkin. Haqiqiy aks ettirish va soyalar, shuningdek, ob'ekt va atrofdagi ob'ektlar o'rtasidagi o'zaro ta'sir.
Dreambooth qo'llanma
Ushbu qo'llanmada biz quyidagilarni kuzatib boramiz Google Collab daftar, va men sizga u orqali o'taman, bu sizni o'zingiz tushunishga va undan foydalanishga majbur qiladi.
GPU-ni sozlash va kutubxonalarni o'rnatish
Qanday GPU va VRAM turlari mavjudligini aniqlash birinchi qadamdir. Bir nechta talablar va bog'liqliklarni o'rnatish ham zarur. Shunchaki o'ynash tugmasini bosing, so'ngra uning tugashini kuting.
Huggingface-da hisob yarating va token yarating
Keyingi qadam Huggingface akkaunti uchun ro'yxatdan o'tishdir. Tugatganingizdan so'ng, yuqori o'ng burchakdagi sozlamalarni bosing. Siz keyingi sahifaga kelasiz.
Bu yerdan so'ralganidek token va nomni yarating. Tokenni quyidagi katakdagi Google hamkorligiga nusxalash va joylashtirish kerak.
Xformers-ni o'rnating
Ushbu bosqichda siz ish vaqtini bosish orqali xformers-ni o'rnatish uchun o'ynash tugmasini bosishingiz mumkin.
Drive-ga ulaning
Endi Google Drive-ga ulanish uchun ushbu katakchani ishga tushirish kifoya.
So'rovni kiriting
Keyingi katakda siz shunchaki so'rovni kiritishingiz kerak.
Rasmlar yuklanmoqda
Ushbu bosqichda siz o'rgatmoqchi bo'lgan rasmlarni yuklashingiz kerak.
AI modelini o'rgatish
Bu eng muhim bosqichdir, chunki siz taqdim etgan barcha ma'lumotnoma fotosuratlaringiz asosida yangi AI modelini o'rgatish uchun DreamBooth-dan foydalanasiz. E'tiboringizni ikkita kiritish maydoniga cheklashingiz kerak. “—instance prompt” birinchi parametrdir. Bu yerda siz juda aniq nom berishingiz kerak.
"-tushunchalar ro'yxati" argumenti ikkinchi muhim kiritish maydonidir. U "Ilovatni o'zgartirish" bo'limida ishlatiladigan nomga mos kelishi uchun qayta nomlanishi kerak.
AI tasvirlarini yarating
Ushbu bosqichda AI rasmlari yaratiladi, u erda siz matn ko'rsatmalarini kiritishingiz mumkin.
Dreambooth cheklovlari
- Buyruqning so'rovi yuqori darajadagi tafsilotlar bilan mavzuni takrorlash uchun to'siq bo'ladi. DreamBooth ob'ekt kontekstini o'zgartirishi mumkin, lekin agar model mavzuni o'zi o'zgartirmoqchi bo'lsa, ramka bilan bog'liq muammolar mavjud.
- Yana bir muammo - chiqish rasmini kirish tasviriga haddan tashqari moslashtirish. Agar taqdim etilgan suratlar yetarli boʻlmasa, mavzu koʻrib chiqilmasligi yoki taqdim etilgan rasmlar konteksti bilan aralashtirilishi mumkin. G'alati avlod uchun kontekst so'ralganda, xuddi shu narsa sodir bo'ladi.
Xulosa
Bitta matn kiritishdan chiqishlarni ishlab chiqarish uchun matndan tasvirga o'tish modellarining asosiy qismi millionlab parametrlar va kutubxonalarni talab qiladi.
DreamBooth iste'molchilar uchun kontentni olish va ulardan foydalanishni soddalashtiradi va matn foni bilan faqat uch-beshta mavzuli fotosuratni kiritishni talab qiladi.
Leave a Reply