Yangi boshlanuvchilar uchun Dreambooth qo'llanmasi

Mundarija[Yashirish][Show]

Dreambooth nima?
Xususiyatlari
ariza+-
Dreambooth qo'llanma+-
Dreambooth cheklovlari
Xulosa

Katta matndan tasvirga modellar berilgan matn taklifidan yuqori sifatli va xilma-xil tasvir sintezini ishlab chiqarish orqali AI rivojlanishida sezilarli yutuqlarga erishdi.

Ushbu modellar turli xil sozlamalardagi sub'ektlarning noyob tasvirlarini sintez qila olmaydi yoki berilgan mos yozuvlar to'plamidagi sub'ektlarning ko'rinishini takrorlay olmaydi.

OpenAI-ning DALL.E2 yoki StabilityAI kabi yangi chiqarilgan texnologiyalar Barqaror diffuziya va Midjourney allaqachon internetni bo'ron bilan qabul qilmoqda. Endi natijalarni sozlash vaqti keldi. Ammo qanday qilib?

Google DreamBooth AI keldi.

DreamBooth rasm mavzusini tanib olish, uni asl kontekstdan ajratish va keyin uni yangi kerakli kontekstda aniq sintez qilish qobiliyatiga ega. Bundan tashqari, u hozirgi AI tasvir generatorlari bilan ishlatilishi mumkin.

Ushbu maqolada biz DreamBooth-ni, undan foydalanishni, o'quv qo'llanmasini, cheklovlarini va boshqa ko'p narsalarni ko'rib chiqamiz.

Dreambooth nima?

tushlar kabinasi, yangi matndan tasvirga diffuziya modeli Google tomonidan taqdim etildi. Yozma taklif Google DreamBooth AI tomonidan turli xil sozlamalarda foydalanuvchi tanlagan mavzuning keng doiradagi fotosuratlarini yaratish uchun ko'rsatma sifatida ishlatilishi mumkin.

Boston universiteti va Google tadqiqot guruhi oldindan tayyorgarlikdan oʻtgan matndan tasvirga modellarni oʻzgartirish uchun eng ilgʻor uslub boʻlgan DreamBooth-ni ishlab chiqdi.

Umumiy kontseptsiya juda oddiy: ular tilni ko'rish lug'atini shunday ko'paytirishni xohlaydilarki, odatiy token identifikatorlari foydalanuvchilar belgilashi mumkin bo'lgan maxsus mavzular bilan bog'lanadi.

Modelning asosiy maqsadi foydalanuvchilarni tarmoqqa ulashdir matndan tasvirga diffuziya modeli ularga o'zlarining tanlangan mavzulari misollarining fotorealistik tasvirlarini yaratish uchun zarur bo'lgan resurslarni berish orqali.

Natijada, ushbu uslub turli vaziyatlarda qiyinchiliklarni umumlashtirish uchun yaxshi ishlaydi.

Google DreamBooth oldingi matndan tasvirga o'tkazish vositalaridan farq qiladi, masalan DALL-E2, Barqaror diffuziyava O'rta sayohat, bu foydalanuvchilarga matnga asoslangan kirishlar yordamida diffuziya modelini boshqarishga ruxsat berishdan oldin mavzu tasvirini ko'proq nazorat qilish imkonini beradi.

Xususiyatlari

DreamBooth AI 3-5 tasvirli matndan tasvirga modelni yaxshilashi mumkin.
Original fotoreal suratlar DreamBooth AI yordamida yaratilishi mumkin.
Bundan tashqari, DreamBooth AI mavzuning bir nechta burchaklaridan fotosuratlarini yaratishi mumkin.

ariza

Badiiy ijrolar

Bu vazifa, ayniqsa, boshqa tasvirning uslubini asl sahnaga kiritgan holda, manba sahnasining semantikasini saqlaydigan uslubni uzatishdan farq qiladi.

Badiiy ijro

Ijodiy yondashuvga asoslanib, AI identifikatsiya va mavzu namunasining o'ziga xos xususiyatlarini saqlab qolgan holda sahnani sezilarli o'zgartirishni amalga oshirishi mumkin.

Mulkni o'zgartirish

Mavzu namunasining xarakteristikalari DreamBooth AI tomonidan o'zgartirilishi mumkin.

Mulkni o'zgartirish

Aksessuarlar

Avlod modelidan oldingi kuchli kompozitsiya DreamBooth AI-ning ob'ektlarni bezash qobiliyatini juda qiziqarli qiladi.

Aksessuarlar

Qayta kontekstualizatsiya

DreamBooth AI o'qitilgan modelga o'ziga xos identifikator va sinf nomini o'z ichiga olgan jumla berish orqali ma'lum bir mavzu misoli uchun o'ziga xos tasvirlarni ishlab chiqishi mumkin.

Qayta kontekstualizatsiya

U ob'ektni atrofni o'zgartirishdan ko'ra o'ziga xos, ilgari eshitilmagan postlar, artikulyatsiyalar va sahna tuzilishida yaratishi mumkin. Haqiqiy aks ettirish va soyalar, shuningdek, ob'ekt va atrofdagi ob'ektlar o'rtasidagi o'zaro ta'sir.

Dreambooth qo'llanma

Ushbu qo'llanmada biz quyidagilarni kuzatib boramiz Google Collab daftar, va men sizga u orqali o'taman, bu sizni o'zingiz tushunishga va undan foydalanishga majbur qiladi.

GPU-ni sozlash va kutubxonalarni o'rnatish

Qanday GPU va VRAM turlari mavjudligini aniqlash birinchi qadamdir. Bir nechta talablar va bog'liqliklarni o'rnatish ham zarur. Shunchaki o'ynash tugmasini bosing, so'ngra uning tugashini kuting.

GPU-ni sozlash va kutubxonalarni o'rnatish

Huggingface-da hisob yarating va token yarating

Keyingi qadam Huggingface akkaunti uchun ro'yxatdan o'tishdir. Tugatganingizdan so'ng, yuqori o'ng burchakdagi sozlamalarni bosing. Siz keyingi sahifaga kelasiz.

Quchoqlashgan yuz belgisi

Bu yerdan so'ralganidek token va nomni yarating. Tokenni quyidagi katakdagi Google hamkorligiga nusxalash va joylashtirish kerak.

Google Colab-dagi token

Xformers-ni o'rnating

Ushbu bosqichda siz ish vaqtini bosish orqali xformers-ni o'rnatish uchun o'ynash tugmasini bosishingiz mumkin.

Xformers-ni o'rnating

Drive-ga ulaning

Endi Google Drive-ga ulanish uchun ushbu katakchani ishga tushirish kifoya.

Drive-ga ulaning

So'rovni kiriting

Keyingi katakda siz shunchaki so'rovni kiritishingiz kerak.

So'rovni kiriting

Rasmlar yuklanmoqda

Ushbu bosqichda siz o'rgatmoqchi bo'lgan rasmlarni yuklashingiz kerak.

Tasvirlaringizni shu katakka yuklashingiz mumkin

AI modelini o'rgatish

Bu eng muhim bosqichdir, chunki siz taqdim etgan barcha ma'lumotnoma fotosuratlaringiz asosida yangi AI modelini o'rgatish uchun DreamBooth-dan foydalanasiz. E'tiboringizni ikkita kiritish maydoniga cheklashingiz kerak. “—instance prompt” birinchi parametrdir. Bu yerda siz juda aniq nom berishingiz kerak.

"-tushunchalar ro'yxati" argumenti ikkinchi muhim kiritish maydonidir. U "Ilovatni o'zgartirish" bo'limida ishlatiladigan nomga mos kelishi uchun qayta nomlanishi kerak.

AI modelini o'rgatish

AI tasvirlarini yarating

Ushbu bosqichda AI rasmlari yaratiladi, u erda siz matn ko'rsatmalarini kiritishingiz mumkin.

AI tasvirlarini yarating

Dreambooth cheklovlari

Buyruqning so'rovi yuqori darajadagi tafsilotlar bilan mavzuni takrorlash uchun to'siq bo'ladi. DreamBooth ob'ekt kontekstini o'zgartirishi mumkin, lekin agar model mavzuni o'zi o'zgartirmoqchi bo'lsa, ramka bilan bog'liq muammolar mavjud.
Yana bir muammo - chiqish rasmini kirish tasviriga haddan tashqari moslashtirish. Agar taqdim etilgan suratlar yetarli boʻlmasa, mavzu koʻrib chiqilmasligi yoki taqdim etilgan rasmlar konteksti bilan aralashtirilishi mumkin. G'alati avlod uchun kontekst so'ralganda, xuddi shu narsa sodir bo'ladi.

Xulosa

Bitta matn kiritishdan chiqishlarni ishlab chiqarish uchun matndan tasvirga o'tish modellarining asosiy qismi millionlab parametrlar va kutubxonalarni talab qiladi.

DreamBooth iste'molchilar uchun kontentni olish va ulardan foydalanishni soddalashtiradi va matn foni bilan faqat uch-beshta mavzuli fotosuratni kiritishni talab qiladi.

Yangi boshlanuvchilar uchun Dreambooth qo'llanma

Dreambooth nima?

Xususiyatlari