Bab lan Paragraf[Singidaken][Tampilake]
Model teks-kanggo-gambar gedhe nggawe kemajuan sing signifikan ing pangembangan AI kanthi ngasilake sintesis gambar sing bermutu lan macem-macem saka pituduh teks sing diwenehake.
Model iki ora bisa nyintesis perwakilan unik subyek ing macem-macem setelan utawa kanggo niru tampilan subyek ing pesawat referensi tartamtu.
Teknologi sing mentas dirilis kaya OpenAI's DALL.E2 utawa StabilityAI's Difusi Stabil lan Midjourney wis njupuk internet dening badai. Saiki wektune kanggo ngatur asil. Nanging carane?
Google DreamBooth AI wis teka.
DreamBooth nduweni kemampuan kanggo ngenali topik gambar, dekonstruksi saka konteks asline, banjur kanthi tepat nyintesis menyang konteks anyar sing dikarepake. Kajaba iku, bisa digunakake karo generator gambar AI saiki.
Ing artikel iki, kita bakal nliti DreamBooth, panggunaane, tutorial, watesan, lan liya-liyane.
Apa itu Dreambooth?
dreambooth, model difusi teks-kanggo-gambar anyar, diwenehi Google. Pandhuan sing ditulis bisa digunakake minangka pandhuan Google DreamBooth AI kanggo ngasilake macem-macem foto subyek sing dipilih pangguna ing setelan sing beda-beda.
Klompok riset saka Universitas Boston lan Google ngembangake DreamBooth, teknik mutakhir kanggo ngowahi model teks-menyang-gambar sing wis ngalami pra-latihan ekstensif.
Konsep sakabèhé rada gampang: dheweke pengin nambah kamus visi basa supaya ID token sing ora umum digandhengake karo topik khusus sing bisa ditemtokake pangguna.
Tujuan utama model yaiku kanggo nyambungake pangguna menyang model difusi teks-ke-gambar kanthi menehi sumber daya sing dibutuhake kanggo ngasilake representasi fotorealistik saka kedadeyan subyek sing dipilih.
Akibaté, teknik iki katon apik kanggo ngringkes tantangan ing sawetara kahanan.
DreamBooth Google beda karo piranti teks-kanggo-gambar sadurunge, kayata DALL-E2, Difusi Stabil, Lan midjourney, amarga menehi pangguna kontrol luwih akeh babagan gambar topik sadurunge ngidini dheweke ngapusi model difusi nggunakake input adhedhasar teks.
fitur
- DreamBooth AI bisa nambah model text-to-image kanthi 3-5 gambar.
- Foto fotorealistik asli bisa digawe nganggo DreamBooth AI.
- Kajaba iku, DreamBooth AI bisa nggawe foto topik saka macem-macem sudut.
aplikasi
Panyebaran Seni
Tugas iki beda-beda khusus saka transfer gaya, sing njaga semantik saka adegan sumber nalika nggabungake gaya gambar liyane menyang adegan asli.
Adhedhasar pendekatan kreatif, AI bisa nindakake owah-owahan adegan sing signifikan nalika njaga identifikasi lan spesifik conto topik.
Modifikasi Properti
Karakteristik conto subyek bisa diowahi dening DreamBooth AI.
Aksesori
Komposisi sing kuat sadurunge model generasi yaiku sing ndadekake kemampuan DreamBooth AI kanggo nghias obyek dadi menarik.
Rekontekstualisasi
DreamBooth AI bisa ngasilake gambar sing khas kanggo conto subyek tartamtu kanthi menehi model terlatih ukara sing kalebu pengenal unik lan nomina kelas.
Bisa ngasilake subyek kanthi postur, artikulasi, lan struktur adegan sing unik, sing sadurunge durung dirungokake, tinimbang ngganti lingkungan. Bayangan lan bayangan sing nyata, uga interaksi antarane subyek lan obyek ing saubengé.
Tutorial Dreambooth
Ing tutorial iki, kita bakal ngetutake Notebook Google Collab, lan aku bakal nuntun sampeyan liwat, sing bakal nggawe sampeyan ngerti lan nggunakake dhewe.
Nyetel GPU lan nginstal perpustakaan
Nggoleki jinis GPU lan VRAM sing kasedhiya minangka langkah pertama. Nginstal sawetara syarat lan dependensi uga perlu. Cukup pencet tombol play, banjur ngenteni nganti rampung.
Nggawe akun ing Huggingface lan ngasilake token
Langkah sabanjure yaiku ndhaptar akun Huggingface. Yen wis rampung, klik setelan ing pojok tengen ndhuwur. Sampeyan bakal teka ing kaca sabanjure.
Gawe token lan jeneng kaya sing dijaluk saka kene. Token kudu disalin lan ditempelake menyang collab Google ing sel ing ngisor iki.
Instal xformers
Ing tataran iki, sampeyan mung bisa mencet tombol muter kanggo nginstal xformers kanthi ngeklik ing runtime.
Nyambung menyang Drive
Saiki, sampeyan mung kudu mbukak sel iki kanggo nyambung menyang google drive.
Ketik pituduh
Ing sel ing ngisor iki, sampeyan mung kudu ngetik pituduh.
Ngunggah gambar
Ing langkah iki, sampeyan mung kudu ngunggah gambar sing pengin dilatih.
Nglatih model AI
Iki minangka fase sing paling penting, amarga sampeyan bakal nggunakake DreamBooth kanggo nglatih model AI anyar adhedhasar kabeh foto referensi sing dikirim. Sampeyan kudu matesi manungsa waé menyang rong kolom input. "-instance prompt" minangka parameter pisanan. Sampeyan kudu menehi jeneng sing beda banget ing kene.
Argumen '–concept list' minangka kolom input kritis kapindho. Iki kudu diganti jeneng supaya cocog karo sing digunakake ing bagean 'Ganti pituduh'.
Gawe gambar AI
Gambar AI bakal digawe ing tahap iki, ing ngendi sampeyan bisa ngetik instruksi teks.
Watesan Dreambooth
- Command prompt dadi alangan kanggo nggawe iterasi ing topik kanthi tingkat rinci sing dhuwur. DreamBooth bisa ngganti konteks subyek, nanging yen model pengin ngganti subyek dhewe, ana masalah karo pigura.
- Masalah liyane yaiku overfitting gambar output menyang gambar input. Yen ora cukup gambar sing diwenehake, subyek bisa uga ora dianggep utawa bisa uga dicampur karo konteks gambar sing dikirim. Nalika konteks kanggo generasi aneh ditakoni, kedadeyan sing padha.
kesimpulan
Kanggo ngasilake output saka input teks siji, akeh model teks-kanggo-gambar mbutuhake jutaan parameter lan perpustakaan.
DreamBooth nyederhanakake akuisisi lan panggunaan konten kanggo konsumen kanthi mung mbutuhake input telung nganti limang foto topik bebarengan karo latar mburi teks.
Ninggalake a Reply