Dreambooth vodič za početnike

Pregled sadržaja[Sakriti][Pokazati]

Što je Dreambooth?
Značajke
primjena+-
Vodič za Dreambooth+-
Dreambooth ograničenja
Zaključak

Veliki modeli teksta u sliku značajno su napredovali u razvoju umjetne inteligencije proizvodeći visokokvalitetnu i raznoliku sintezu slike iz zadanog tekstualnog odziva.

Ovi modeli ne mogu sintetizirati jedinstvene prikaze subjekata u različitim okruženjima ili replicirati izgled subjekata u danom referentnom skupu.

Nedavno objavljene tehnologije poput DALL.E2 OpenAI-ja ili StabilityAI-a Stabilna difuzija i Midjourney već osvajaju internet. Sada je vrijeme za prilagodbu rezultata. Ali kako?

Google DreamBooth AI je stigao.

DreamBooth ima sposobnost prepoznati temu slike, dekonstruirati je iz izvornog konteksta i zatim je precizno sintetizirati u novi željeni kontekst. Osim toga, može se koristiti s trenutnim AI generatorima slika.

U ovom ćemo članku detaljno proučiti DreamBooth, njegovu upotrebu, upute, ograničenja i još mnogo toga.

Što je Dreambooth?

kabina za snove, potpuno novi model difuzije teksta u sliku, predstavio je Google. Google DreamBooth AI može upotrijebiti pisani upit kao smjernicu za generiranje širokog raspona fotografija subjekta odabranog korisnika u različitim postavkama.

Istraživačka skupina sa Sveučilišta u Bostonu i Google razvila je DreamBooth, vrhunsku tehniku za promjenu modela teksta u sliku koja je prošla opsežnu prethodnu obuku.

Cjelokupni koncept je prilično jednostavan: žele povećati rječnik jezične vizije tako da se ID-ovi neuobičajenih tokena povezuju s prilagođenim temama koje korisnici mogu definirati.

Glavni cilj modela je povezivanje korisnika s model difuzije teksta u sliku dajući im resurse koji su im potrebni za izradu fotorealističnih prikaza instanci odabrane teme.

Kao posljedica toga, čini se da ova tehnika dobro funkcionira za sažimanje izazova u nizu situacija.

Googleov DreamBooth razlikuje se od prethodnih alata za pretvaranje teksta u sliku, kao što su DALL-E2, Stabilna difuzijai Sredina putovanja, utoliko što korisnicima daje veću kontrolu nad slikom teme prije nego što im dopusti da manipuliraju modelom difuzije koristeći unose temeljene na tekstu.

Značajke

DreamBooth AI mogao bi poboljšati model teksta u sliku s 3-5 slika.
Izvorne fotorealistične fotografije mogu se stvoriti pomoću DreamBooth AI.
Osim toga, DreamBooth AI može stvoriti fotografije teme iz više kutova.

primjena

Umjetničke izvedbe

Ovaj se zadatak posebno razlikuje od prijenosa stila, koji zadržava semantiku izvorne scene dok uključuje stil druge slike u izvornu scenu.

Umjetnička izvedba

Na temelju kreativnog pristupa, umjetna inteligencija može postići značajne izmjene scene uz zadržavanje identifikacije i specifičnosti instance teme.

Promjena nekretnine

Karakteristike predmetne instance može modificirati DreamBooth AI.

Promjena nekretnine

Dodatna oprema

Jaka kompozicija prije modela generacije ono je što čini sposobnost DreamBooth AI da ukrašava objekte tako zanimljivom.

Dodatna oprema

Rekontekstualizacija

DreamBooth AI može proizvesti karakteristične slike za određenu instancu predmeta tako što obučenom modelu daje rečenicu koja uključuje jedinstveni identifikator i imenicu klase.

Rekontekstualizacija

Može generirati subjekt u jedinstvenim, dosad nečuvenim položajima, artikulacijama i strukturi scene umjesto da mijenja okolinu. Realistični odrazi i sjene, kao i interakcije između subjekta i okolnih objekata.

Vodič za Dreambooth

U ovom vodiču pratit ćemo Google Collab bilježnica, a ja ću vas provesti kroz njega, što će vam omogućiti da ga sami razumijete i koristite.

Postavljanje GPU-a i instaliranje biblioteka

Prvi korak je saznati koje su vrste GPU-a i VRAM-a dostupne. Također je potrebno instalirati nekoliko zahtjeva i ovisnosti. Jednostavno pritisnite gumb za reprodukciju, a zatim pričekajte da završi.

Postavljanje GPU-a i instaliranje biblioteka

Napravite račun na Huggingface i generirajte token

Sljedeći korak je registracija za Huggingface račun. Kada završite, kliknite postavke u gornjem desnom kutu. Doći ćete na sljedeću stranicu.

Token grlećeg lica

Odavde stvorite token i naziv prema zahtjevu. Token treba kopirati i zalijepiti u Googleovu suradnju u donjoj ćeliji.

Token u Google Colabu

Instalirajte xformers

U ovoj fazi možete jednostavno pritisnuti tipku za reprodukciju kako biste instalirali xformers klikom na runtime.

Instalirajte Xformers

Povežite se s Diskom

Sada samo trebate pokrenuti ovu ćeliju da biste se povezali s Google diskom.

Povežite se s Diskom

Unesite upit

U sljedeću ćeliju samo trebate unijeti upit.

Unesite upit

Učitavanje slika

U ovom koraku samo morate prenijeti slike koje želite trenirati.

Možete učitati svoje slike u ovu ćeliju

Uvježbajte AI model

Ovo je najvažnija faza, budući da ćete koristiti DreamBooth za obuku novog AI modela na temelju svih vaših poslanih referentnih fotografija. Morate ograničiti svoju pozornost na dva polja za unos. “—instance prompt” je prvi parametar. Ovdje morate navesti vrlo jasno ime.

Argument '–concept list' drugo je kritično polje za unos. Mora se preimenovati kako bi odgovarao onom korištenom u odjeljku "Promjena upita".

Model obuke AI

Generirajte AI slike

AI slike će biti stvorene u ovoj fazi, gdje možete unijeti tekstualne upute.

Generirajte AI slike

Dreambooth ograničenja

Naredbeni redak postaje prepreka ponavljanju teme s visokim stupnjem detalja. DreamBooth može promijeniti kontekst subjekta, ali ako model želi sam promijeniti subjekt, postoje problemi s okvirom.
Drugi problem je prekomjerno prilagođavanje izlazne slike ulaznoj slici. Ako nema dovoljno slika, tema se možda neće uzeti u obzir ili se može uklopiti u kontekst dostavljenih slika. Kada se traži kontekst za čudnu generaciju, događa se ista stvar.

Zaključak

Za proizvodnju izlaza iz jednog unosa teksta, većina modela teksta u sliku zahtijeva milijune parametara i biblioteka.

DreamBooth pojednostavljuje kupnju sadržaja i korištenje za potrošače zahtijevajući samo unos tri do pet tematskih fotografija zajedno s tekstualnom pozadinom.

Dreambooth vodič za početnike

Što je Dreambooth?

Značajke