Pregled sadržaja[Sakriti][Pokazati]
Veliki modeli teksta u sliku značajno su napredovali u razvoju umjetne inteligencije proizvodeći visokokvalitetnu i raznoliku sintezu slike iz zadanog tekstualnog odziva.
Ovi modeli ne mogu sintetizirati jedinstvene prikaze subjekata u različitim okruženjima ili replicirati izgled subjekata u danom referentnom skupu.
Nedavno objavljene tehnologije poput DALL.E2 OpenAI-ja ili StabilityAI-a Stabilna difuzija i Midjourney već osvajaju internet. Sada je vrijeme za prilagodbu rezultata. Ali kako?
Google DreamBooth AI je stigao.
DreamBooth ima sposobnost prepoznati temu slike, dekonstruirati je iz izvornog konteksta i zatim je precizno sintetizirati u novi željeni kontekst. Osim toga, može se koristiti s trenutnim AI generatorima slika.
U ovom ćemo članku detaljno proučiti DreamBooth, njegovu upotrebu, upute, ograničenja i još mnogo toga.
Što je Dreambooth?
kabina za snove, potpuno novi model difuzije teksta u sliku, predstavio je Google. Google DreamBooth AI može upotrijebiti pisani upit kao smjernicu za generiranje širokog raspona fotografija subjekta odabranog korisnika u različitim postavkama.
Istraživačka skupina sa Sveučilišta u Bostonu i Google razvila je DreamBooth, vrhunsku tehniku za promjenu modela teksta u sliku koja je prošla opsežnu prethodnu obuku.
Cjelokupni koncept je prilično jednostavan: žele povećati rječnik jezične vizije tako da se ID-ovi neuobičajenih tokena povezuju s prilagođenim temama koje korisnici mogu definirati.
Glavni cilj modela je povezivanje korisnika s model difuzije teksta u sliku dajući im resurse koji su im potrebni za izradu fotorealističnih prikaza instanci odabrane teme.
Kao posljedica toga, čini se da ova tehnika dobro funkcionira za sažimanje izazova u nizu situacija.
Googleov DreamBooth razlikuje se od prethodnih alata za pretvaranje teksta u sliku, kao što su DALL-E2, Stabilna difuzijai Sredina putovanja, utoliko što korisnicima daje veću kontrolu nad slikom teme prije nego što im dopusti da manipuliraju modelom difuzije koristeći unose temeljene na tekstu.
Značajke
- DreamBooth AI mogao bi poboljšati model teksta u sliku s 3-5 slika.
- Izvorne fotorealistične fotografije mogu se stvoriti pomoću DreamBooth AI.
- Osim toga, DreamBooth AI može stvoriti fotografije teme iz više kutova.
primjena
Umjetničke izvedbe
Ovaj se zadatak posebno razlikuje od prijenosa stila, koji zadržava semantiku izvorne scene dok uključuje stil druge slike u izvornu scenu.
Na temelju kreativnog pristupa, umjetna inteligencija može postići značajne izmjene scene uz zadržavanje identifikacije i specifičnosti instance teme.
Promjena nekretnine
Karakteristike predmetne instance može modificirati DreamBooth AI.
Dodatna oprema
Jaka kompozicija prije modela generacije ono je što čini sposobnost DreamBooth AI da ukrašava objekte tako zanimljivom.
Rekontekstualizacija
DreamBooth AI može proizvesti karakteristične slike za određenu instancu predmeta tako što obučenom modelu daje rečenicu koja uključuje jedinstveni identifikator i imenicu klase.
Može generirati subjekt u jedinstvenim, dosad nečuvenim položajima, artikulacijama i strukturi scene umjesto da mijenja okolinu. Realistični odrazi i sjene, kao i interakcije između subjekta i okolnih objekata.
Vodič za Dreambooth
U ovom vodiču pratit ćemo Google Collab bilježnica, a ja ću vas provesti kroz njega, što će vam omogućiti da ga sami razumijete i koristite.
Postavljanje GPU-a i instaliranje biblioteka
Prvi korak je saznati koje su vrste GPU-a i VRAM-a dostupne. Također je potrebno instalirati nekoliko zahtjeva i ovisnosti. Jednostavno pritisnite gumb za reprodukciju, a zatim pričekajte da završi.
Napravite račun na Huggingface i generirajte token
Sljedeći korak je registracija za Huggingface račun. Kada završite, kliknite postavke u gornjem desnom kutu. Doći ćete na sljedeću stranicu.
Odavde stvorite token i naziv prema zahtjevu. Token treba kopirati i zalijepiti u Googleovu suradnju u donjoj ćeliji.
Instalirajte xformers
U ovoj fazi možete jednostavno pritisnuti tipku za reprodukciju kako biste instalirali xformers klikom na runtime.
Povežite se s Diskom
Sada samo trebate pokrenuti ovu ćeliju da biste se povezali s Google diskom.
Unesite upit
U sljedeću ćeliju samo trebate unijeti upit.
Učitavanje slika
U ovom koraku samo morate prenijeti slike koje želite trenirati.
Uvježbajte AI model
Ovo je najvažnija faza, budući da ćete koristiti DreamBooth za obuku novog AI modela na temelju svih vaših poslanih referentnih fotografija. Morate ograničiti svoju pozornost na dva polja za unos. “—instance prompt” je prvi parametar. Ovdje morate navesti vrlo jasno ime.
Argument '–concept list' drugo je kritično polje za unos. Mora se preimenovati kako bi odgovarao onom korištenom u odjeljku "Promjena upita".
Generirajte AI slike
AI slike će biti stvorene u ovoj fazi, gdje možete unijeti tekstualne upute.
Dreambooth ograničenja
- Naredbeni redak postaje prepreka ponavljanju teme s visokim stupnjem detalja. DreamBooth može promijeniti kontekst subjekta, ali ako model želi sam promijeniti subjekt, postoje problemi s okvirom.
- Drugi problem je prekomjerno prilagođavanje izlazne slike ulaznoj slici. Ako nema dovoljno slika, tema se možda neće uzeti u obzir ili se može uklopiti u kontekst dostavljenih slika. Kada se traži kontekst za čudnu generaciju, događa se ista stvar.
Zaključak
Za proizvodnju izlaza iz jednog unosa teksta, većina modela teksta u sliku zahtijeva milijune parametara i biblioteka.
DreamBooth pojednostavljuje kupnju sadržaja i korištenje za potrošače zahtijevajući samo unos tri do pet tematskih fotografija zajedno s tekstualnom pozadinom.
Ostavi odgovor