Dreambooth Tutoriala hasiberrientzako

Edukien aurkibidea[Ezkutatu][Erakutsi]

Zer da Dreambooth?
Ezaugarriak
Aplikazio+-
Dreambooth tutoriala+-
Dreambooth mugak
Ondorioa

Testutik irudirako eredu handiek aurrerapen nabarmena egin zuten AIaren garapenean, kalitate handiko eta dibertsifikatutako irudien sintesia ekoiztuz, testu jakin batetik.

Eredu hauek ezin dira hainbat esparrutan subjektuen irudikapen bereziak sintetizatu edo erreferentzia multzo jakin batean subjektuen itxura errepikatu.

OpenAI-ren DALL.E2 edo StabilityAI bezalako teknologia kaleratu berriak Difusio egonkorra eta Midjourney-k dagoeneko interneta hartzen ari dira. Orain emaitzak pertsonalizatzeko garaia da. Hala ere, nola?

Google DreamBooth AI iritsi da.

DreamBooth-ek irudi baten gaia ezagutzeko gaitasuna du, jatorrizko testuingurutik deseraikitzeko eta, ondoren, zehatz-mehatz sintetizatzeko nahi den testuinguru berri batean. Gainera, egungo AI irudi-sorgailuekin erabil daiteke.

Artikulu honetan, DreamBooth-i, bere erabilera, bere tutoriala, bere mugak eta askoz gehiago aztertuko ditugu.

Zer da Dreambooth?

amets-kabina, testutik irudira zabaltzeko eredu berri bat aurkeztu zuen Googlek. Google DreamBooth AI-k gida gisa erabil dezake idatzizko gonbita erabiltzailearen aukeratutako gaiaren argazki sorta zabala ezarpen ezberdinetan sortzeko.

Bostoneko Unibertsitateko eta Google-ko ikerketa-talde batek DreamBooth garatu zuen, aurre-prestakuntza handia izan duten testu-irudi ereduak aldatzeko punta-puntako teknika.

Kontzeptu orokorra nahiko sinplea da: hizkuntza-ikuspegiaren hiztegia handitu nahi dute, hala nola, ezohiko token IDak erabiltzaileek defini ditzaketen gai pertsonalizatuekin lotu daitezen.

Ereduaren helburu nagusia erabiltzaileak konektatzea da testutik irudira zabaltzeko eredua hautatutako gaiaren instantzien irudikapen fotorealistak egiteko behar dituzten baliabideak emanez.

Ondorioz, badirudi teknika honek ondo funtzionatzen duela hainbat egoeratan dauden erronkak laburtzeko.

Google-ren DreamBooth aurreko testutik irudirako tresnetatik desberdina da, adibidez DALL-E2, Difusio egonkorra, eta Bidaia erdikoa, izan ere, erabiltzaileei gaiaren irudiaren gaineko kontrol handiagoa ematen die difusio-eredua testuan oinarritutako sarrerak erabiliz manipulatzen utzi aurretik.

Ezaugarriak

DreamBooth AI-k testutik irudirako eredua hobetu dezake 3-5 irudirekin.
Jatorrizko argazki fotorealistak sor daitezke DreamBooth AI-rekin.
Horrez gain, DreamBooth AI-k gai baten argazkiak sor ditzake hainbat angelutatik.

Aplikazio

Artearen errepresentazioak

Zeregin hau estilo-transferentziatik bereizten da, jatorriko eszenaren semantika mantentzen baitu beste irudi baten estiloa jatorrizko eszenan sartzen den bitartean.

Artearen errendimendua

Sormen-ikuspegian oinarrituta, AI-ak eszena-aldaketa esanguratsuak lor ditzake identifikazioa eta gaiaren instantzia zehatzak mantenduz.

Jabetza Aldaketa

Gaiaren instantziaren ezaugarriak DreamBooth AI-k alda ditzake.

Jabetza Aldaketa

Osagarritasuna

Belaunaldi ereduaren aurreko konposizio sendoa da DreamBooth AIren objektuak apaintzeko gaitasuna hain interesgarria egiten duena.

Osagarritasuna

Birkontestualizazioa

DreamBooth AI-k irudi bereizgarriak sor ditzake subjektu-instantzia jakin baterako, trebatutako eredu bati identifikatzaile bakarra eta klase izena biltzen dituen esaldi bat emanez.

Birkontestualizazioa

Ingurua aldatu beharrean jarrera, artikulazio eta eszena-egitura paregabeetan sor ditzake gaia. Gogoeta eta itzal errealistak, baita subjektuaren eta inguruko objektuen arteko elkarrekintzak ere.

Dreambooth tutoriala

Tutorial honetan, hau jarraituko dugu Google Collab koadernoa, eta bertatik ibiliko zaitut, zure kabuz ulertu eta erabiliko zaituena.

GPU konfiguratzea eta liburutegiak instalatzea

GPU eta VRAM motak eskuragarri dauden jakitea da lehen urratsa. Baldintza eta mendekotasun batzuk instalatzea ere beharrezkoa da. Sakatu erreproduzitzeko botoia eta itxaron amaitu arte.

GPU konfiguratzea eta liburutegiak instalatzea

Sortu kontu bat Huggingface-n eta sortu token bat

Hurrengo urratsa Huggingface kontu batean erregistratzea da. Amaitzen duzunean, egin klik ezarpenak goiko eskuineko izkinan. Hurrengo orrialdera iritsiko zara.

Besarkada Aurpegiaren Tokena

Sortu tokena eta izena hemendik eskatu bezala. Tokena kopiatu eta itsatsi behar da beheko gelaxkako Google-ren elkarlanean.

Tokena Google Colab-en

Instalatu xformers

Etapa honetan, erreproduzitzeko botoia sakatu besterik ez duzu xformers instalatzeko, exekuzioan klik eginez.

Instalatu Xformers

Konektatu Drive-ra

Orain, zelula hau exekutatu besterik ez duzu google drive-ra konektatzeko.

Konektatu Drive-ra

Sartu gonbita

Hurrengo gelaxkan, gonbita sartu besterik ez duzu egin behar.

Sartu gonbita

Irudiak igotzen

Urrats honetan, entrenatu nahi dituzun argazkiak igo besterik ez duzu egin behar.

Zelula honetan zure irudiak igo ditzakezu

Tren AI eredua

Fase garrantzitsuena da, DreamBooth erabiliko baituzu bidalitako erreferentziako argazki guztietan oinarritutako AI eredu berri bat trebatzeko. Zure arreta bi sarrera-eremutara mugatu behar duzu. “—instantziaren gonbita” da lehen parametroa. Izen oso bereizia eman behar duzu hemen.

'-kontzeptu zerrenda' argumentua sarrerako bigarren eremu kritikoa da. Izena aldatu behar zaio 'Aldatu gonbita' atalean erabilitakoarekin bat etor dadin.

Prestakuntza AI eredua

Sortu AI irudiak

AI irudiak fase honetan sortuko dira, non testu-argibideak sar ditzakezu.

Sortu AI Irudiak

Dreambooth mugak

Agindu-gonbita oztopo bihurtzen da gaiaren iterazioak xehetasun maila handikoak egiteko. DreamBooth-ek gaiaren testuingurua alda dezake, baina ereduak gaia bera aldatu nahi badu, markoarekin arazoak daude.
Beste arazo bat irteerako irudia sarrerako irudira gehiegi egokitzea da. Irudi nahikorik ez badago, baliteke gaia kontuan ez hartzea edo bidalitako irudien testuinguruarekin nahastea. Belaunaldi bitxi baten testuinguru bat galdetzen denean, gauza bera gertatzen da.

Ondorioa

Testu sarrera bakar batetik irteerak sortzeko, testutik irudirako ereduen gehiengoak milioika parametro eta liburutegi behar ditu.

DreamBooth-ek kontsumitzaileentzako edukia eskuratzea eta erabiltzea errazten du, hiru edo bost gai-argazkiren sarrera besterik ez baitu behar, testu-hondo batekin batera.

Dreambooth Tutoriala hasiberrientzat

Zer da Dreambooth?

Ezaugarriak