Edukien aurkibidea[Ezkutatu][Erakutsi]
Testutik irudirako eredu handiek aurrerapen nabarmena egin zuten AIaren garapenean, kalitate handiko eta dibertsifikatutako irudien sintesia ekoiztuz, testu jakin batetik.
Eredu hauek ezin dira hainbat esparrutan subjektuen irudikapen bereziak sintetizatu edo erreferentzia multzo jakin batean subjektuen itxura errepikatu.
OpenAI-ren DALL.E2 edo StabilityAI bezalako teknologia kaleratu berriak Difusio egonkorra eta Midjourney-k dagoeneko interneta hartzen ari dira. Orain emaitzak pertsonalizatzeko garaia da. Hala ere, nola?
Google DreamBooth AI iritsi da.
DreamBooth-ek irudi baten gaia ezagutzeko gaitasuna du, jatorrizko testuingurutik deseraikitzeko eta, ondoren, zehatz-mehatz sintetizatzeko nahi den testuinguru berri batean. Gainera, egungo AI irudi-sorgailuekin erabil daiteke.
Artikulu honetan, DreamBooth-i, bere erabilera, bere tutoriala, bere mugak eta askoz gehiago aztertuko ditugu.
Zer da Dreambooth?
amets-kabina, testutik irudira zabaltzeko eredu berri bat aurkeztu zuen Googlek. Google DreamBooth AI-k gida gisa erabil dezake idatzizko gonbita erabiltzailearen aukeratutako gaiaren argazki sorta zabala ezarpen ezberdinetan sortzeko.
Bostoneko Unibertsitateko eta Google-ko ikerketa-talde batek DreamBooth garatu zuen, aurre-prestakuntza handia izan duten testu-irudi ereduak aldatzeko punta-puntako teknika.
Kontzeptu orokorra nahiko sinplea da: hizkuntza-ikuspegiaren hiztegia handitu nahi dute, hala nola, ezohiko token IDak erabiltzaileek defini ditzaketen gai pertsonalizatuekin lotu daitezen.
Ereduaren helburu nagusia erabiltzaileak konektatzea da testutik irudira zabaltzeko eredua hautatutako gaiaren instantzien irudikapen fotorealistak egiteko behar dituzten baliabideak emanez.
Ondorioz, badirudi teknika honek ondo funtzionatzen duela hainbat egoeratan dauden erronkak laburtzeko.
Google-ren DreamBooth aurreko testutik irudirako tresnetatik desberdina da, adibidez DALL-E2, Difusio egonkorra, eta Bidaia erdikoa, izan ere, erabiltzaileei gaiaren irudiaren gaineko kontrol handiagoa ematen die difusio-eredua testuan oinarritutako sarrerak erabiliz manipulatzen utzi aurretik.
Ezaugarriak
- DreamBooth AI-k testutik irudirako eredua hobetu dezake 3-5 irudirekin.
- Jatorrizko argazki fotorealistak sor daitezke DreamBooth AI-rekin.
- Horrez gain, DreamBooth AI-k gai baten argazkiak sor ditzake hainbat angelutatik.
Aplikazio
Artearen errepresentazioak
Zeregin hau estilo-transferentziatik bereizten da, jatorriko eszenaren semantika mantentzen baitu beste irudi baten estiloa jatorrizko eszenan sartzen den bitartean.
Sormen-ikuspegian oinarrituta, AI-ak eszena-aldaketa esanguratsuak lor ditzake identifikazioa eta gaiaren instantzia zehatzak mantenduz.
Jabetza Aldaketa
Gaiaren instantziaren ezaugarriak DreamBooth AI-k alda ditzake.
Osagarritasuna
Belaunaldi ereduaren aurreko konposizio sendoa da DreamBooth AIren objektuak apaintzeko gaitasuna hain interesgarria egiten duena.
Birkontestualizazioa
DreamBooth AI-k irudi bereizgarriak sor ditzake subjektu-instantzia jakin baterako, trebatutako eredu bati identifikatzaile bakarra eta klase izena biltzen dituen esaldi bat emanez.
Ingurua aldatu beharrean jarrera, artikulazio eta eszena-egitura paregabeetan sor ditzake gaia. Gogoeta eta itzal errealistak, baita subjektuaren eta inguruko objektuen arteko elkarrekintzak ere.
Dreambooth tutoriala
Tutorial honetan, hau jarraituko dugu Google Collab koadernoa, eta bertatik ibiliko zaitut, zure kabuz ulertu eta erabiliko zaituena.
GPU konfiguratzea eta liburutegiak instalatzea
GPU eta VRAM motak eskuragarri dauden jakitea da lehen urratsa. Baldintza eta mendekotasun batzuk instalatzea ere beharrezkoa da. Sakatu erreproduzitzeko botoia eta itxaron amaitu arte.
Sortu kontu bat Huggingface-n eta sortu token bat
Hurrengo urratsa Huggingface kontu batean erregistratzea da. Amaitzen duzunean, egin klik ezarpenak goiko eskuineko izkinan. Hurrengo orrialdera iritsiko zara.
Sortu tokena eta izena hemendik eskatu bezala. Tokena kopiatu eta itsatsi behar da beheko gelaxkako Google-ren elkarlanean.
Instalatu xformers
Etapa honetan, erreproduzitzeko botoia sakatu besterik ez duzu xformers instalatzeko, exekuzioan klik eginez.
Konektatu Drive-ra
Orain, zelula hau exekutatu besterik ez duzu google drive-ra konektatzeko.
Sartu gonbita
Hurrengo gelaxkan, gonbita sartu besterik ez duzu egin behar.
Irudiak igotzen
Urrats honetan, entrenatu nahi dituzun argazkiak igo besterik ez duzu egin behar.
Tren AI eredua
Fase garrantzitsuena da, DreamBooth erabiliko baituzu bidalitako erreferentziako argazki guztietan oinarritutako AI eredu berri bat trebatzeko. Zure arreta bi sarrera-eremutara mugatu behar duzu. “—instantziaren gonbita” da lehen parametroa. Izen oso bereizia eman behar duzu hemen.
'-kontzeptu zerrenda' argumentua sarrerako bigarren eremu kritikoa da. Izena aldatu behar zaio 'Aldatu gonbita' atalean erabilitakoarekin bat etor dadin.
Sortu AI irudiak
AI irudiak fase honetan sortuko dira, non testu-argibideak sar ditzakezu.
Dreambooth mugak
- Agindu-gonbita oztopo bihurtzen da gaiaren iterazioak xehetasun maila handikoak egiteko. DreamBooth-ek gaiaren testuingurua alda dezake, baina ereduak gaia bera aldatu nahi badu, markoarekin arazoak daude.
- Beste arazo bat irteerako irudia sarrerako irudira gehiegi egokitzea da. Irudi nahikorik ez badago, baliteke gaia kontuan ez hartzea edo bidalitako irudien testuinguruarekin nahastea. Belaunaldi bitxi baten testuinguru bat galdetzen denean, gauza bera gertatzen da.
Ondorioa
Testu sarrera bakar batetik irteerak sortzeko, testutik irudirako ereduen gehiengoak milioika parametro eta liburutegi behar ditu.
DreamBooth-ek kontsumitzaileentzako edukia eskuratzea eta erabiltzea errazten du, hiru edo bost gai-argazkiren sarrera besterik ez baitu behar, testu-hondo batekin batera.
Utzi erantzun bat