INHOUDSOPGAWE[Versteek][Wys]
Groot teks-na-beeld-modelle het 'n beduidende vooruitgang gemaak in die ontwikkeling van KI deur hoë kwaliteit en gediversifiseerde prentsintese te produseer vanaf 'n gegewe teksopdrag.
Hierdie modelle is nie in staat om unieke voorstellings van onderwerpe in verskeie omgewings te sintetiseer of om die voorkoms van onderwerpe in 'n gegewe verwysingstel te herhaal nie.
Nuut vrygestelde tegnologieë soos OpenAI se DALL.E2 of StabilityAI's Stabiele verspreiding en Midjourney neem reeds die internet storm. Dit is nou tyd om die resultate aan te pas. Maar hoe?
Google DreamBooth AI het aangebreek.
DreamBooth het die vermoë om die onderwerp van 'n prent te herken, dit uit sy oorspronklike konteks te dekonstrueer en dit dan presies te sintetiseer in 'n nuwe gewenste konteks. Daarbenewens kan dit gebruik word met huidige AI-prentopwekkers.
In hierdie artikel gaan ons diep kyk na DreamBooth, die gebruik daarvan, sy tutoriaal, sy beperkings en nog baie meer.
Wat is Dreambooth?
droomhokkie, 'n splinternuwe teks-na-beeld verspreidingsmodel, is deur Google aangebied. 'n Geskrewe versoek kan as leiding deur Google DreamBooth KI gebruik word om 'n wye reeks foto's van die gebruiker se geselekteerde onderwerp in verskillende instellings te genereer.
'n Navorsingsgroep van Boston Universiteit en Google het DreamBooth ontwikkel, 'n voorpunttegniek om teks-na-beeld-modelle te verander wat uitgebreide voorafopleiding ondergaan het.
Die algehele konsep is redelik eenvoudig: hulle wil die taalvisie-woordeboek uitbrei sodat ongewone token-ID's geassosieer word met gepasmaakte onderwerpe wat gebruikers kan definieer.
Die hoofdoel van die model is om gebruikers aan die teks-na-beeld verspreidingsmodel deur hulle die hulpbronne te gee wat hulle nodig het om fotorealistiese voorstellings van die gevalle van hul geselekteerde onderwerp te produseer.
As gevolg hiervan lyk dit of hierdie tegniek goed werk om uitdagings in 'n reeks situasies op te som.
Google se DreamBooth verskil van vorige teks-na-beeld-nutsgoed, soos DALL-E2, Stabiele verspreiding, en middel van die reis, deurdat dit gebruikers meer beheer oor die onderwerpbeeld gee voordat hulle die verspreidingsmodel laat manipuleer deur teksgebaseerde insette te gebruik.
Kenmerke
- DreamBooth AI kan 'n teks-na-beeld-model met 3-5 beelde verbeter.
- Oorspronklike fotorealistiese foto's kan met DreamBooth AI geskep word.
- Boonop kan die DreamBooth AI foto's van 'n onderwerp vanuit verskeie hoeke skep.
Aansoek
Kunsvertonings
Hierdie taak verskil spesifiek van styloordrag, wat die semantiek van die brontoneel behou terwyl die styl van 'n ander beeld in die oorspronklike toneel ingesluit word.
Gebaseer op die kreatiewe benadering, kan die KI beduidende toneelveranderings aanbring, terwyl die identifikasie- en onderwerpgebesonderhede gehandhaaf word.
Eiendomswysiging
Die kenmerke van die onderwerpinstansie kan deur DreamBooth AI gewysig word.
Toebehore
Die sterk komposisie voor die generasiemodel is wat DreamBooth KI se vermoë om voorwerpe te versier so interessant maak.
Herkontekstualisering
DreamBooth AI kan kenmerkende beelde vir 'n sekere onderwerpgeval produseer deur 'n opgeleide model 'n sin te gee wat die unieke identifiseerder en die klasnaamwoord insluit.
Dit kan die onderwerp genereer in unieke, voorheen ongehoorde posture, artikulasies en toneelstruktuur eerder as om die omgewing te verander. Realistiese refleksies en skaduwees, sowel as interaksies tussen die onderwerp en omliggende voorwerpe.
Dreambooth-tutoriaal
In hierdie tutoriaal sal ons die Google Collab-notaboek, en Ek sal jou daardeur lei, wat jou sal laat verstaan en dit op jou eie sal gebruik.
Die opstel van GPU en die installering van biblioteke
Om uit te vind watter soorte GPU en VRAM beskikbaar is, is die eerste stap. Die installering van 'n paar vereistes en afhanklikhede is ook nodig. Druk eenvoudig die speelknoppie en wag dan totdat dit klaar is.
Skep 'n rekening op Huggingface en genereer 'n teken
Die volgende stap is om vir 'n Huggingface-rekening te registreer. Wanneer jy klaar is, klik instellings in die regter boonste hoek. Jy sal op die volgende bladsy aankom.
Skep die teken en naam soos versoek van hier af. Die teken moet gekopieer en in die Google-samewerking in die sel hieronder geplak word.
Installeer xformers
In hierdie stadium kan jy eenvoudig op die speelknoppie druk om xformers te installeer deur op die looptyd te klik.
Koppel aan Drive
Nou hoef jy net hierdie sel te laat loop om aan Google Drive te koppel.
Voer die prompt in
In die volgende sel hoef jy net die prompt in te voer.
Laai foto's op
In hierdie stap hoef jy net die prente op te laai wat jy wou oplei.
Trein AI-model
Dit is die belangrikste fase, aangesien jy DreamBooth sal gebruik om 'n nuwe KI-model op te lei gebaseer op al jou voorgelê verwysingsfoto's. Jy moet jou aandag beperk tot twee invoervelde. “—instance prompt” is die eerste parameter. Jy moet 'n baie duidelike naam hier verskaf.
Die '–konseplys'-argument is die tweede kritieke invoerveld. Dit moet hernoem word om te pas by die een wat in die 'Verander die boodskap'-afdeling gebruik word.
Genereer AI-beelde
Die KI-prente sal op hierdie stadium geskep word, waar jy die teksinstruksies kan invoer.
Dreambooth-beperkings
- Die opdragprompt word 'n hindernis vir die maak van herhalings in die onderwerp met hoë grade van detail. DreamBooth kan die onderwerp se konteks verander, maar as die model die onderwerp self wil verander, is daar probleme met die raam.
- Nog 'n probleem is om die uitsetprent by die invoerbeeld te oorpas. As daar nie genoeg prente verskaf word nie, kan die onderwerp dalk nie oorweeg word nie of kan dit gemeng word met die konteks van die ingestuurde prente. Wanneer 'n konteks vir 'n vreemde generasie gevra word, vind dieselfde plaas.
Gevolgtrekking
Om uitsette van 'n enkele teksinvoer te produseer, benodig die meeste teks-na-beeld-modelle miljoene parameters en biblioteke.
DreamBooth vereenvoudig die verkryging en gebruik van inhoud vir verbruikers deur slegs die insette van drie tot vyf onderwerpfoto's te vereis tesame met 'n tekstuele agtergrond.
Lewer Kommentaar