Dreambooth Tutorial foar begjinners

Table of Contents[Ferstopje][Toanje]

Wat is Dreambooth?
Features
Oanfraach+-
Dreambooth tutorial+-
Dreambooth Beheinings
Konklúzje

Grutte tekst-nei-ôfbyldingsmodellen makken in wichtige foarútgong yn 'e ûntwikkeling fan AI troch it produsearjen fan hege kwaliteit en diversifisearre ôfbyldingssynteze fan in opjûne tekstprompt.

Dizze modellen binne net yn steat om unike foarstellings fan ûnderwerpen yn ferskate ynstellings te syntetisearjen of it uterlik fan ûnderwerpen yn in opjûne referinsjeset te replikearjen.

Nij útbrochte technologyen lykas OpenAI's DALL.E2 of StabilityAI's Stabile Diffusion en Midjourney nimme it ynternet al troch stoarm. It is no tiid om de resultaten oan te passen. Dochs hoe?

Google DreamBooth AI is oankaam.

DreamBooth hat de mooglikheid om it ûnderwerp fan in foto te werkennen, it te dekonstruearjen fan 'e oarspronklike kontekst, en it dan krekt te synthetisearjen yn in nije winske kontekst. Derneist kin it brûkt wurde mei hjoeddeistige AI-ôfbyldingsgenerators.

Yn dit artikel sille wy in djippe blik nimme op DreamBooth, it gebrûk, syn tutorial, syn beheiningen, en folle mear.

Wat is Dreambooth?

dreambooth, in gloednije tekst-nei-ôfbylding diffusion model, waard presintearre troch Google. In skriftlike prompt kin brûkt wurde as begelieding troch Google DreamBooth AI om in breed oanbod fan foto's te generearjen fan it selektearre ûnderwerp fan 'e brûker yn ferskate ynstellings.

In ûndersyksgroep fan Boston University en Google ûntwikkele DreamBooth, in nijsgjirrige technyk foar it feroarjen fan tekst-nei-ôfbylding modellen dy't wiidweidige foaroplieding hawwe ûndergien.

It algemiene konsept is frij rjochtlinich: se wolle it taalfisy-wurdboek sa fergrutsje dat ûngewoane token-ID's wurde assosjeare mei oanpaste ûnderwerpen dy't brûkers kinne definiearje.

It haaddoel fan it model is om brûkers te ferbinen mei de tekst-nei-ôfbylding diffusion model troch har de boarnen te jaan dy't se nedich binne om fotorealistyske foarstellings te produsearjen fan 'e eksimplaren fan har selektearre ûnderwerp.

As gefolch liket dizze technyk goed te wurkjen foar it gearfetten fan útdagings yn in ferskaat oan situaasjes.

Google's DreamBooth ferskilt fan eardere tekst-nei-ôfbylding-ark, lykas DALL-E2, Stabile Diffusion, en midjourney, yn dat it jout brûkers mear kontrôle oer it ûnderwerp ôfbylding foardat se litte se manipulearje it diffusion model mei help fan tekst-basearre ynput.

Features

DreamBooth AI kin in tekst-nei-ôfbyldingsmodel ferbetterje mei 3-5 ôfbyldings.
Orizjinele fotorealistyske foto's kinne wurde makke mei DreamBooth AI.
Derneist kin de DreamBooth AI foto's meitsje fan in ûnderwerp út meardere hoeken.

Oanfraach

Art Renditions

Dizze taak ferskilt spesifyk fan styl oerdracht, dy't hâldt de semantyk fan 'e boarne sêne wylst incorporate de styl fan in oare ôfbylding yn de oarspronklike sêne.

Art Rendition

Op grûn fan 'e kreative oanpak kin de AI signifikante toanielferoarings oanmeitsje, wylst de identifikaasje en spesifikaasjes fan ûnderwerpynstânsjes behâlde.

Eigenskip Modifikaasje

De skaaimerken fan it ûnderwerp eksimplaar kinne wurde wizige troch DreamBooth AI.

Eigenskip Modifikaasje

Accessorization

De sterke komposysje foarôfgeand oan it generaasjemodel is wat it fermogen fan DreamBooth AI makket om objekten sa ynteressant te fersieren.

Accessorization

Rekontekstualisaasje

DreamBooth AI kin ûnderskate ôfbyldings produsearje foar in bepaald ûnderwerpeksimplaar troch in oplaat model in sin te jaan dy't de unike identifier en it klasse haadwurd omfettet.

Rekontekstualisaasje

It kin it ûnderwerp generearje yn unike, earder net te hearren posysjes, artikulaasjes en sênestruktuer ynstee fan de omjouwing te feroarjen. Realistyske refleksjes en skaden, lykas ynteraksjes tusken it ûnderwerp en omlizzende objekten.

Dreambooth tutorial

Yn dizze tutorial sille wy de Google Collab notebook, en ik scil dy trochrinne, dat sil meitsje dat jo begripe en brûk it op jo eigen.

GPU ynstelle en biblioteken ynstallearje

Útfine hokker GPU- en VRAM-soarten beskikber binne is de earste stap. It ynstallearjen fan in pear easken en ôfhinklikens is ek nedich. Druk gewoan op de play-knop, wachtsje dan oant it is foltôge.

GPU ynstelle en biblioteken ynstallearje

Meitsje in akkount op Huggingface en generearje in token

De folgjende stap is registrearje foar in Huggingface-akkount. As jo klear binne, klikje jo op ynstellings yn 'e hoek rjochts boppe. Jo komme op 'e folgjende side.

Hugging Face Token

Meitsje de token en namme lykas hjirwei frege. It token moat wurde kopieare en plakke yn 'e Google-gearwurking yn' e sel hjirûnder.

Token In Google Colab

Ynstallearje xformers

Yn dit stadium kinne jo gewoan op de play-knop drukke om xformers te ynstallearjen troch te klikken op de runtime.

Ynstallearje Xformers

Ferbine mei Drive

No moatte jo dizze sel gewoan útfiere om te ferbinen mei Google Drive.

Ferbine mei Drive

Fier de prompt yn

Yn 'e folgjende sel moatte jo gewoan de prompt ynfiere.

Fier de prompt yn

Ofbyldings uploade

Yn dizze stap moatte jo gewoan de foto's uploade dy't jo wolle traine.

Jo kinne jo ôfbyldings yn dizze sel uploade

Train AI model

Dit is de wichtichste faze, om't jo DreamBooth sille brûke om in nij AI-model te trenen basearre op al jo yntsjinne referinsjefoto's. Jo moatte jo oandacht beheine ta twa ynfierfjilden. "-instance prompt" is de earste parameter. Jo moatte hjir in heul ûnderskate namme opjaan.

It argumint '–concept list' is it twadde krityske ynfierfjild. It moat omneamd wurde om oerien te kommen mei de iene brûkt yn 'e seksje 'Feroarje de prompt'.

Training AI Model

Generearje AI-ôfbyldings

De AI-ôfbyldings sille op dit stadium wurde makke, wêr't jo de tekstynstruksjes kinne ynfiere.

Generearje AI-ôfbyldings

Dreambooth Beheinings

De kommando-prompt wurdt in barriêre foar it meitsjen fan iteraasjes yn it ûnderwerp mei hege graden fan detail. DreamBooth kin de kontekst fan it ûnderwerp feroarje, mar as it model it ûnderwerp sels wizigje wol, binne d'r problemen mei it frame.
In oar probleem is it oerpassen fan de útfierôfbylding nei de ynfierôfbylding. As d'r net genôch foto's binne oanlevere, kin it ûnderwerp net wurde beskôge of kin wurde kombinearre mei de kontekst fan 'e yntsjinne ôfbyldings. As in kontekst foar in ûneven generaasje frege wurdt, bart itselde ding.

Konklúzje

Om útgongen te produsearjen fan ien tekstynfier, fereasket it grutste part fan tekst-nei-ôfbylding modellen miljoenen parameters en bibleteken.

DreamBooth ferienfâldiget oanwinst en gebrûk fan ynhâld foar konsuminten troch allinich de ynfier fan trije oant fiif ûnderwerpfoto's te fereaskje tegearre mei in tekstuele eftergrûn.

Dreambooth Tutorial foar begjinners

Wat is Dreambooth?

Features