Table of Contents[Veşartin][Rêdan]
Modelên mezin ên nivîs-bi-wêne di pêşkeftina AI-ê de bi hilberandina hevsengiya wêneya bi kalîte û cihêreng ji bilezek nivîsê de pêşkeftinek girîng çêkir.
Van modelan nikaribin nûneratiyên yekta yên mijaran di mîhengên cihêreng de sentez bikin an jî xuyangiya mijaran di komek referansek diyar de dubare bikin.
Teknolojiyên nû hatine berdan mîna OpenAI's DALL.E2 an StabilityAI's Belavbûna Stable û Midjourney berê xwe didin înternetê. Naha dem e ku meriv encaman xweş bike. Lêbelê çawa?
Google DreamBooth AI hat.
DreamBooth xwedan şiyana ku mijara wêneyek nas bike, wê ji çarçoweya wê ya orîjînal veqetîne, û dûv re bi rastî wê di nav çarçoveyek nû ya xwestî de sentez bike. Wekî din, ew dikare bi jeneratorên wêneya AI-ya heyî re were bikar anîn.
Di vê gotarê de, em ê li DreamBooth, karanîna wê, dersa wê, tixûbên wê, û hêj bêtir hûrguliyek kûr bibînin.
Dreambooth çi ye?
dreambooth, modela belavbûna nivîs-bi-wêne ya nû, ji hêla Google ve hate pêşkêş kirin. Serlêdanek nivîskî dikare ji hêla Google DreamBooth AI-ê ve wekî rêbernameyek were bikar anîn da ku di mîhengên cihêreng de wêneyek berfireh a mijara hilbijartî ya bikarhêner biafirîne.
Komek lêkolînê ji Zanîngeha Boston û Google DreamBooth, teknîkek pêşkeftî ya ji bo guheztina modêlên nivîs-to-image ku di pêş-perwerdeya berfireh de derbas bûne, pêşve xistin.
Têgeha giştî pir sade ye: ew dixwazin ferhenga ziman-vîzyonê zêde bikin ku nasnameyên nîşanker ên nenas bi mijarên xwerû yên ku bikarhêner dikarin pênase bikin ve girêdayî bin.
Armanca sereke ya modelê girêdana bikarhêneran e modela belavkirina nivîs-bi-image bi dayîna wan çavkaniyên ku ew hewce ne ji bo hilberandina temsîlên fotorealîst ên mînakên mijara xwe ya hilbijartî.
Wekî encamek, ev teknîk xuya dike ku ji bo kurtkirina pirsgirêkan di gelek rewşan de baş dixebite.
DreamBooth-a Google-ê ji amûrên berê yên nivîs-bi-image cuda ye, wek mînak DALL-E2, Belavbûna Stable, û midjourney, ji ber ku ew bêtir kontrolê dide bikarhêneran li ser wêneyê mijarê berî ku ew bihêle ku modela belavbûnê bi karanîna têketinên-based nivîsê manîpule bikin.
Features
- Dibe ku DreamBooth AI bi 3-5 wêneyan modelek nivîs-bi-image çêtir bike.
- Wêneyên fotorealîst ên orjînal dikarin bi DreamBooth AI-ê werin afirandin.
- Wekî din, DreamBooth AI dikare wêneyên mijarek ji gelek aliyan ve biafirîne.
Bikaranînî
Huner Renditions
Ev peywir bi taybetî ji veguheztina şêwazê cûda dibe, ku semantîka dîmena çavkaniyê digire dema ku şêwaza wêneyek din di dîmena orjînal de vedigire.
Li ser bingeha nêzîkatiya afirîner, AI dikare guheztinên dîmenê yên girîng pêk bîne dema ku nasname û taybetîyên mînaka mijarê diparêze.
Guhertina Taybetmendiyê
Taybetmendiyên mînaka mijarê dikare ji hêla DreamBooth AI-ê ve were guheztin.
Accessorization
Kompozîsyona bihêz a beriya modela nifşê tiştê ku şiyana DreamBooth AI-ê ya xemilandina tiştan ew qas balkêş dike.
Recontextualization
DreamBooth AI dikare wêneyên cihêreng ji bo mînakek mijarek diyar çêbike bi dayîna modelek perwerdekirî hevokek ku nasnameya yekta û navdêra polê vedihewîne.
Ew dikare li şûna guheztina hawîrdorê, mijarê di pozîsyonên bêhempa, berê nebihîstî, ravekirin û avahiya dîmenê de biafirîne. Nêrîn û sîwanên realîst, û her weha danûstendinên di navbera mijar û tiştên derdorê de.
tutorial Dreambooth
Di vê tutoriyê de, em ê bişopînin Deftera Google Collab, û ez ê bi we re bimeşim, ku hûn ê wê bi tena serê xwe fêm bikin û bikar bînin.
Sazkirina GPU û sazkirina pirtûkxaneyan
Fêrbûna ka çi cûreyên GPU û VRAM hene gava yekem e. Sazkirina çend hewcedarî û pêwendiyan jî pêwîst e. Tenê bişkoja lîstikê bikirtînin, dûv re li bendê bimînin ku ew biqede.
Li ser Huggingface hesabek çêbikin û tokenek çêbikin
Pêngava paşîn qeydkirina hesabek Huggingface ye. Dema ku we qediya, li quncikê jorê rastê mîhengan bikirtînin. Hûn ê bigihîjin rûpela din.
Nîşan û navê ku ji vir tê xwestin biafirînin. Pêdivî ye ku token di hucreya jêrîn de di nav hevalbendiya Google de were kopî kirin û pêve kirin.
Xformers saz bikin
Di vê qonaxê de, hûn dikarin bi tenê bişkoja lîstikê bikirtînin da ku xformers bi tikandina li ser dema xebitandinê saz bikin.
Girêdana Drive
Naha, hûn tenê hewce ne ku vê hucreyê bimeşînin da ku bi ajokera google-ê ve girêbidin.
Serlêdanê binivîse
Di hucreya jêrîn de, hûn tenê hewce ne ku têkevin daxwaznameyê.
Barkirina wêneyan
Di vê gavê de, hûn tenê hewce ne ku wêneyên ku we dixwest perwerde bikin dakêşin.
Modela AI-ê perwerde bikin
Ev qonaxa herî girîng e, ji ber ku hûn ê DreamBooth-ê bikar bînin da ku modelek nû ya AI-ê li ser bingeha hemî wêneyên referansa weyên radestkirî perwerde bikin. Divê hûn bala xwe bi du qadên têketinê ve sînordar bikin. "-nimûne prompt" parametreya yekem e. Divê hûn li vir navek pir cihêreng peyda bikin.
Argumana '–lîsteya têgînê' duyemîn qada têketina krîtîk e. Pêdivî ye ku navê wê were guheztin da ku bi ya ku di beşa 'Destpêkê biguherîne' de hatî bikar anîn li hev bike.
Wêneyên AI-ê çêbikin
Wêneyên AI-ê dê di vê qonaxê de bêne afirandin, ku hûn dikarin rêwerzên nivîsê têkevin.
Sînorên Dreambooth
- Serlêdana fermanê dibe astengek ji bo dubarekirina di mijarê de bi dereceyên bilind ên hûrgulî. DreamBooth dikare çarçoweya mijarê biguherîne, lê heke model bixwaze mijarê bixwe biguhezîne, di çarçoveyê de pirsgirêk hene.
- Pirsgirêkek din zêdekirina wêneya derketinê li ser wêneya têketinê ye. Ger wêneyên têr nehatine peyda kirin, dibe ku mijar neyê hesibandin an jî bi çarçoweya wêneyên hatine şandin re were tevlihev kirin. Dema ku çarçoveyek ji bo nifşek xerîb tê pirsîn, heman tişt pêk tê.
Xelasî
Ji bo hilberandina encam ji yek têketina nivîsê, piraniya modelên nivîs-bi-wêne bi mîlyonan parametre û pirtûkxane hewce dike.
DreamBooth wergirtina naverokê û karanîna ji bo xerîdaran hêsan dike û bi hewcedariya têketina sê-pênc wêneyên mijarê bi hev re bi paşxaneyek nivîsê re hewce dike.
Leave a Reply