Orodha ya Yaliyomo[Ficha][Onyesha]
Miundo mikubwa ya maandishi-hadi-picha ilifanya maendeleo makubwa katika ukuzaji wa AI kwa kutoa usanisi wa picha wa hali ya juu na mseto kutoka kwa haraka ya maandishi.
Miundo hii haiwezi kuunganisha uwakilishi wa kipekee wa masomo katika mipangilio mbalimbali au kuiga mwonekano wa masomo katika seti fulani ya marejeleo.
Teknolojia mpya iliyotolewa kama vile DALL.E2 ya OpenAI au StabilityAI's Usambazaji Imara na Midjourney tayari wanachukua mtandao kwa dhoruba. Sasa ni wakati wa kubinafsisha matokeo. Lakini vipi?
Google DreamBooth AI imefika.
DreamBooth ina uwezo wa kutambua mada ya picha, kuiunda upya kutoka kwa muktadha wake asilia, na kisha kuisasisha kwa muktadha mpya unaohitajika. Zaidi ya hayo, inaweza kutumika na jenereta za picha za AI za sasa.
Katika makala hii, tutaangalia kwa kina DreamBooth, matumizi yake, mafunzo yake, mapungufu yake, na mengi zaidi.
Dreambooth ni nini?
kibanda cha ndoto, muundo mpya kabisa wa uenezaji wa maandishi kwa picha, uliwasilishwa na Google. Kidokezo kilichoandikwa kinaweza kutumika kama mwongozo wa Google DreamBooth AI ili kutoa anuwai ya picha za somo lililochaguliwa na mtumiaji katika mipangilio tofauti.
Kikundi cha utafiti kutoka Chuo Kikuu cha Boston na Google kilitengeneza DreamBooth, mbinu ya kisasa ya kubadilisha miundo ya maandishi hadi picha ambayo imepitia mafunzo ya awali ya kina.
Dhana ya jumla ni moja kwa moja: wanataka kuongeza kamusi ya maono ya lugha hivi kwamba vitambulisho vya tokeni visivyo vya kawaida vinahusishwa na mada maalum ambazo watumiaji wanaweza kufafanua.
Lengo kuu la mfano ni kuunganisha watumiaji kwenye muundo wa uenezaji wa maandishi-hadi-picha kwa kuwapa nyenzo wanazohitaji ili kutoa uwakilishi wa picha halisi wa matukio ya mada walizochagua.
Kwa hivyo, mbinu hii inaonekana kufanya kazi vizuri kwa muhtasari wa changamoto katika anuwai ya hali.
DreamBooth ya Google inatofautiana na zana za awali za kutuma maandishi kwa picha, kama vile DALL-E2, Usambazaji Imara, na Safari ya katikati, kwa kuwa inawapa watumiaji udhibiti zaidi wa picha ya mada kabla ya kuwaruhusu wadhibiti muundo wa uenezaji kwa kutumia viingizi vinavyotegemea maandishi.
Vipengele
- DreamBooth AI inaweza kuboresha muundo wa maandishi-hadi-picha na picha 3-5.
- Picha halisi za upigaji picha zinaweza kuundwa kwa DreamBooth AI.
- Kwa kuongeza, AI ya DreamBooth inaweza kuunda picha za mada kutoka kwa pembe nyingi.
Maombi
Matoleo ya Sanaa
Jukumu hili linatofautiana haswa na uhamishaji wa mtindo, ambao huweka semantiki ya eneo la chanzo huku ikijumuisha mtindo wa picha nyingine kwenye eneo asili.
Kulingana na mbinu ya ubunifu, AI inaweza kufanya mabadiliko makubwa ya eneo huku ikidumisha kitambulisho na maelezo mahususi ya mfano wa mada.
Marekebisho ya Mali
Tabia za mfano wa somo zinaweza kurekebishwa na DreamBooth AI.
Ufikiaji
Utunzi wa nguvu kabla ya mfano wa kizazi ndio hufanya uwezo wa DreamBooth AI wa kupamba vitu kuvutia sana.
Uwekaji upya wa muktadha
DreamBooth AI inaweza kutoa taswira bainifu kwa mfano wa somo fulani kwa kutoa modeli iliyofunzwa sentensi inayojumuisha kitambulishi cha kipekee na nomino ya darasa.
Inaweza kuzalisha mada katika mikao ya kipekee, isiyosikika hapo awali, matamshi, na muundo wa tukio badala ya kubadilisha mazingira. Tafakari ya kweli na vivuli, pamoja na mwingiliano kati ya somo na vitu vinavyozunguka.
Mafunzo ya Dreambooth
Katika somo hili, tutakuwa tukifuata Daftari ya Kushirikiana na Google, nami nitakutembeza ndani yake, ambayo itakufanya uelewe na kuitumia peke yako.
Kuweka GPU na kusakinisha maktaba
Kujua ni aina gani za GPU na VRAM zinapatikana ni hatua ya kwanza. Kufunga mahitaji machache na utegemezi pia ni muhimu. Bonyeza tu kitufe cha kucheza, kisha usubiri imalize.
Fungua akaunti kwenye Huggingface na utengeneze tokeni
Hatua inayofuata ni kujiandikisha kwa akaunti ya Huggingface. Unapomaliza, bofya mipangilio kwenye kona ya juu kulia. Utakuja kwenye ukurasa unaofuata.
Unda ishara na jina kama ulivyoombwa kutoka hapa. Tokeni inapaswa kunakiliwa na kubandikwa kwenye ushirikiano wa Google katika kisanduku kilicho hapa chini.
Sakinisha xformers
Katika hatua hii, unaweza kubofya kitufe cha kucheza ili kusakinisha xformers kwa kubofya wakati wa utekelezaji.
Unganisha kwenye Hifadhi
Sasa, unapaswa tu kuendesha kisanduku hiki ili kuunganisha kwenye hifadhi ya google.
Ingiza kidokezo
Katika kisanduku kifuatacho, lazima uweke kidokezo.
Inapakia picha
Katika hatua hii, lazima tu upakie picha ulizotaka kutoa mafunzo.
Treni AI mfano
Hii ndiyo awamu muhimu zaidi, kwani utakuwa ukitumia DreamBooth kutoa mafunzo kwa muundo mpya wa AI kulingana na picha zako zote za marejeleo zilizowasilishwa. Lazima uweke kikomo umakini wako kwa sehemu mbili za ingizo. "-mfano wa haraka" ndio kigezo cha kwanza. Lazima utoe jina tofauti kabisa hapa.
Hoja ya '–orodha ya dhana' ni sehemu ya pili muhimu ya ingizo. Ni lazima lipewe jina jipya ili lilingane na lile linalotumika katika sehemu ya 'Badilisha kidokezo'.
Tengeneza picha za AI
Picha za AI zitaundwa katika hatua hii, ambapo unaweza kuingiza maagizo ya maandishi.
Mapungufu ya Dreambooth
- Kidokezo cha amri kinakuwa kikwazo cha kufanya marudio katika mada na viwango vya juu vya maelezo. DreamBooth inaweza kubadilisha muktadha wa somo, lakini ikiwa mtindo unataka kubadilisha mada yenyewe, kuna maswala na fremu.
- Suala lingine ni kuzidisha picha ya pato kwa picha ya ingizo. Ikiwa hakuna picha za kutosha zinazotolewa, mada haiwezi kuzingatiwa au inaweza kuunganishwa na muktadha wa picha zilizowasilishwa. Muktadha wa kizazi kisicho cha kawaida unapoulizwa, jambo hilo hilo hufanyika.
Hitimisho
Ili kutoa matokeo kutoka kwa ingizo moja la maandishi, wingi wa miundo ya maandishi hadi picha inahitaji mamilioni ya vigezo na maktaba.
DreamBooth hurahisisha upataji na matumizi ya maudhui kwa watumiaji kwa kuhitaji tu uingizaji wa picha tatu hadi tano za mada pamoja na mandharinyuma.
Acha Reply