Table of Contents[Kache][Montre]
Gwo modèl tèks-a-imaj te fè yon pwogrè enpòtan nan devlopman AI nan pwodwi sentèz foto kalite siperyè ak divèsifye apati yon èd memwa tèks yo bay.
Modèl sa yo pa kapab fè sentèz reprezantasyon inik sijè yo nan divès anviwònman oswa repwodui aparans sijè yo nan yon seri referans bay yo.
Teknoloji ki fèk pibliye tankou DALL.E2 OpenAI oswa StabilityAI Difizyon ki estab ak Midjourney deja pran entènèt la nan tanpèt. Li se kounye a tan yo Customize rezilta yo. Poutan kijan?
Google DreamBooth AI te rive.
DreamBooth gen kapasite pou rekonèt sijè a nan yon foto, dekonstwi li soti nan kontèks orijinal li, ak Lè sa a, presizeman sentèz li nan yon nouvo kontèks vle. Anplis de sa, li ka itilize ak dèlko foto AI aktyèl la.
Nan atik sa a, nou pral pran yon gade byen nan DreamBooth, itilizasyon li yo, leson patikilye li yo, limit li yo, ak plis ankò.
Ki sa ki Dreambooth?
dreambooth, yon mak nouvo modèl difizyon tèks-a-imaj, te prezante pa Google. Google DreamBooth AI ka sèvi ak yon èd memwa ekri kòm konsèy pou jenere yon pakèt foto sou sijè itilizatè a chwazi nan diferan paramèt.
Yon gwoup rechèch ki soti nan Boston University ak Google devlope DreamBooth, yon teknik dènye kri pou chanje modèl tèks-a-imaj ki te sibi anpil pre-fòmasyon.
Konsèp la an jeneral se pito senp: yo vle ogmante diksyonè a lang-vizyon konsa ke idantite siy estraòdinè yo asosye ak sijè koutim ke itilizatè yo ka defini.
Objektif prensipal modèl la se konekte itilizatè yo modèl difizyon tèks-a-imaj lè yo ba yo resous yo bezwen pou pwodwi reprezantasyon fotoreyalis nan ka sijè yo chwazi yo.
Kòm yon konsekans, teknik sa a sanble travay byen pou rezime defi nan yon seri sitiyasyon.
DreamBooth Google a diferan de ansyen zouti tèks-a-imaj, tankou DALL-E2, Difizyon ki estab, epi Midwaye, nan ke li bay itilizatè yo plis kontwòl sou imaj sijè a anvan yo kite yo manipile modèl la difizyon lè l sèvi avèk entrain ki baze sou tèks.
karakteristik
- DreamBooth AI ta ka amelyore yon modèl tèks-a-imaj ak 3-5 imaj.
- Ou ka kreye foto orijinal fotoreyalis ak DreamBooth AI.
- Anplis de sa, DreamBooth AI a ka kreye foto yon sijè nan plizyè ang.
aplikasyon
Rendisyon Atizay
Travay sa a diferan espesyalman de transfè style, ki kenbe semantik sèn sous la pandan y ap enkòpore style yon lòt imaj nan sèn orijinal la.
Ki baze sou apwòch kreyatif la, AI a ka akonpli chanjman enpòtan nan sèn pandan l ap kenbe idantifikasyon ak spesifik sijè a.
Modifikasyon Pwopriyete
DreamBooth AI ka modifye karakteristik egzanp sijè a.
Aksesorizasyon
Konpozisyon fò anvan modèl jenerasyon an se sa ki fè kapasite DreamBooth AI a pou dekore objè yo tèlman enteresan.
Rekontextualizasyon
DreamBooth AI ka pwodui imaj diferan pou yon sèten sijè lè li bay yon modèl ki antrene yon fraz ki gen ladann idantifikasyon inik ak non klas la.
Li ka jenere sijè a nan pwèstans, atikilasyon ak estrikti sèn inik, ki pa janm te janm tande, olye ke chanje anviwònman yo. Refleksyon reyalis ak lonbraj, osi byen ke entèraksyon ant sijè a ak objè ki antoure.
Leson patikilye Dreambooth
Nan leson patikilye sa a, nou pral swiv la Kaye Google Collab, epi mwen pral fè ou pase nan li, ki pral fè ou konprann epi sèvi ak li poukont ou.
Mete kanpe GPU ak enstale bibliyotèk
Chèche konnen ki kalite GPU ak VRAM ki disponib se premye etap la. Enstale kèk kondisyon ak depandans tou nesesè. Senpleman peze bouton jwe a, Lè sa a, tann pou li fini.
Kreye yon kont sou Huggingface epi jenere yon siy
Pwochen etap la se enskri pou yon kont Huggingface. Lè w fini, klike sou paramèt nan kwen anlè dwat. Ou pral rive nan pwochen paj la.
Kreye siy la ak non jan yo mande isit la. Siy la ta dwe kopye epi kole nan kolab Google nan selil ki anba a.
Enstale xformers
Nan etap sa a, ou ka senpleman peze bouton jwe pou enstale xformers pa klike sou ègzekutabl la.
Konekte ak Drive
Koulye a, ou jis oblije kouri selil sa a pou konekte avèk Google Drive.
Antre èd memwa a
Nan selil sa a, ou jis bezwen antre èd memwa a.
Téléchargement foto
Nan etap sa a, ou jis bezwen telechaje foto ou te vle antrene.
Antrene modèl AI
Sa a se faz ki pi enpòtan an, paske w ap itilize DreamBooth pou fòme yon nouvo modèl AI ki baze sou tout foto referans ou voye yo. Ou dwe limite atansyon ou a de jaden antre. "—instance rapid" se premye paramèt la. Ou dwe bay yon non trè diferan isit la.
Agiman '–lis konsèp' la se dezyèm jaden opinyon kritik. Li dwe chanje non pou l matche ak sa ki itilize nan seksyon 'Chanje èd memwa a'.
Jenere imaj AI
Foto AI yo pral kreye nan etap sa a, kote ou ka antre enstriksyon tèks yo.
Dreambooth Limit
- Èd memwa a vin tounen yon baryè pou fè iterasyon nan sijè a ak gwo degre nan detay. DreamBooth ka chanje kontèks sijè a, men si modèl la vle chanje sijè a li menm, gen pwoblèm ak ankadreman an.
- Yon lòt pwoblèm se overfitting foto pwodiksyon an nan imaj la opinyon. Si pa gen ase foto apwovizyone, sijè a pa ka konsidere oswa yo ka melanje ak kontèks la nan imaj yo soumèt. Lè yo mande yon kontèks pou yon jenerasyon enpè, menm bagay la pran plas.
konklizyon
Pou pwodwi rezilta nan yon antre tèks sèl, èstime nan modèl tèks-a-imaj mande pou dè milyon de paramèt ak bibliyotèk.
DreamBooth senplifye akizisyon kontni ak itilizasyon pou konsomatè yo lè li mande jis antre twa a senk foto sijè ansanm ak yon background tèks.
Kite yon Reply