မာတိကာ[ဖျောက်][ရှိုး]
ကြီးမားသော စာသားမှ ရုပ်ပုံမော်ဒယ်များသည် ပေးထားသော စာသားစနစ်မှ အရည်အသွေးမြင့်ပြီး ကွဲပြားသော ရုပ်ပုံပေါင်းစပ်ပေါင်းစပ်မှုကို ထုတ်လုပ်ခြင်းဖြင့် AI ၏ ဖွံ့ဖြိုးတိုးတက်မှုတွင် သိသာထင်ရှားသော တိုးတက်မှုကို ရရှိစေပါသည်။
ဤမော်ဒယ်များသည် အမျိုးမျိုးသော ဆက်တင်များတွင် အကြောင်းအရာများ၏ တစ်မူထူးခြားသော ကိုယ်စားပြုမှုများကို ပေါင်းစပ်၍ မရပါ သို့မဟုတ် ပေးထားသော ကိုးကားမှုအစုတွင် ဘာသာရပ်များ၏ အသွင်အပြင်ကို ထပ်တူပွားရန် မဖြစ်နိုင်ပါ။
OpenAI ၏ DALL.E2 သို့မဟုတ် StabilityAI ကဲ့သို့သော အသစ်ထွက်ရှိထားသော နည်းပညာများ တည်ငြိမ်သောပျံ့နှံ့မှု ပြီးတော့ Midjourney က အင်တာနက်ကို မုန်တိုင်းနဲ့ တိုက်နေပြီ။ ရလဒ်များကို စိတ်ကြိုက်ပြင်ဆင်ရန် ယခုအချိန်ဖြစ်သည်။ ဘယ်လိုတုန်း?
Google DreamBooth AI ရောက်ရှိလာပါပြီ။
DreamBooth တွင် ပုံတစ်ပုံ၏အကြောင်းအရာကို မှတ်မိနိုင်ပြီး ၎င်း၏မူရင်းအကြောင်းအရာမှ ကွဲထွက်ကာ ၎င်းကို အလိုရှိသောအကြောင်းအရာအသစ်တစ်ခုအဖြစ် အတိအကျပေါင်းစပ်လုပ်ဆောင်နိုင်စွမ်းရှိသည်။ ထို့အပြင် ၎င်းကို လက်ရှိ AI ရုပ်ပုံထုတ်ပေးသည့် ဂျင်နရေတာများနှင့်လည်း အသုံးပြုနိုင်သည်။
ဤဆောင်းပါးတွင်၊ DreamBooth၊ ၎င်း၏အသုံးပြုမှု၊ သင်ခန်းစာ၊ ကန့်သတ်ချက်များနှင့် အခြားအရာများစွာကို နက်ရှိုင်းစွာကြည့်ရှုပါမည်။
Dreambooth ဆိုတာဘာလဲ။
Dreamboothအသစ်စက်စက် စာသားမှပုံတစ်ပုံသို့ ပျံ့နှံ့မှုပုံစံကို Google မှ တင်ဆက်ခဲ့သည်။ ကွဲပြားသောဆက်တင်များတွင် အသုံးပြုသူရွေးချယ်ထားသောအကြောင်းအရာ၏ ကျယ်ပြန့်သောဓာတ်ပုံများကို ဖန်တီးရန်အတွက် Google DreamBooth AI မှ လမ်းညွှန်ချက်အဖြစ် ရေးသားထားသည့်အမှာစာအား အသုံးပြုနိုင်သည်။
Boston University နှင့် Google တို့မှ သုတေသနအဖွဲ့တစ်ဖွဲ့သည် ကျယ်ပြန့်စွာကြိုတင်လေ့ကျင့်မှုပြုလုပ်ထားသော စာသားမှပုံတစ်ပုံသို့ ပုံတစ်ပုံသို့ပြောင်းလဲခြင်းအတွက် နောက်ဆုံးပေါ်နည်းပညာဖြစ်သော DreamBooth ကို တီထွင်ခဲ့သည်။
ယေဘုယျသဘောတရားသည် ရိုးရှင်းသည်- ၎င်းတို့သည် အသုံးပြုသူများသတ်မှတ်နိုင်သည့် စိတ်ကြိုက်အကြောင်းအရာများနှင့် ဆက်စပ်မှုမရှိသော တိုကင် ID များကို ပုံမှန်မဟုတ်သော တိုကင် ID များဖြစ်သည့် ဘာသာစကားအမြင်အဘိဓာန်ကို တိုးမြှင့်လိုပါသည်။
မော်ဒယ်၏ အဓိကပန်းတိုင်မှာ သုံးစွဲသူများနှင့် ချိတ်ဆက်ရန်ဖြစ်သည်။ စာသားမှပုံသို့ပျံ့နှံ့မှုပုံစံ ၎င်းတို့ကို ရွေးချယ်ထားသော အကြောင်းအရာကိစ္စ၏ သာဓကများ၏ ဓာတ်ပုံများကို လက်တွေ့ဆန်သော ကိုယ်စားပြုမှုများ ထုတ်လုပ်ရန် လိုအပ်သော အရင်းအမြစ်များကို ပေးခြင်းဖြင့် ၎င်းတို့ကို ပေးဆောင်ပါ။
အကျိုးဆက်အနေဖြင့် ဤနည်းပညာသည် အခြေအနေအမျိုးမျိုးရှိ စိန်ခေါ်မှုများကို အကျဉ်းချုပ်ဖော်ပြရန်အတွက် ကောင်းစွာအလုပ်လုပ်ပုံရသည်။
Google ၏ DreamBooth သည် ယခင် text-to-image တူးလ်များနှင့် ကွဲပြားသည်။ DALL-E2, တည်ငြိမ်သောပျံ့နှံ့မှုနှင့် လမ်းလယ်၎င်းသည် အသုံးပြုသူများအား စာသားအခြေခံထည့်သွင်းမှုများကို အသုံးပြု၍ ပျံ့နှံ့မှုပုံစံကို ခြယ်လှယ်ခွင့်မပြုမီ ခေါင်းစဉ်ပုံတစ်ပုံကို ပိုမိုထိန်းချုပ်နိုင်စေပါသည်။
အင်္ဂါရပ်များ
- DreamBooth AI သည် ပုံ 3-5 ပုံပါသော စာသားမှပုံတစ်ပုံသို့ မော်ဒယ်ကို ပိုမိုကောင်းမွန်စေနိုင်သည်။
- မူရင်းဓာတ်ပုံများကို DreamBooth AI ဖြင့် ဖန်တီးနိုင်သည်။
- ထို့အပြင်၊ DreamBooth AI သည် ရှုထောင့်မျိုးစုံမှ အကြောင်းအရာတစ်ခု၏ ဓာတ်ပုံများကို ဖန်တီးနိုင်သည်။
လြှောကျလှာ
အနုပညာပုံစံများ
ဤလုပ်ဆောင်စရာမှာ မူရင်းမြင်ကွင်းသို့ အခြားပုံတစ်ပုံ၏စတိုင်ကို ထည့်သွင်းစဉ်တွင် အရင်းအမြစ်မြင်ကွင်း၏ အဓိပ္ပါယ်ကို ထိန်းသိမ်းပေးသည့် စတိုင်လွှဲပြောင်းခြင်းနှင့် ကွဲပြားသည်။
တီထွင်ဖန်တီးမှုဆိုင်ရာချဉ်းကပ်မှုအပေါ်အခြေခံ၍ AI သည် ခွဲခြားသတ်မှတ်ခြင်းနှင့် ခေါင်းစဉ်အသေးစိတ်အချက်အလက်များကို ထိန်းသိမ်းထားစဉ်တွင် သိသာထင်ရှားသောမြင်ကွင်းပြောင်းလဲမှုများကို ပြီးမြောက်အောင်မြင်စေနိုင်သည်။
အိမ်ခြံမြေ ပြုပြင်မွမ်းမံခြင်း။
ဘာသာရပ်၏ လက္ခဏာရပ်များကို DreamBooth AI ဖြင့် ပြင်ဆင်နိုင်သည်။
ဆက်စပ်ပစ္စည်း
မျိုးဆက်မော်ဒယ်မတိုင်မီ ခိုင်မာသောဖွဲ့စည်းမှုမှာ DreamBooth AI ၏ အရာဝတ္ထုများကို အလှဆင်နိုင်မှုအား အလွန်စိတ်ဝင်စားဖွယ်ဖြစ်စေသည်။
ပြန်လည်ဆက်စပ်မှု
DreamBooth AI သည် လေ့ကျင့်ထားသော စံနမူနာပြဝါကျတစ်ခုအား ထူးခြားသောအမှတ်အသားနှင့် အတန်းအစား နာမ်ပါဝင်သည့် လေ့ကျင့်ထားသောစာကြောင်းတစ်ခုပေးခြင်းဖြင့် ထူးထူးခြားခြားရုပ်ပုံများကို ထုတ်လုပ်နိုင်သည်။
၎င်းသည် အကြောင်းအရာအား ပတ်ဝန်းကျင်ကို ပြောင်းလဲခြင်းထက် ထူးခြားသော၊ ယခင်က မကြားဖူးသော ကိုယ်ဟန်အနေအထားများ၊ ပီပြင်မှုနှင့် မြင်ကွင်းဖွဲ့စည်းပုံဖြင့် ဖန်တီးနိုင်သည်။ လက်တွေ့ဆန်သော ရောင်ပြန်ဟပ်မှုများနှင့် အရိပ်များအပြင် အကြောင်းအရာနှင့် ပတ်ဝန်းကျင်ရှိ အရာဝတ္ထုများကြား အပြန်အလှန်သက်ရောက်မှုများ။
Dreambooth သင်ခန်းစာ
ဤသင်ခန်းစာတွင်၊ ကျွန်ုပ်တို့သည် အောက်ပါအတိုင်းလုပ်ဆောင်ပါမည်။ Google Collab မှတ်စုစာအုပ်ပြီးတော့ မင်းကို နားလည်ပြီး သုံးနိုင်စေမယ့် အဲဒါကို ငါလမ်းပြမယ်။
GPU စနစ်ထည့်သွင်းခြင်းနှင့် စာကြည့်တိုက်များ ထည့်သွင်းခြင်း။
GPU နှင့် VRAM အမျိုးအစားများကို ရှာဖွေခြင်းသည် ပထမအဆင့်ဖြစ်သည်။ လိုအပ်ချက်များနှင့် မှီခိုမှုအနည်းငယ်ကို ထည့်သွင်းရန်လည်း လိုအပ်ပါသည်။ ရိုးရှင်းစွာကစားခလုတ်ကိုနှိပ်ပါ၊ ထို့နောက်ပြီးအောင်စောင့်ပါ။
Huggingface တွင် အကောင့်တစ်ခုဖန်တီးပြီး တိုကင်တစ်ခုထုတ်ပါ။
နောက်တစ်ဆင့်မှာ Huggingface အကောင့်အတွက် စာရင်းသွင်းရန်ဖြစ်သည်။ ပြီးသွားသောအခါ ညာဘက်အပေါ်ထောင့်ရှိ ဆက်တင်များကို နှိပ်ပါ။ နောက်စာမျက်နှာမှာ မင်းရောက်လာလိမ့်မယ်။
ဤနေရာမှ တောင်းဆိုထားသည့်အတိုင်း တိုကင်နှင့် အမည်ကို ဖန်တီးပါ။ တိုကင်ကို အောက်ပါဆဲလ်ရှိ Google collab ထဲသို့ ကူးယူပြီး ကူးထည့်ရပါမည်။
xformers ကို install လုပ်ပါ။
ဤအဆင့်တွင်၊ သင်သည် runtime ကိုနှိပ်ခြင်းဖြင့် xformers ကိုထည့်သွင်းရန် play ခလုတ်ကိုရိုးရှင်းစွာနှိပ်နိုင်သည်။
Drive သို့ ချိတ်ဆက်ပါ။
ယခု၊ သင်သည် google drive သို့ချိတ်ဆက်ရန် ဤဆဲလ်ကို run ရန်သာလိုသည်။
အချက်ပြမှုကို ထည့်သွင်းပါ။
အောက်ပါဆဲလ်တွင်၊ သင်သည် prompt ကိုထည့်သွင်းရန်သာလိုအပ်သည်။
ပုံများတင်ခြင်း။
ဤအဆင့်တွင် သင်လေ့ကျင့်လိုသော ပုံများကို အပ်လုဒ်လုပ်ရန် လိုအပ်ပါသည်။
AI မော်ဒယ်ကို လေ့ကျင့်ပါ။
သင်တင်ပြသော ကိုးကားချက်ဓာတ်ပုံများအားလုံးကို အခြေခံ၍ AI မော်ဒယ်အသစ်တစ်ခုကို လေ့ကျင့်ရန် DreamBooth ကိုအသုံးပြု၍ အရေးကြီးဆုံးအဆင့်ဖြစ်သည်။ ထည့်သွင်းမှုနယ်ပယ်နှစ်ခုတွင် သင်၏အာရုံစိုက်မှုကို ကန့်သတ်ထားရမည်။ “—instance prompt” သည် ပထမဆုံး ကန့်သတ်ချက်ဖြစ်သည်။ ဤနေရာတွင် အလွန်ထူးခြားသော အမည်တစ်ခုကို ပေးရပါမည်။
'–concept list' argument သည် ဒုတိယအရေးကြီးသော ထည့်သွင်းမှုအကွက်ဖြစ်သည်။ 'သတိပေးချက်ကို ပြောင်းလဲခြင်း' ကဏ္ဍတွင် အသုံးပြုထားသည့်အရာနှင့် ကိုက်ညီရန် ၎င်းကို အမည်ပြောင်းရပါမည်။
AI ရုပ်ပုံများကို ဖန်တီးပါ။
ဤအဆင့်တွင် AI ရုပ်ပုံများကို ဖန်တီးမည်ဖြစ်ပြီး၊ သင်သည် စာသားလမ်းညွှန်ချက်များကို ထည့်သွင်းနိုင်သည်။
Dreambooth ကန့်သတ်ချက်များ
- command prompt သည် အသေးစိတ်အချက်များမြင့်မားစွာဖြင့် ခေါင်းစဉ်ကို ထပ်တလဲလဲပြုလုပ်ရန် အတားအဆီးဖြစ်လာသည်။ DreamBooth သည် အကြောင်းအရာ၏ အကြောင်းအရာကို ပြောင်းလဲနိုင်သော်လည်း မော်ဒယ်သည် အကြောင်းအရာကို ကိုယ်တိုင်ပြောင်းလဲလိုပါက၊ frame နှင့် ပြဿနာများရှိနေသည်။
- အခြားပြဿနာမှာ အထွက်ပုံအား input image နှင့် ကျော်လွန်နေခြင်းဖြစ်သည်။ လုံလောက်သောပုံများမရှိပါက အကြောင်းအရာကို ထည့်သွင်းစဉ်းစားမည်မဟုတ်ပါ သို့မဟုတ် တင်ပြထားသောပုံများ၏ ဆက်စပ်အကြောင်းအရာနှင့် ရောနှောသွားနိုင်ပါသည်။ ထူးဆန်းသောမျိုးဆက်တစ်ခုအတွက် အကြောင်းအရာတစ်ခုကို မေးသောအခါ၊ တူညီသောအရာသည် ဖြစ်ပေါ်လာသည်။
ကောက်ချက်
တစ်ခုတည်းသော စာသားထည့်သွင်းမှုမှ အထွက်များထုတ်လုပ်ရန်၊ စာသားမှပုံတစ်ပုံမော်ဒယ်အများစုသည် ကန့်သတ်ဘောင်များနှင့် စာကြည့်တိုက်များ သန်းပေါင်းများစွာ လိုအပ်သည်။
DreamBooth သည် စာသားနောက်ခံဖြင့် ခေါင်းစဉ်ဓာတ်ပုံသုံးပုံမှ ငါးပုံအထိ ထည့်သွင်းရုံဖြင့် သုံးစွဲသူများအတွက် အကြောင်းအရာရယူမှုနှင့် အသုံးပြုမှုကို ရိုးရှင်းစေသည်။
တစ်ဦးစာပြန်ရန် Leave