ယေဘုယျအားဖြင့်၊ GANs၊ VAEs နှင့် autoregressive မော်ဒယ်များကဲ့သို့ နက်နဲသော မျိုးဆက်သစ်မော်ဒယ်များသည် ရုပ်ပုံပေါင်းစပ်မှုဆိုင်ရာ ပြဿနာများကို ကိုင်တွယ်ဖြေရှင်းပါသည်။
၎င်းတို့ဖန်တီးသည့် ဒေတာအရည်အသွေးမြင့်မားမှုကြောင့် မျိုးဆက်ပွားဆန့်ကျင်ဘက်ကွန်ရက်များ (GANs) သည် မကြာသေးမီနှစ်များအတွင်း အာရုံစိုက်မှုများစွာရရှိခဲ့သည်။
Diffusion မော်ဒယ်များသည် သူ့ဘာသာသူ တည်ထောင်ထားသည့် နောက်ထပ် စိတ်ဝင်စားဖွယ် လေ့လာမှုနယ်ပယ်တစ်ခုဖြစ်သည်။ ရုပ်ပုံ၊ ဗီဒီယိုနှင့် အသံထုတ်လုပ်ခြင်းနယ်ပယ်နှစ်ခုစလုံးသည် ၎င်းတို့နှစ်ဦးစလုံးအတွက် ကျယ်ကျယ်ပြန့်ပြန့်အသုံးပြုသည်ကို တွေ့ရှိရသည်။
Diffusion မော်ဒယ်များနှင့် GANs- ပိုမိုကောင်းမွန်သောရလဒ်များကို မည်သည့်အရာက ထုတ်ပေးသနည်း။ ပုံမှန်အားဖြင့်၊ ဤအရာသည် ဆက်လက်ဆွေးနွေးမှုဆီသို့ ဦးတည်သွားခဲ့သည်။
GAN ဟုခေါ်သော တွက်ချက်မှုဆိုင်ရာ ဗိသုကာလက်ရာတွင်၊ နှစ်ခု အာရုံကြောကွန်ရက်များ စစ်မှန်သော ဒေတာကို ဖြတ်သန်းနိုင်သည့် ဒေတာအသစ် ပေါင်းစပ်ထားသော သာဓကများကို ထုတ်လုပ်ရန် အချင်းချင်း တိုက်ခိုက်ကြသည်။
ဂီတနှင့် ဂရပ်ဖစ်ထုတ်လုပ်ခြင်းအတွက် လေ့ကျင့်ရေးတည်ငြိမ်မှုနှင့် မြင့်မားသောရလဒ်များကို ပေးစွမ်းသောကြောင့် Diffusion မော်ဒယ်များသည် ပို၍နာမည်ကြီးလာပါသည်။
ဤဆောင်းပါးသည် diffusion model နှင့် GANs များအပြင် ၎င်းတို့တစ်ခုနှင့်တစ်ခု မည်သို့ကွာခြားပုံနှင့် အခြားအရာအချို့ကို အသေးစိတ်ဖော်ပြပါမည်။
ဒါဆို Generative Adversarial Networks တွေက ဘာတွေလဲ။
စစ်မှန်သောဒေတာအတွက် လွဲမှားနိုင်သော အတုအယောင် အချက်အလက်အသစ်များကို ဖန်တီးရန်အတွက်၊ မျိုးဆက်ပွားရန်ဘက်ကွန်ရက်များ (GANs) သည် အာရုံကြောကွန်ရက်နှစ်ခုကို အသုံးပြုကာ ၎င်းတို့ကို တစ်ခုနှင့်တစ်ခု ဆန့်ကျင်ဘက်ပြုခြင်း (ထို့ကြောင့် “ရန်ဘက်ပြုသူ” ဟု အမည်တွင်သည်)။
၎င်းတို့ကို စကားပြော၊ ဗီဒီယိုနှင့် ရုပ်ပုံဖန်တီးမှုများအတွက် အကျယ်တဝင့် အသုံးပြုထားသည်။
GAN ၏ ရည်ရွယ်ချက်မှာ တိကျသောဒေတာအတွဲတစ်ခုမှ ယခင်က မရှာဖွေရသေးသောဒေတာကို ဖန်တီးရန်ဖြစ်သည်။ နမူနာများမှ အမှန်တကယ် အမည်မသိသော အရင်းခံဒေတာဖြန့်ဖြူးမှု၏ စံနမူနာတစ်ခုအား ရည်ညွှန်းရန် ကြိုးစားခြင်းသည် ၎င်းကို လုပ်ဆောင်သည်။
တနည်းအားဖြင့်ဆိုရသော်၊ ဤကွန်ရက်များသည် တိကျသောစာရင်းအင်းခွဲဝေမှုကို လေ့လာရန် ကြိုးစားသည့် သွယ်ဝိုက်သောပုံစံများဖြစ်သည်။
ဤရည်ရွယ်ချက်ကို ပြီးမြောက်အောင်ရှာဖွေရန် GAN သုံးသောနည်းလမ်းသည် ဆန်းသစ်ပါသည်။ အမှန်မှာ၊ ၎င်းတို့သည် သွယ်ဝိုက်သောပုံစံကို ဖော်ဆောင်ရန်အတွက် ဂိမ်းနှစ်ခုကစားခြင်းဖြင့် ဒေတာများကို ထုတ်လုပ်ပါသည်။
အောက်တွင်ဖော်ပြထားသောဖွဲ့စည်းပုံမှာဖော်ပြထားသည်:
- ဒေတာအစစ်အမှန်နှင့် အတုအယောင်များကို ခွဲခြားသိမြင်နိုင်သော ခွဲခြားဆက်ဆံမှုတစ်ခု
- ဒေတာဖန်တီးရန် နည်းလမ်းအသစ်များကို ကောက်ယူသည့် ဂျင်နရေတာသည် ခွဲခြားဆက်ဆံသူကို လှည့်စားနိုင်သည်။
ခွဲခြားဆက်ဆံသူသည် မသေခင်ကွန်ရက်တစ်ခုအဖြစ် ရပ်တည်သည်။ ထို့ကြောင့်၊ ဂျင်နရေတာသည် ၎င်းကိုလှည့်စားရန် အရည်အသွေးမြင့် ရုပ်ပုံတစ်ပုံကို ဖန်တီးရန် လိုအပ်သည်။
ဤဂျင်နရေတာများကို မည်သည့်အထွက်ဖြန့်ဝေမှုကိုမဆို အသုံးပြု၍ လေ့ကျင့်မသင်ကြားရခြင်းသည် autoencoder မော်ဒယ်များနှင့် အခြားမော်ဒယ်များကြား သိသာထင်ရှားသော ခြားနားမှုတစ်ခုဖြစ်သည်။
မော်ဒယ်၏ ဆုံးရှုံးမှုလုပ်ဆောင်ချက်ကို ချေဖျက်ရန် နည်းလမ်းနှစ်ခုရှိသည်။
- ခွဲခြားဆက်ဆံသူသည် အချက်အလက်အစစ်အမှန်ကို တိကျစွာကြိုမြင်ပါက အရေအတွက်ကို တွက်ချက်နိုင်စွမ်းရှိသည်။
- ထုတ်ပေးထားသော အချက်အလက်ကို အပိုင်းတစ်ခုဖြင့် တိကျစွာ ခန့်မှန်းပါသည်။
အကောင်းဆုံးဖြစ်နိုင်ချေရှိသော ခွဲခြားဆက်ဆံမှုတွင်၊ ဤဆုံးရှုံးမှုလုပ်ဆောင်ချက်ကို လျှော့ချလိုက်သည်-
ထို့ကြောင့် ယေဘူယျ မော်ဒယ်များကို အကွာအဝေး လျှော့ချခြင်း မော်ဒယ်များဟု ယူဆနိုင်ပြီး၊ ခွဲခြားဆက်ဆံသူသည် စံပြဖြစ်ပါက၊ အစစ်အမှန်နှင့် ထုတ်လုပ်သော ဖြန့်ဖြူးမှုကြား ကွဲပြားမှု နည်းပါးသွားခြင်းကဲ့သို့ ခွဲခြားဆက်ဆံခြင်းမှာ စံပြဖြစ်လျှင်။
လက်တွေ့တွင်၊ မတူညီသော ကွဲလွဲမှုများကို အသုံးချနိုင်ပြီး GAN လေ့ကျင့်ရေးနည်းလမ်းများစွာကို ဖြစ်ပေါ်စေနိုင်သည်။
ဂျင်နရေတာနှင့် ခွဲခြားဆက်ဆံသူကြား အပေးအယူတစ်ခုပါ၀င်သည့် သင်ယူမှုဒိုင်းနမစ်များသည် GAN များ၏ ဆုံးရှုံးမှုလုပ်ဆောင်ချက်ကို ချိန်ညှိရန် ရိုးရှင်းသော်လည်း လိုက်နာရန် ခက်ခဲနေပါသည်။
သင်ယူမှုပေါင်းစည်းမည်ဟု အာမခံချက်မရှိပါ။ ရလဒ်အနေဖြင့်၊ GAN မော်ဒယ်ကို လေ့ကျင့်ခြင်းသည် ခက်ခဲသည်၊ အဘယ်ကြောင့်ဆိုသော် gradient များ ပျောက်ကွယ်သွားခြင်းနှင့် မုဒ်ပြိုကွဲခြင်း (ထုတ်လုပ်ထားသော နမူနာများတွင် ကွဲပြားမှုမရှိသောအခါ) ကဲ့သို့သော ပြဿနာများကို ဖြတ်ကျော်ရန် ခက်ခဲပါသည်။
အခုတော့ Diffusion Models တွေအတွက် အချိန်ရောက်ပါပြီ။
GANs ၏လေ့ကျင့်ရေးပေါင်းစည်းခြင်းဆိုင်ရာပြဿနာကို diffusion မော်ဒယ်များဖွံ့ဖြိုးတိုးတက်ရေးမှတဆင့်ဖြေရှင်းခဲ့သည်။
ဤမော်ဒယ်များသည် ပျံ့နှံ့မှုဖြစ်စဉ်သည် ဆူညံသံ၏ တိုးတက်ဝင်ရောက်စွက်ဖက်မှုကြောင့် ဖြစ်ပေါ်လာသော သတင်းဆုံးရှုံးမှုနှင့် ညီမျှသည်ဟု ယူဆသည် (ပျံ့နှံ့မှုဖြစ်စဉ်၏ အချိန်တိုင်းတွင် gaussian ဆူညံသံကို ထည့်သွင်းသည်)။
ထိုကဲ့သို့သောမော်ဒယ်၏ရည်ရွယ်ချက်မှာနမူနာတွင်ပါရှိသောအချက်အလက်များကိုဆူညံသံအပေါ်မည်သို့အကျိုးသက်ရောက်သည်ကိုဆုံးဖြတ်ရန်ဖြစ်သည် သို့မဟုတ်၊ အခြားနည်းဖြင့်ပြောရလျှင်၊ ပျံ့နှံ့မှုကြောင့်သတင်းအချက်အလက်မည်မျှဆုံးရှုံးသွားသည်ကိုဆုံးဖြတ်ရန်ဖြစ်သည်။
မော်ဒယ်တစ်ခုက ဒါကို အဖြေရှာနိုင်ရင် မူရင်းနမူနာကို ပြန်လည်ရယူပြီး ဖြစ်ပေါ်လာတဲ့ အချက်အလက်ဆုံးရှုံးမှုကို ပြန်ပြင်နိုင်ရပါမယ်။
၎င်းသည် denoising diffusion ပုံစံဖြင့် ပြီးမြောက်သည်။ ရှေ့သို့ပျံ့နှံ့ခြင်းလုပ်ငန်းစဉ်နှင့် ပြောင်းပြန်ပျံ့နှံ့ခြင်းလုပ်ငန်းစဉ်သည် အဆင့်နှစ်ဆင့်ဖြစ်သည်။
forward diffusion process တွင် data သည် noise လုံးဝညစ်ညမ်းသွားသည်အထိ Gaussian noise (ဆိုလိုသည်မှာ diffusion process) ပါ၀င်သည်။
ဆူညံသံကို ပြောင်းပြန်လှန်ရန် အခြေအနေဆိုင်ရာ ဖြန့်ဖြူးမှုဖြစ်နိုင်ခြေကို လေ့လာရန် အာရုံကြောကွန်ရက်အား နောက်ပြန်လှည့်ပျံ့သည့်နည်းလမ်းကို အသုံးပြု၍ လေ့ကျင့်သင်ကြားပေးသည်။
ဤနေရာတွင် သင်အကြောင်းပိုမိုနားလည်နိုင်သည်။ ပျံ့နှံ့မှုပုံစံ.
Diffusion Model Vs GANs
ပျံ့နှံ့မှုပုံစံကဲ့သို့ပင်၊ GAN များသည် ဆူညံသံများမှ ပုံများကို ထုတ်လုပ်သည်။
မော်ဒယ်ကို အတန်းအညွှန်း သို့မဟုတ် စာသားကုဒ်သွင်းခြင်းကဲ့သို့ အချို့သော သတင်းအချက်အလတ်ပေးသည့် ပြောင်းလဲမှုမျိုး၏ ဆူညံသံဖြင့် စတင်သည့် ဂျင်နရေတာ အာရုံကြောကွန်ရက်ဖြင့် ဖွဲ့စည်းထားသည်။
ထို့နောက် ရလဒ်သည် လက်တွေ့ဆန်သော ရုပ်ပုံနှင့် ဆင်တူသည့် အရာဖြစ်သင့်သည်။
ဓါတ်ပုံလက်တွေ့ဆန်ပြီး သစ္စာရှိမှုမြင့်မားသော ရုပ်ပုံမျိုးဆက်များကို ဖန်တီးရန်အတွက် ကျွန်ုပ်တို့သည် GAN များကို အသုံးပြုသည်။ GAN များထက် ပိုမိုလက်တွေ့ကျသော ရုပ်ပုံများကိုပင် ပျံ့နှံ့မှုပုံစံများကို အသုံးပြုထားသည်။
တစ်နည်းအားဖြင့်၊ ပျံ့နှံ့မှုပုံစံများသည် အချက်အလက်များကိုဖော်ပြရာတွင် ပိုမိုတိကျပါသည်။
GAN သည် input random noise သို့မဟုတ် class conditioning variable အဖြစ်ယူကာ လက်တွေ့ကျသောနမူနာကိုထုတ်ပေးသော်လည်း diffusion model များသည် မကြာခဏနှေးကွေးကာ ထပ်ခါထပ်ခါဖြစ်ပြီး လမ်းညွှန်မှုများစွာလိုအပ်ပါသည်။
ဆူညံသံမှ မူရင်းပုံသို့ ပြန်သွားရန် ရည်ရွယ်ချက်ဖြင့် ထပ်ခါတလဲလဲ သရုပ်ဖော်ပြသည့်အခါ အမှားအယွင်းအတွက် နေရာမရှိပေ။
စစ်ဆေးရေးဂိတ်တစ်ခုစီကို ဖန်တီးမှုအဆင့်တစ်လျှောက် ဖြတ်သန်းပြီး အဆင့်တစ်ဆင့်ချင်းစီတွင် ဓာတ်ပုံသည် အချက်အလက်များ ပိုမိုရရှိလာနိုင်သည်။
ကောက်ချက်
နိဂုံးချုပ်အားဖြင့်၊ 2020 နှင့် 2021 ခုနှစ်များတွင်သာ ထုတ်ပြန်ခဲ့သော သိသာထင်ရှားသော သုတေသနအနည်းငယ်ကြောင့်၊ diffusion မော်ဒယ်များသည် ယခု GAN များကို ရုပ်ပုံပေါင်းစပ်မှု၏ စည်းကမ်းချက်များဖြင့် ပိုမိုကောင်းမွန်အောင် လုပ်ဆောင်နိုင်ပြီဖြစ်သည်။
ယခုနှစ်တွင် OpenAI ကို စတင်ခဲ့သည်။ DALL-E2သမားတော်များအား ပျံ့နှံ့မှုပုံစံများကို အသုံးချနိုင်စေမည့် ရုပ်ပုံထုတ်လုပ်မှုပုံစံ။
GAN များသည် ခေတ်မီသော်လည်း၊ ၎င်းတို့၏ ကန့်သတ်ချက်များသည် အတိုင်းအတာနှင့် ၎င်းတို့ကို အကြောင်းအရာအသစ်များတွင် အသုံးပြုရန် စိန်ခေါ်မှုဖြစ်စေသည်။
ဖြစ်နိုင်ခြေအခြေခံမော်ဒယ်များကို အသုံးပြု၍ GAN ကဲ့သို့သော နမူနာအရည်အသွေးကို ရရှိရန်အတွက် အလုပ်များစွာကို ထည့်သွင်းထားသည်။
တစ်ဦးစာပြန်ရန် Leave