အသစ်နှင့် မြှင့်တင်ထားသော AI သည် စွမ်းရည်များ၊ နားလည်နိုင်စွမ်းနှင့် ပိုမိုမြင့်မားသော ရုပ်ထွက်ပုံရိပ်များကို ထုတ်လုပ်နိုင်စွမ်းကို မြှင့်တင်ပေးပါသည်။ မကြာသေးမီက အင်တာနက်ပေါ်တွင် လွင့်မျောနေသော ထူးဆန်းပြီး ရယ်စရာကောင်းသော ပုံရိပ်အချို့ကို သင်တွေ့ဖူးပေမည်။
Shiba Inu ခွေးတစ်ကောင်သည် အနက်ရောင် လိပ်အင်္ကျီကို ၀တ်ဆင်ထားသည်။ နယ်သာလန်ပန်းချီဆရာ Vermeer ၏ "ပုလဲနားကွင်းနှင့် မိန်းကလေး" ပုံစံအတိုင်း ပင်လယ်ဖျံတစ်ကောင်။ ပြီးတော့ သိုးမွေးဘီလူးနဲ့တူတဲ့ ဟင်းချိုတစ်ခွက်ရှိတယ်။
ဒီပုံတွေ လူသားပန်းချီဆရာက ဖန်တီးခဲ့တာမဟုတ်ဘူး။
ယင်းအစား၊ DALL-E 2 သည် စာသားဖော်ပြချက်များကို ပုံများအဖြစ်သို့ ပြောင်းလဲနိုင်သည့် AI စနစ်အသစ်က ၎င်းတို့ကို ဖန်တီးခဲ့သည်။
သင်မြင်လိုသောအရာကို ရိုးရှင်းစွာချရေးပါ၊ AI သည် သင့်အတွက် ကွက်ကွက်ကွင်းကွင်းအသေးစိတ်၊ အရည်အသွေးကောင်း၊ နှင့် အချို့သောကိစ္စများတွင် စစ်မှန်သောတီထွင်ဆန်းသစ်မှုကို ဖန်တီးပေးမည်ဖြစ်သည်။ ဤပို့စ်တွင်၊ OpenAI ၏နောက်ဆုံးထွက်လေ့လာမှု၊ DALL.E 2 အပြင် ၎င်းသည် မည်သို့အလုပ်လုပ်ပုံနှင့် အခြားအရာများစွာကို နက်ရှိုင်းစွာကြည့်ရှုပါမည်။ စလိုက်ကြစို့။
ဒီတော့အတိအကျကဘာလဲ DALL.E ၂?
DALL-E 2 သည် input data တွင် ခန့်မှန်းခြင်း သို့မဟုတ် အမျိုးအစားခွဲခြင်း လုပ်ငန်းများကို လုပ်ဆောင်ခြင်းထက် ရှုပ်ထွေးသော output ကိုထုတ်ပေးသည့် machine learning algorithm အမျိုးအစားတစ်ခုဖြစ်သည်။
သင်သည် DALL-E 2 အား ရေးသားဖော်ပြချက်ဖြင့် ပေးဆောင်ပြီး ၎င်းနှင့် ကိုက်ညီသော ပုံကို ဖန်တီးပေးပါသည်။ အယူအဆများ၊ အရည်အသွေးများနှင့် စတိုင်များကို ပေါင်းစပ်ခြင်းဖြင့် OpenAI ၏ DALLE 2 သည် အခြေခံဘာသာစကားဖော်ပြချက်မှ ဆန်းသစ်သော၊ လက်တွေ့ဆန်သော ဂရပ်ဖစ်နှင့် အနုပညာကို ထုတ်လုပ်နိုင်သည်။
နောက်ဆုံးထွက်ဗားရှင်း DALLE 2 သည် ပိုမိုများပြားသော ကြည်လင်ပြတ်သားမှုနှင့် ဖန်တီးမှုပုံစံများ၏ ကျယ်ပြန့်သော ရောင်စဉ်များဖြင့် ပုံများကို စာတန်းများမှ ပုံများဖန်တီးနိုင်သည်ဟု ဆိုသည်။ ဥပမာအားဖြင့်၊ အောက်ဖော်ပြပါပုံများကို (DALL-E 2 ဘလော့ဂ်ပို့စ်မှ) "အာကာသယာဉ်မှူး မြင်းစီးသူ" ဟူသော ဖော်ပြချက်ဖြင့် ဖန်တီးထားသည်။
ဖော်ပြချက်တစ်ခုသည် “ခဲတံပုံကြမ်းကဲ့သို့” နိဂုံးချုပ်ပြီး နောက်တစ်ခုက “ဓာတ်ပုံကို လက်တွေ့ဆန်သောပုံစံဖြင့် နိဂုံးချုပ်သည်” ဟုဆိုသည်။
၎င်းသည် လက်ရှိဓာတ်ပုံများကို အံ့အားသင့်ဖွယ်တိကျမှုဖြင့် ပြောင်းလဲနိုင်သည်။ ထို့ကြောင့်၊ မူလရုပ်ပုံသဏ္ဌာန်ကို ထိန်းသိမ်းထားစဉ်တွင် အရောင်များ၊ ရောင်ပြန်ဟပ်မှုများနှင့် အရိပ်များကို ထိန်းသိမ်းထားစဉ်တွင် အစိတ်အပိုင်းများကို ထည့်နိုင်သည် သို့မဟုတ် ဖျက်နိုင်သည်။
ဒါကဘယ်လိုမျိုးအလုပ်လုပ်သလဲ?
DALL-E 2 သည် ခေတ်မီဆန်းပြားသော CLIP နှင့် diffusion မော်ဒယ်များကို အသုံးပြုသည်။ နက်ရှိုင်းသောသင်ယူမှု မကြာသေးမီနှစ်များအတွင်း ချဉ်းကပ်မှုများ ပေါ်ပေါက်လာသည်။ သို့ရာတွင်၊ ၎င်းသည် အခြားသော နက်နဲသော သဘောတရားအားလုံးနှင့် တူညီသော သဘောတရားကို အခြေခံထားသည်။ အာရုံကြောကွန်ရက်များ ကိုယ်စားပြုသင်ကြားမှု။ CLIP နှစ်ခုကို တစ်ပြိုင်နက် လေ့ကျင့်ပေးသည်။ အာရုံကြောကွန်ရက်များ ပုံများနှင့် စာတန်းများပေါ်တွင်
ကွန်ရက်တစ်ခုသည် ရုပ်ပုံရှိ ရုပ်ပုံဆိုင်ရာ ကိုယ်စားပြုမှုများကို လေ့လာပြီး အခြားတစ်ခုသည် စာသားကိုယ်စားပြုမှုများကို လေ့လာသည်။ လေ့ကျင့်နေစဉ်အတွင်း၊ ကွန်ရက်နှစ်ခုသည် ၎င်းတို့၏ ကန့်သတ်ချက်များကို ပြုပြင်ရန် ကြိုးပမ်းရာတွင် နှိုင်းယှဉ်နိုင်သော ပုံများနှင့် ဖော်ပြချက်များသည် ဆင်တူသော မြှုပ်နှံမှုများကို ဖြစ်ပေါ်စေပါသည်။
"Diffusion" သည် ၎င်း၏လေ့ကျင့်ရေးနမူနာများကို ဖြည်းဖြည်းချင်း ဆူညံနေအောင် ဖျောက်ခြင်းဖြင့် ရုပ်ပုံများကို ဖန်တီးရန် သင်ယူသည့် မျိုးဆက်သစ်ပုံစံတစ်မျိုးဖြစ်ပြီး DALL-E 2 တွင် အသုံးပြုသည့် အခြားသော စက်သင်ယူမှုနည်းလမ်းဖြစ်သည်။ Diffusion မော်ဒယ်များသည် ဒေတာထည့်သွင်းမှုကို autoencoders များအဖြစ် ပြောင်းလဲပေးသည့် ပုံစံတူဖြစ်သည်။ ကိုယ်စားပြုမှုကို မြှုပ်နှံပြီးနောက် မူရင်းဒေတာကို ပြန်လည်ဖန်တီးရန် မြှုပ်သွင်းထားသော အချက်အလက်ကို အသုံးပြုပါ။
OpenAI ကိုအသုံးပြုခြင်း။ ဘာသာစကားပုံစံ စာသားဖော်ပြချက်များအား ဓာတ်ပုံများနှင့် ချိတ်ဆက်နိုင်သည့် CLIP၊ ၎င်းသည် စာသားဖော်ပြချက်အား ဓာတ်ပုံတစ်ပုံတစ်ပုံတွင် လိုအပ်သည့်အချက်နှင့် ကိုက်ညီသင့်သည့် အရေးကြီးသောဂုဏ်သတ္တိများကို ပေါင်းစပ်ထားသည့် အလယ်အလတ်ပုံစံတစ်ခုအဖြစ် ဦးစွာဘာသာပြန်ပါသည်။
ဒုတိယ၊ DALL-E 2 သည် ကလစ်နှင့်လိုက်လျောညီထွေဖြစ်စေသော ဖန်တီးပေးသည်။ diffusion model ကိုအသုံးပြုထားသောပုံမသေခင်၊
ကျပန်းပစ်ဆယ်များဖြင့် ပုံပျက်နေသော ဓာတ်ပုံများတွင်၊ ပျံ့နှံ့မှုပုံစံများကို လေ့လာနိုင်သည်။ ဓာတ်ပုံများ၏ မူရင်းပုံစံကို မည်သို့ပြန်ယူရမည်ကို သင်ယူကြသည်။ Diffusion မော်ဒယ်များသည် အထူးသဖြင့် ကွဲပြားမှုထက် တိကျမှုကို ဦးစားပေးသည့် လမ်းညွှန်ချဉ်းကပ်မှုဖြင့် တွဲဖက်အသုံးပြုသောအခါတွင် အရည်အသွေးမြင့် ပေါင်းစပ်ရုပ်ပုံများကို ထုတ်လုပ်နိုင်သည်။
အကျိုးဆက်အနေနဲ့၊ ပျံ့နှံ့မှုပုံစံ ကျပန်းပစ်ဆယ်များကိုယူကာ ၎င်းတို့ကို စကားလုံးအမှာစာနှင့်ကိုက်ညီသော ပုံအသစ်အဖြစ်သို့ ပြောင်းလဲရန် CLIP ကိုအသုံးပြုသည်။ ပျံ့နှံ့မှုသဘောတရားကြောင့် DALL-E 2 သည် DALL-E ထက် ပိုမိုမြန်ဆန်သော ရုပ်ထွက်အရည်အသွေးကို ထုတ်လုပ်နိုင်သည်။
DALL.E 2 သုံးရန်ကိစ္စ
လွန်ခဲ့သော အနှစ်နှစ်ဆယ်၊ ကွန်ပျူတာရူပါရုံကို နည်းပညာသည် ရိုးရှင်းသော အယူအဆမှ ကြီးမားသော အောင်မြင်မှုဆီသို့ တိုးတက်လာသည်။ ဤတိုးတက်မှုများ ရှိသော်လည်း ရုပ်ပုံနှင့် အရာဝတ္တု မှတ်သားမှု မော်ဒယ်များသည် နေ့စဉ်ဘ၀တွင် သိသိသာသာ အတားအဆီးများနှင့် ရင်ဆိုင်နေကြရဆဲ ဖြစ်သည်။ ဒေတာအတွဲများ မရှိခြင်းသည် ရုပ်ပုံအသိအမှတ်ပြုမှုနှင့် ကွန်ပျူတာအမြင်၏ အထင်ရှားဆုံး အားနည်းချက်များထဲမှ တစ်ခုဖြစ်သည်။ နှစ်ဖက်စလုံးတွင် ဒေတာပြတ်တောက်မှုရှိနေ၍ 100 ရာခိုင်နှုန်းတိကျသောရလဒ်များရရှိရန် ရုပ်ပုံအသိအမှတ်ပြုမှုပုံစံများကို လေ့ကျင့်ရန်မှာ ခက်ခဲလုနီးပါးဖြစ်သည်။
ကံကောင်းထောက်မစွာ၊ OpenAI ၏ စက်သင်ယူမှုပုံစံအသစ်သည် နည်းပညာကွာဟချက်ကို တံတားထိုးပေးနိုင်သည်။ DALLE 2 သည် စာသားဖော်ပြချက်များအပေါ်အခြေခံ၍ အံ့သြဖွယ်ကောင်းသောပုံများကို ဖန်တီးပေးနိုင်သည်။ ဤရုပ်ပုံအတုထုတ်လုပ်မှုသည် ၎င်းတို့၏လိုအပ်ချက်များအပေါ်အခြေခံ၍ ရုပ်ပုံအသိအမှတ်ပြုခြင်းမော်ဒယ်များသို့ ဒေတာကို ပံ့ပိုးပေးနိုင်သည်။ ဒေတာမရှိခြင်းသည် အရာဝတ္ထုနှင့် ရုပ်ပုံခွဲခြားသတ်မှတ်ခြင်းအတွက် သိသာထင်ရှားသော ထိမိ၍လဲစရာအတားအဆီးတစ်ခုဖြစ်သည်။
ဒစ်ဂျစ်တယ်ခေတ်တွင်၊ ဒေတာအတွဲများသည် နေရာအနှံ့တွင်ရှိသော်လည်း AI မော်ဒယ်ကို ကျွေးမွေးရန်အတွက် ဖြတ်လမ်းများကို ရှာဖွေနေဆဲဖြစ်သောကြောင့် ရလဒ်ကောင်းများကို ပေးစွမ်းနိုင်ပါသည်။ သို့သော်၊ ရုပ်ပုံအသိအမှတ်ပြုမှုမော်ဒယ်ကိုလေ့ကျင့်ရန်မလွယ်ကူပါ။ ၎င်းသည် ကျွန်ုပ်တို့ ရိုးရှင်းစွာ ထုတ်ယူ၍မရနိုင်သော ကွဲပြားမှုအနည်းငယ်ရှိသော ဒေတာအတွဲများစွာကို လိုအပ်ပါသည်။
ဒီတော့ အဖြေကဘာလဲ၊ အဖြေက DALLE 2 ပါ။ OpenAI ရုပ်ပုံဂျင်နရေတာသည် စာသားများမှ ပုံများကို ထုတ်လုပ်နိုင်ပြီး ရှိပြီးသားပုံများကို ပြောင်းလဲနိုင်သည့် စွမ်းရည်ဖြင့် ကွာဟချက်ကို ပေါင်းကူးပေးနိုင်ပါသည်။ ၎င်းသည် လူသားတံဆိပ်တပ်ခြင်းပမာဏကို လျှော့ချပေးကာ အပိုဆောင်းလေ့ကျင့်ရေးဒေတာကို ဖန်တီးရာတွင်လည်း အထောက်အကူဖြစ်စေမည်ဖြစ်သည်။ သိသာထင်ရှားသောအကျိုးကျေးဇူးများရှိနေသော်လည်း၊ အတုအယောင်ပုံထုတ်လုပ်မှုများနှင့် ပါဝင်မှုကို ဖယ်ထုတ်ထားသည့် ပုံများကို သင်သတိထားသင့်သည်။ ၎င်းသည် ဘက်လိုက်သော ရလဒ်များကို ထုတ်ပေးသည့် ရုပ်ပုံရှာဖွေခြင်းနည်းလမ်းများကို ဖြစ်ပေါ်စေနိုင်သည်။
ကန့်သတ်
OpenAI ၏အဆိုအရ DALL.E 2 သည် မှားယွင်းသောလက်ထဲသို့ ကျရောက်ပါက အန္တရာယ်ရှိနိုင်သည်ဟု ဆိုသည်။ ယနေ့ခေတ် အတုအယောင်များ နက်ရှိုင်းသော ကမ္ဘာတွင်၊ မှားယွင်းသော အချက်အလက် သို့မဟုတ် လူမျိုးရေးခွဲခြားသော ပုံများကို ဖြန့်ကြက်ရန် မော်ဒယ်ကို အလွယ်တကူ အသုံးပြုနိုင်ပြီး၊ ထို့ကြောင့် OpenAI မှ developer များအား ဖိတ်ကြားချက်ဖြင့် DALL.2 ကိုသာ အသုံးပြုခွင့်ပေးပါသည်။ မော်ဒယ်သည် သူမရရှိသည့် အကြံပြုချက်အားလုံးအတွက် တင်းကျပ်သော အကြောင်းအရာကန့်သတ်ချက်ကို လိုက်နာရမည်ဖြစ်သည်။
DALL.E 2 ၏ ရန်လိုသော သို့မဟုတ် ကြမ်းတမ်းသော ဓာတ်ပုံများကို ဖန်တီးခြင်း၏ အလားအလာကို ဖယ်ထုတ်ရန်၊ ဒေတာအတွဲကို သေစေတတ်သော လက်နက်မပါဘဲ ဖန်တီးထားသည်။ OpenAI က ၎င်းကို အနာဂတ်တွင် API အဖြစ် ပြောင်းလဲရန် စီစဉ်နေသော်လည်း DALL.E 2 တွင် သတိဖြင့် ဆက်လက်လုပ်ဆောင်ရန် ဆန္ဒရှိနေပါသည်။
ကောက်ချက်
DALL-E 2 သည် အပလီကေးရှင်းအသစ်များအတွက် တံခါးဖွင့်ပေးသည့် နောက်ထပ်စိတ်ဝင်စားဖွယ်ကောင်းသော OpenAI သုတေသနရှာဖွေတွေ့ရှိမှုဖြစ်သည်။
ဥပမာတစ်ခုသည် ကွန်ပျူတာအမြင်၏ အဓိက ပိတ်ဆို့မှုများထဲမှ တစ်ခုဖြစ်သော ဒေတာများကို ပြည့်မီရန် ကြီးမားသော ဒေတာအတွဲများကို ဖန်တီးခြင်းဖြစ်သည်။ DALL-E-based အက်ပ်များစွာအတွက် စီးပွားရေးကိစ္စရပ်ကို OpenAI က ၎င်း၏ API အသုံးပြုသူများအတွက် ချမှတ်ပေးသည့် စျေးနှုန်းနှင့် မူဝါဒများဖြင့် ဆုံးဖြတ်မည်ဖြစ်သော်လည်း ၎င်းတို့အားလုံးသည် ရုပ်ပုံထုတ်လုပ်မှုကို သံသယဖြစ်ဖွယ်မရှိအောင် တိုးတက်စေမည်ဖြစ်သည်။
တစ်ဦးစာပြန်ရန် Leave