په عموم کې، ژور تولیدي ماډلونه لکه GANs، VAEs، او اتوماتیک ماډلونه د عکس ترکیب ستونزې اداره کوي.
د هغو معلوماتو لوړ کیفیت ته په پام سره چې دوی یې رامینځته کوي، تولیدي مخالفې شبکې (GANs) په وروستیو کلونو کې ډیره پاملرنه ترلاسه کړې.
د خپریدو ماډلونه د مطالعې یو بل زړه راښکونکی ډګر دی چې ځان یې رامینځته کړی. د عکس، ویډیو، او غږ تولید برخو دواړو د دواړو لپاره پراخه کارول موندلي.
د ډیفیوژن ماډلونه د GANs په مقابل کې: کوم یو غوره پایلې تولیدوي؟ په طبيعي توګه، دا د روان بحث لامل شوی.
په کمپیوټري جوړښت کې چې د GAN په نوم پیژندل کیږي، دوه نوریال شبکې د یو بل په وړاندې جنګیږي ترڅو د ډیټا نوي ترکیب شوي مثالونه تولید کړي چې د ریښتیني معلوماتو لپاره تیریږي.
د ډیفیوژن ماډلونه خورا ډیر مشهور کیږي ځکه چې دوی د روزنې ثبات او د میوزیک او ګرافیک تولید لپاره لوړې پایلې چمتو کوي.
دا مقاله به د توزیع ماډل او GANs په تفصیل سره وڅیړي ، په بیله بیا دوی څنګه له یو بل څخه توپیر لري او یو څو نور شیان.
نو، تولیدي مخالفې شبکې څه دي؟
د دې لپاره چې د ډیټا نوي مصنوعي مثالونه رامینځته کړي چې ممکن د ریښتیني معلوماتو لپاره غلط وي ، تولیدي مخالفې شبکې (GANs) دوه عصبي شبکې ګماري او د یو بل پروړاندې یې ودروي (په دې توګه په نوم کې "مخالف").
دوی په پراخه کچه د وینا، ویډیو، او انځور جوړولو لپاره کارول کیږي.
د GAN موخه دا ده چې د یو ځانګړي ډیټاسیټ څخه مخکې نه کشف شوي ډاټا رامینځته کړي. د نمونو څخه د حقیقي، ناپیژندل شوي بنسټیز ډیټا توزیع ماډل ته د رسیدلو هڅه، دا کار کوي.
په بدیل سره ویل شوي، دا شبکې ضمني ماډلونه دي چې هڅه کوي د ځانګړي احصایوي ویش زده کړي.
هغه میتود چې GAN د دې هدف د ترلاسه کولو څرنګوالي موندلو لپاره کارولی ناول و. په حقیقت کې، دوی د دوه لوبغاړو لوبې لوبولو سره ډاټا تولیدوي ترڅو د ضمیمه ماډل رامینځته کړي.
لاندې جوړښت تشریح کوي:
- یو تبعیض کونکی چې د مستند او جعلي معلوماتو ترمینځ توپیر کولو وړتیا ترلاسه کوي
- یو جنراتور چې د ډیټا رامینځته کولو لپاره نوې لارې غوره کوي کولی شي تبعیض کونکي چل کړي.
تبعیض کونکی د عصبي شبکې په توګه څرګندیږي. له همدې امله، جنراتور ته اړتیا لري چې د چلولو لپاره د لوړ کیفیت سره یو انځور جوړ کړي.
حقیقت دا دی چې دا جنراتورونه د هیڅ محصول توزیع په کارولو سره روزل شوي ندي د اوټوینکوډر ماډلونو او نورو ماډلونو ترمینځ د پام وړ توپیر دی.
د موډل د ضایع فعالیت تخریب کولو لپاره دوه لارې شتون لري:
- د مقدار کولو وړتیا که چیرې تبعیض کونکی په دقیق ډول د ریښتیني معلوماتو وړاندوینه وکړي
- تولید شوي ډاټا په سمه توګه د یوې برخې لخوا اټکل کیږي.
په غوره ممکنه تبعیض کونکي کې، د دې ضایع فعالیت بیا کم شوی:
له همدې امله عمومي ماډلونه د فاصلې د کمولو موډلونو په توګه فکر کیدی شي او که چیرې توپیر کوونکی مثالی وي، د ریښتیني او تولید شوي ویش ترمنځ د توپیر کمولو په توګه.
په واقعیت کې، مختلف توپیرونه کارول کیدی شي او د GAN د روزنې مختلف میتودونو پایله ولري.
د زده کړې متحرکات، چې د جنراتور او تبعیض کونکي ترمنځ د سوداګرۍ بند شامل دي، د تعقیب لپاره ننګونې دي، سره له دې چې د GANs د ضایع فعالیت تنظیم کول ساده دي.
هیڅ ډاډ هم شتون نلري چې زده کړه به یوځای شي. د پایلې په توګه، د GAN ماډل روزنه ستونزمنه ده، ځکه چې دا معمول دی چې له ستونزو سره مخ شي لکه د تدریجي ورکیدل او د موډل سقوط (کله چې په تولید شوي نمونو کې تنوع شتون نلري).
اوس ، دا د ډیفیوژن ماډلونو وخت دی
د GANs د روزنې د همغږۍ ستونزه د خپریدو ماډلونو پراختیا له لارې حل شوې.
دا ماډلونه داسې انګیري چې د توزیع پروسه د معلوماتو له لاسه ورکولو سره مساوي ده چې د شور د پرمختللې مداخلې له امله رامینځته کیږي (د توزیع پروسې په هر مرحله کې د ګاسین شور اضافه کیږي).
د داسې ماډل هدف دا دی چې معلومه کړي چې شور څنګه په نمونه کې موجود معلومات اغیزه کوي، یا په بل ډول یې واچوئ، څومره معلومات د خپریدو له امله له لاسه ورکوي.
که یو ماډل کولی شي دا معلومه کړي، دا باید د دې وړتیا ولري چې اصلي نمونه بیرته ترلاسه کړي او د معلوماتو ضایع چې پیښ شوي بیرته راولي.
دا د منحل کولو تحلیل ماډل له لارې ترسره کیږي. د مخکینۍ خپریدو پروسه او د بیرته خپریدو پروسه دوه مرحلې جوړوي.
د مخکینۍ خپریدو پروسه په تدریجي ډول د گاوسی شور (یعنې د خپریدو پروسه) اضافه کوي تر هغه چې معلومات په بشپړ ډول د شور لخوا ککړ نشي.
عصبي شبکه وروسته د ریورس ډیفیوژن میتود په کارولو سره روزل کیږي ترڅو د شور د بیرته راګرځولو لپاره د مشروط توزیع احتمالات زده کړي.
دلته تاسو کولی شئ د دې په اړه نور پوه شئ د خپریدو ماډل.
د ډیفیوژن ماډل بمقابله GANs
د خپریدو ماډل په څیر، GANs د شور څخه عکسونه تولیدوي.
ماډل د جنراتور عصبي شبکې څخه جوړ شوی ، کوم چې د ځینې معلوماتي کنډیشن تغیراتو شور سره پیل کیږي ، لکه د ټولګي لیبل یا د متن کوډ کول.
بیا پایله باید هغه څه وي چې د ریښتیني عکس سره ورته وي.
د فوټوریالیستیک او لوړ وفادار عکس نسلونو رامینځته کولو لپاره ، موږ GAN کاروو. حتی د GANs په پرتله خورا ریښتیني لیدونه د خپریدو ماډلونو په کارولو سره تولید شوي.
په یو ډول، د تحلیل ماډلونه د حقایقو په بیانولو کې ډیر دقیق دي.
پداسې حال کې چې یو GAN د تصادفي شور یا د ټولګي کنډیشن متغیر په توګه اخلي او یو ریښتیني نمونه تولیدوي، د خپریدو ماډلونه ډیری وختونه ورو، تکراري، او ډیر لارښوونې ته اړتیا لري.
د غلطۍ لپاره ډیر ځای شتون نلري کله چې د شور څخه اصلي عکس ته د بیرته راستنیدو هدف سره انکار کول په مکرر ډول پلي کیږي.
هره پوسته د جوړولو په مرحله کې تیریږي، او د هر ګام سره، انځور ممکن ډیر او ډیر معلومات ترلاسه کړي.
پایله
په پایله کې، د یو څو پام وړ څیړنو له امله چې یوازې په 2020 او 2021 کې خپاره شوي، د توزیع ماډلونه اوس کولی شي د انځور ترکیب په شرایطو کې د GANs څخه ښه شي.
سږکال، OpenAI پیل شو DALL-E2، د عکس تولید ماډل چې متخصصینو ته اجازه ورکوي چې د خپریدو ماډلونه استخدام کړي.
که څه هم GANs خورا پرمختللی دي، د دوی محدودیتونه په نوي شرایطو کې د اندازه کولو او کارولو لپاره ننګونې کوي.
د احتمال پراساس ماډلونو په کارولو سره د GAN په څیر نمونې کیفیت ترلاسه کولو لپاره ، پدې کې ډیر کار شوی.
یو ځواب ورکړئ ووځي