عام طور تي، GANs، VAEs، ۽ خود مختيار ماڊل وانگر گہرے پيدا ٿيندڙ ماڊل تصوير جي جوڙجڪ جي مسئلن کي سنڀاليندا آهن.
انهن جي ٺاهيل ڊيٽا جي اعلي معيار کي ڏنو ويو آهي، جنريٽو مخالف نيٽ ورڪ (GANs) تازو سالن ۾ تمام گهڻو ڌيان حاصل ڪيو آهي.
ڊفيوشن ماڊل مطالعي جو هڪ ٻيو دلچسپ ميدان آهي جيڪو پاڻ کي قائم ڪيو آهي. تصوير، وڊيو، ۽ آواز جي پيداوار جا شعبا ٻنهي لاء وسيع استعمال مليا آهن.
ڊفيوشن ماڊلز بمقابله GANs: ڪهڙو بهتر نتيجا پيدا ڪري ٿو؟ قدرتي طور، اهو هڪ جاري بحث جو سبب بڻيو آهي.
ڪمپيوٽري فن تعمير ۾ GAN طور سڃاتو وڃي ٿو، ٻه نظرياتي نيٽ ورڪ هڪ ٻئي جي خلاف وڙهندا آهن ڊيٽا جا نوان ٺهيل مثال پيدا ڪرڻ لاءِ جيڪي حقيقي ڊيٽا لاءِ گذري سگهن ٿا.
ڊفيوشن ماڊل وڌيڪ ۽ وڌيڪ مقبول ٿي رهيا آهن ڇاڪاڻ ته اهي تربيتي استحڪام ۽ ميوزڪ ۽ گرافڪس پيدا ڪرڻ لاءِ اعليٰ نتيجا فراهم ڪن ٿا.
هي آرٽيڪل تفصيل سان تفاوت ماڊل ۽ GANs جي ذريعي ويندا، انهي سان گڏ اهي ڪيئن هڪ ٻئي کان مختلف آهن ۽ ڪجهه ٻين شين کان.
تنهن ڪري، پيدا ٿيندڙ مخالف نيٽ ورڪ ڇا آهن؟
ڊيٽا جا نوان، مصنوعي مثال ٺاهڻ لاءِ جيڪي غلط ٿي سگھن ٿيون حقيقي ڊيٽا لاءِ، جنريٽيو ايڊورسريل نيٽ ورڪ (GANs) ٻه نيورل نيٽ ورڪ استعمال ڪن ٿا ۽ انهن کي هڪ ٻئي جي خلاف ڪن ٿا (اهڙيءَ طرح نالي ۾ ”مخالف“).
اهي وڏي پيماني تي تقرير، وڊيو، ۽ تصوير ٺاهڻ لاء استعمال ڪيا ويا آهن.
GAN جو مقصد هڪ مخصوص ڊيٽا سيٽ مان اڳ ۾ دريافت ٿيل ڊيٽا ٺاهڻ آهي. نمونن مان حقيقي، اڻڄاتل بنيادي ڊيٽا جي ورڇ جي نموني جو اندازو لڳائڻ جي ڪوشش، هي ڪري ٿو.
متبادل طور تي چيو ويو آهي ته، اهي نيٽ ورڪ نموني ماڊل آهن جيڪي هڪ مخصوص شمارياتي تقسيم کي سکڻ جي ڪوشش ڪندا آهن.
طريقو GAN اهو دريافت ڪرڻ لاءِ استعمال ڪيو ته هن مقصد کي ڪيئن حاصل ڪجي ناول هو. حقيقت ۾، اهي ڊيٽا ٺاهي رهيا آهن هڪ ٻه پليئر راند کيڏڻ لاء هڪ نموني ماڊل ٺاهي.
هيٺ ڏنل جوڙجڪ بيان ڪري ٿو:
- هڪ تعصب ڪندڙ جيڪو مستند ۽ جعلي ڊيٽا جي وچ ۾ فرق ڪرڻ جي صلاحيت حاصل ڪري ٿو
- ھڪڙو جنريٽر جيڪو چونڊيندو آھي ڊيٽا ٺاھڻ جا نوان طريقا تبعيض ڪندڙ کي چالان ڪري سگھن ٿا.
تبعيض ڪندڙ هڪ اعصابي نيٽ ورڪ جي طور تي پيش ڪري ٿو. تنهن ڪري، جنريٽر کي ان کي چال ڪرڻ لاء اعلي معيار سان تصوير ٺاهڻ جي ضرورت آهي.
حقيقت اها آهي ته اهي جنريٽر ڪنهن به پيداوار جي تقسيم کي استعمال ڪندي تربيت نه ڪئي وئي آهي آٽو اينڪوڊر ماڊل ۽ ٻين ماڊل جي وچ ۾ هڪ اهم فرق آهي.
ماڊل جي نقصان واري فنڪشن کي ختم ڪرڻ جا ٻه طريقا آهن:
- مقدار جو اندازو لڳائڻ جي صلاحيت جيڪڏهن تبعيض ڪندڙ حقيقي ڊيٽا کي صحيح طور تي پيش ڪري ٿو
- ٺاهيل ڊيٽا صحيح طور تي هڪ حصي طرفان اڳڪٿي ڪئي وئي آهي.
بهترين ممڪن تبعيض تي، هن نقصان جي فنڪشن کي پوء گھٽ ڪيو ويندو آهي:
تنهن ڪري عام ماڊل سمجهي سگهجن ٿا فاصلي کي گھٽائڻ جا ماڊل ۽، جيڪڏهن فرق ڪرڻ وارو مثالي آهي، جيئن سچي ۽ پيدا ڪيل ورڇ جي وچ ۾ فرق گھٽائڻ.
حقيقت ۾، مختلف تڪرارن کي ملازمت ڪري سگهجي ٿو ۽ نتيجي ۾ مختلف GAN ٽريننگ طريقا.
سکيا جي متحرڪ، جن ۾ جنريٽر ۽ تبعيض جي وچ ۾ واپار شامل آهن، پيروي ڪرڻ مشڪل آهن، جيتوڻيڪ اهو GANs جي نقصان جي ڪارڪردگي کي ترتيب ڏيڻ آسان آهي.
اتي به ڪو به يقين نه آهي ته سکيا ملندو. نتيجي طور، هڪ GAN ماڊل کي تربيت ڏيڻ ڏکيو آهي، ڇاڪاڻ ته اهو عام طور تي مسئلن جي وچ ۾ هلڻ جهڙوڪ گريجوئيٽ غائب ٿيڻ ۽ موڊ ختم ٿيڻ (جڏهن پيدا ٿيل نمونن ۾ ڪو به تنوع نه آهي).
هاڻي، اهو وقت آهي Diffusion ماڊلز لاءِ
GANs جي ٽريننگ ڪنورجنسي جو مسئلو ڊفيوژن ماڊلز جي ترقي ذريعي حل ڪيو ويو آهي.
اهي ماڊل فرض ڪن ٿا ته هڪ ڦهلائڻ وارو عمل معلومات جي نقصان جي برابر آهي جيڪو شور جي ترقي پسند مداخلت جي ذريعي آندو ويو آهي (هڪ گاسين شور شامل ڪيو ويندو آهي ڦهلائڻ واري عمل جي هر مرحلي تي).
اهڙي نموني جو مقصد اهو طئي ڪرڻ آهي ته نموني ۾ موجود معلومات تي شور ڪيئن اثر انداز ٿئي ٿو، يا ان کي ٻئي طريقي سان ٻڌائڻ لاءِ، پکيڙڻ سبب ڪيتري معلومات ضايع ٿئي ٿي.
جيڪڏهن هڪ نمونو اهو معلوم ڪري سگهي ٿو، اهو اصل نمونو ٻيهر حاصل ڪرڻ ۽ معلومات جي نقصان کي رد ڪرڻ جي قابل هوندو.
اهو هڪ denoising diffusion ماڊل ذريعي مڪمل ڪيو ويو آهي. اڳتي وڌڻ وارو عمل ۽ هڪ ريورس ڦهلائڻ وارو عمل ٻن مرحلن تي مشتمل آهي.
اڳتي وڌڻ واري عمل ۾ شامل آهي بتدريج گاسي شور (يعني ڊفيوشن جو عمل) جيستائين ڊيٽا مڪمل طور تي شور سان آلوده نه ٿئي.
اعصابي نيٽ ورڪ بعد ۾ تربيت ڪئي وئي آهي ريورس ڊفيوژن جو طريقو استعمال ڪندي شور کي ريورس ڪرڻ لاءِ مشروط تقسيم جي امڪانن کي سکڻ لاءِ.
هتي توهان جي باري ۾ وڌيڪ سمجهي سگهو ٿا diffusion ماڊل.
ڊفيوشن ماڊل بمقابله GANs
هڪ ڊفيوژن ماڊل وانگر، GANs شور مان تصويرون ٺاهي ٿو.
ماڊل هڪ جنريٽر نيورل نيٽ ورڪ مان ٺهيل آهي، جيڪو ڪجهه معلوماتي ڪنڊيشننگ ويريبل جي شور سان شروع ٿئي ٿو، جهڙوڪ ڪلاس ليبل يا ٽيڪسٽ انڪوڊنگ.
نتيجو اهو ٿيڻ گهرجي جيڪو ڪجهه حقيقي تصوير وانگر هجي.
تصويري حقيقت پسند ۽ اعليٰ مخلص تصويري نسل ٺاهڻ لاءِ، اسان GANs کي استعمال ڪريون ٿا. GANs کان به وڌيڪ حقيقي بصري پيدا ڪيا ويا آهن ڊفيوشن ماڊل استعمال ڪندي.
هڪ طريقي سان، diffusion ماڊل حقيقتن کي بيان ڪرڻ ۾ وڌيڪ صحيح آهن.
جڏهن ته هڪ GAN انپٽ بي ترتيب شور يا ڪلاس ڪنڊيشننگ متغير جي طور تي وٺندو آهي ۽ هڪ حقيقي نمونو ڪڍي ٿو، ڊفيوشن ماڊل اڪثر ڪري سست، تکراري، ۽ وڌيڪ هدايت جي ضرورت آهي.
غلطي جي گهڻي گنجائش نه آهي جڏهن رد ڪرڻ کي بار بار لاڳو ڪيو وڃي ته شور کان اصل تصوير ڏانهن موٽڻ جي مقصد سان.
هر چيڪ پوائنٽ ذريعي گذريو ويندو آهي سڄي تخليق جي مرحلي ۾، ۽ هر قدم سان، تصوير وڌيڪ ۽ وڌيڪ معلومات حاصل ڪري سگهي ٿي.
ٿڪل
نتيجي ۾، ڪجھ اھم تحقيق جي ڪري جيڪي صرف 2020s ۽ 2021 ۾ شايع ٿيل آھن، ڊفيوشن ماڊل ھاڻي GANs کي تصويري ٺاھڻ جي لحاظ کان بھتر ڪري سگھن ٿا.
هن سال، OpenAI شروع ڪيو ڊيل-اي2، هڪ تصوير جي پيداوار جو ماڊل جيڪو عملي کي اجازت ڏئي ٿو ته هو ڊفيوژن ماڊلز کي ملازمت ڏين.
جيتوڻيڪ GANs جديد آهن، انهن جون رڪاوٽون ان کي ماپڻ ۽ انهن کي نون مقصدن ۾ استعمال ڪرڻ مشڪل بڻائين ٿيون.
GAN-جهڙوڪ نموني معيار حاصل ڪرڻ لاءِ امڪاني بنيادن تي ماڊل استعمال ڪندي، ان ۾ تمام گهڻو ڪم ڪيو ويو آهي.
جواب ڇڏي وڃو