Daptar eusi[Sumputkeun][Témbongkeun]
Sacara umum, model generatif jero kawas GANs, VAEs, sarta model autoregressive nanganan masalah sintésis gambar.
Dibikeun kualitas luhur data anu aranjeunna ciptakeun, jaringan adversarial generatif (GAN) parantos nampi seueur perhatian dina taun-taun ayeuna.
Modél difusi mangrupikeun widang pangajaran anu pikaresepeun anu parantos mapan. Widang gambar, vidéo, sareng generasi sora duanana mendakan panggunaan éksténsif pikeun duanana.
Modél difusi vs GAN: Mana Anu Ngahasilkeun Hasil Anu Langkung Saé? Alami, ieu geus ngarah ka diskusi lumangsung.
Dina arsitektur komputasi katelah GAN, dua jaringan neural anu perang ngalawan hiji séjén pikeun ngahasilkeun instansi anyar disintésis data nu bisa lulus pikeun data asli.
Modél difusi beuki populer sabab nyayogikeun stabilitas latihan sareng hasil anu luhur pikeun ngahasilkeun musik sareng grafik.
Tulisan ieu bakal ngaliwat modél difusi sareng GAN sacara rinci, ogé kumaha bédana sareng sababaraha hal anu sanés.
Janten, naon ari Generative Adversarial Networks?
Dina raraga nyieun anyar, instansi jieunan data nu bisa jadi salah kaprah pikeun data asli, generative adversarial networks (GANs) employ dua jaringan neural jeung ngadu eta ngalawan silih (sahingga "adversarial" dina ngaran).
Éta dianggo sacara éksténsif pikeun pidato, pidéo, sareng nyiptakeun gambar.
Tujuan GAN nyaéta pikeun nyiptakeun data anu teu acan kapendak sateuacana tina set data khusus. Nyobian nyimpulkeun modél distribusi data dasar anu teu dipikanyaho tina sampel, ngalakukeun ieu.
Alternatipna ceuk, jaringan ieu model implisit nu nyoba diajar sebaran statistik husus.
Métode anu dianggo GAN pikeun mendakan kumaha ngahontal tujuan ieu nyaéta novel. Kanyataanna, aranjeunna ngahasilkeun data ku maén kaulinan dua-pamuter pikeun ngembangkeun model implisit.
Di handap ieu ngajelaskeun struktur:
- a Discriminator nu gains kamampuhan pikeun ngabedakeun antara data otentik jeung palsu
- generator nu nyokot cara anyar pikeun nyieun data bisa trik discriminator nu.
Diskriminator nganggap salaku jaringan saraf. Ku alatan éta, generator kudu nyieun gambar kalawan kualitas luhur pikeun nipu eta.
Kanyataan yén generator ieu henteu dilatih nganggo distribusi kaluaran naon waé mangrupikeun bédana anu signifikan antara modél autoencoder sareng modél sanésna.
Aya dua cara pikeun nguraikeun fungsi leungitna modél:
- kamampuhan pikeun ngitung lamun discriminator akurat foresees data nyata
- data dihasilkeun akurat diprediksi ku porsi.
Dina diskriminator anu pangsaéna, fungsi leungitna ieu teras diminimalkeun:
Modél generik kituna bisa dianggap salaku model pangleutikan jarak jeung, lamun discriminator idéal, sakumaha divergénsi minimization antara distribusi bener jeung dihasilkeun.
Dina kanyataanana, divergénsi anu béda-béda tiasa dianggo sareng nyababkeun sababaraha metode latihan GAN.
Dinamika pembelajaran, anu kalebet trade-off antara generator sareng diskriminator, sesah diturutan, sanaos saderhana pikeun nyaluyukeun fungsi leungitna GAN.
Henteu aya ogé jaminan yén diajar bakal konvergen. Hasilna, ngalatih modél GAN sesah, sabab biasana ngajalanan masalah sapertos ngaleungit gradién sareng mode runtuh (nalika teu aya keragaman dina sampel anu dihasilkeun).
Ayeuna, waktuna pikeun Model Difusi
Masalah sareng konvergénsi pelatihan GAN parantos kajawab ku pamekaran modél difusi.
Modél ieu nganggap yén prosés difusi sarua jeung leungitna informasi anu ditimbulkeun ku gangguan progresif bising (noise gaussian ditambahkeun dina unggal léngkah prosés difusi).
Tujuan tina modél sapertos kitu nyaéta pikeun nangtukeun kumaha noise mangaruhan inpormasi anu aya dina sampel, atanapi, dina cara anu sanés, sabaraha inpormasi anu leungit kusabab difusi.
Upami modél tiasa terang ieu, éta kedah tiasa nyandak conto asli sareng ngabatalkeun leungitna inpormasi anu kajantenan.
Ieu kahontal ngaliwatan model difusi denoising. Prosés difusi maju sareng prosés difusi ngabalikkeun dua léngkah.
Prosés difusi maju ngalibatkeun nambahkeun saeutik demi saeutik noise Gaussian (ie, prosés difusi) nepi ka data sagemblengna kacemar ku noise.
Jaringan saraf satuluyna dilatih ngagunakeun métode difusi sabalikna pikeun neuleuman probabiliti distribusi kondisional pikeun ngabalikeun noise.
Di dieu anjeun tiasa ngartos langkung seueur ngeunaan modél difusi.
Modél difusi Vs GANs
Kawas model difusi, GAN ngahasilkeun gambar tina noise.
Modél ieu diwangun ku jaringan saraf generator, anu dimimitian ku sora sababaraha variabel udar informatif, sapertos labél kelas atanapi encoding téks.
Hasilna kedah janten hal anu nyarupaan gambar anu realistis.
Pikeun nyiptakeun generasi gambar fotoréalistis sareng kasatiaan luhur, kami nganggo GAN. Malah visual anu langkung realistis tibatan GAN diproduksi nganggo modél difusi.
Ku cara kitu, modél difusi leuwih akurat dina ngajéntrékeun fakta.
Nalika GAN nyandak sora acak input atanapi variabel udar kelas sareng ngahasilkeun conto anu réalistis, modél difusi sering langkung laun, iteratif, sareng peryogi langkung seueur pituduh.
Teu aya seueur rohangan pikeun kasalahan nalika denoising diterapkeun sababaraha kali kalayan tujuan uih deui ka gambar asli tina noise.
Tiap titik pamariksaan diliwat sapanjang tahapan kreasi, sareng sareng unggal léngkah, gambar tiasa langkung seueur inpormasi.
kacindekan
Kasimpulanana, Kusabab sababaraha panilitian penting anu ngan ukur diterbitkeun dina taun 2020an sareng 2021, modél difusi ayeuna tiasa ngaunggulan GAN dina hal sintésis gambar.
Taun ieu, OpenAI diluncurkeun DALL-E2, modél produksi gambar anu ngamungkinkeun para praktisi ngagunakeun modél difusi.
Sanaos GAN anu canggih, keterbatasanna ngajantenkeun hésé skala sareng dianggo dina kontéks énggal.
Dina raraga ngahontal kualitas sampel GAN-kawas ngagunakeun model basis likelihood, loba karya geus nempatkeun kana eta.
Leave a Reply