Jadual Kandungan[Sembunyi][Tunjukkan]
Secara umum, model generatif dalam seperti GAN, VAE dan model autoregresif mengendalikan masalah sintesis imej.
Memandangkan kualiti tinggi data yang mereka cipta, rangkaian permusuhan generatif (GAN) telah menerima banyak perhatian sejak beberapa tahun kebelakangan ini.
Model resapan adalah satu lagi bidang pengajian yang menarik yang telah memantapkan dirinya. Bidang imej, video dan penjanaan suara kedua-duanya menemui penggunaan yang meluas untuk kedua-duanya.
Model resapan lwn. GAN: Manakah yang Menghasilkan Keputusan yang Lebih Baik? Sememangnya, ini telah membawa kepada perbincangan yang berterusan.
Dalam seni bina pengiraan yang dikenali sebagai GAN, dua rangkaian saraf berperang antara satu sama lain untuk menghasilkan contoh data yang baru disintesis yang boleh lulus untuk data tulen.
Model resapan semakin popular kerana ia memberikan kestabilan latihan dan hasil yang tinggi untuk menghasilkan muzik dan grafik.
Artikel ini akan meneliti model resapan dan GAN secara terperinci, serta cara ia berbeza antara satu sama lain dan beberapa perkara lain.
Jadi, apakah itu Generative Adversarial Networks?
Untuk mencipta contoh data tiruan baharu yang mungkin disalah anggap sebagai data tulen, rangkaian permusuhan generatif (GAN) menggunakan dua rangkaian saraf dan mengadukannya antara satu sama lain (jadi "perlawanan" dalam namanya).
Ia digunakan secara meluas untuk pertuturan, video dan penciptaan gambar.
Objektif GAN adalah untuk mencipta data yang belum ditemui sebelum ini daripada set data tertentu. Percubaan untuk menyimpulkan model pengedaran data asas yang sebenar dan tidak dikenal pasti daripada sampel, lakukan ini.
Sebagai alternatif, rangkaian ini adalah model tersirat yang cuba mempelajari pengedaran statistik tertentu.
Kaedah yang digunakan GAN untuk mengetahui cara mencapai matlamat ini ialah novel. Malah, mereka menghasilkan data dengan bermain permainan dua pemain untuk membangunkan model tersirat.
Berikut menerangkan struktur:
- Diskriminator yang memperoleh keupayaan untuk membezakan antara data sahih dan palsu
- penjana yang mengambil cara baharu untuk mencipta data boleh menipu diskriminator.
Diskriminator menyamar sebagai rangkaian saraf. Oleh itu, penjana perlu mencipta gambar dengan kualiti yang tinggi untuk menipunya.
Hakikat bahawa penjana ini tidak dilatih menggunakan mana-mana pengedaran output adalah perbezaan yang ketara antara model pengekod auto dan model lain.
Terdapat dua cara untuk menguraikan fungsi kehilangan model:
- keupayaan untuk mengukur jika diskriminator meramalkan data sebenar dengan tepat
- data yang dijana diramalkan dengan tepat oleh bahagian.
Pada diskriminator terbaik yang boleh dilaksanakan, fungsi kehilangan ini kemudiannya diminimumkan:
Oleh itu, model generik boleh dianggap sebagai model pengecilan jarak dan, jika diskriminator adalah ideal, sebagai pengecilan perbezaan antara pengedaran yang benar dan yang dihasilkan.
Pada hakikatnya, perbezaan yang berbeza boleh digunakan dan menghasilkan pelbagai kaedah latihan GAN.
Dinamik pembelajaran, yang termasuk pertukaran antara penjana dan diskriminasi, adalah mencabar untuk diikuti, walaupun mudah untuk melaraskan fungsi kehilangan GAN.
Juga tidak ada jaminan bahawa pembelajaran akan berkumpul. Akibatnya, melatih model GAN adalah sukar, kerana ia adalah tipikal untuk menghadapi masalah seperti kecerunan yang hilang dan keruntuhan mod (apabila tiada kepelbagaian dalam sampel yang dijana).
Kini, tiba masanya untuk Model Penyebaran
Masalah dengan penumpuan latihan GAN telah ditangani melalui pembangunan model resapan.
Model ini menganggap bahawa proses resapan adalah bersamaan dengan kehilangan maklumat yang disebabkan oleh gangguan progresif hingar (bunyi gaussian ditambah pada setiap langkah masa proses resapan).
Tujuan model sedemikian adalah untuk menentukan cara hingar mempengaruhi maklumat yang terdapat dalam sampel, atau, dengan kata lain, berapa banyak maklumat yang hilang akibat penyebaran.
Jika model boleh memikirkan perkara ini, ia sepatutnya boleh mendapatkan semula sampel asal dan membuat asal kehilangan maklumat yang berlaku.
Ini dicapai melalui model resapan denoising. Proses resapan ke hadapan dan proses resapan terbalik membentuk dua langkah.
Proses resapan ke hadapan melibatkan penambahan secara beransur-ansur hingar Gaussian (iaitu, proses resapan) sehingga data tercemar sepenuhnya oleh hingar.
Rangkaian saraf kemudiannya dilatih menggunakan kaedah resapan terbalik untuk mempelajari kebarangkalian taburan bersyarat untuk membalikkan bunyi.
Di sini anda boleh memahami lebih lanjut tentang model penyebaran.
Model Penyebaran Vs GAN
Seperti model penyebaran, GAN menghasilkan gambar daripada bunyi bising.
Model ini terdiri daripada rangkaian saraf penjana, yang bermula dengan bunyi beberapa pembolehubah pelaziman bermaklumat, seperti label kelas atau pengekodan teks.
Hasilnya kemudiannya haruslah sesuatu yang menyerupai imej yang realistik.
Untuk mencipta generasi gambar fotorealistik dan kesetiaan tinggi, kami menggunakan GAN. Malah visual yang lebih realistik daripada GAN dihasilkan menggunakan model resapan.
Dari satu segi, model resapan lebih tepat dalam menerangkan fakta.
Walaupun GAN mengambil sebagai input hingar rawak atau pembolehubah pelaziman kelas dan mengeluarkan sampel yang realistik, model resapan selalunya lebih perlahan, berulang dan memerlukan lebih banyak panduan.
Tidak banyak ruang untuk ralat apabila denoising digunakan berulang kali dengan matlamat untuk kembali kepada imej asal daripada hingar.
Setiap pusat pemeriksaan dilalui sepanjang peringkat penciptaan, dan dengan setiap langkah, gambar mungkin mendapat lebih banyak maklumat.
Kesimpulan
Kesimpulannya, Disebabkan oleh beberapa penyelidikan penting yang hanya diterbitkan pada tahun 2020-an dan 2021, model resapan kini boleh mengatasi prestasi GAN dari segi sintesis gambar.
Tahun ini, OpenAI dilancarkan DALL-E2, model pengeluaran imej yang membolehkan pengamal menggunakan model resapan.
Walaupun GAN adalah canggih, kekangan mereka menjadikannya mencabar untuk skala dan menggunakannya dalam konteks baharu.
Untuk mencapai kualiti sampel seperti GAN menggunakan model berasaskan kemungkinan, banyak kerja telah dilakukan.
Sila tinggalkan balasan anda