ໂດຍທົ່ວໄປ, ແບບຈໍາລອງການຜະລິດເລິກເຊັ່ນ GANs, VAEs, ແລະຕົວແບບ autoregressive ແກ້ໄຂບັນຫາການສັງເຄາະຮູບພາບ.
ເນື່ອງຈາກຂໍ້ມູນທີ່ມີຄຸນນະພາບສູງທີ່ເຂົາເຈົ້າສ້າງ, ເຄືອຂ່າຍ adversarial ທົ່ວໄປ (GANs) ໄດ້ຮັບຄວາມສົນໃຈຫຼາຍໃນຊຸມປີມໍ່ໆມານີ້.
ແບບຈໍາລອງການແຜ່ກະຈາຍແມ່ນອີກພາກສະຫນາມທີ່ຫນ້າສົນໃຈຂອງການສຶກສາທີ່ໄດ້ສ້າງຕັ້ງຕົວຂອງມັນເອງ. ຂົງເຂດຂອງຮູບພາບ, ວິດີໂອ, ແລະການຜະລິດສຽງໄດ້ພົບເຫັນການນໍາໃຊ້ຢ່າງກວ້າງຂວາງສໍາລັບທັງສອງຂອງເຂົາເຈົ້າ.
ຮູບແບບການແຜ່ກະຈາຍທຽບກັບ GANs: ອັນໃດໃຫ້ຜົນໄດ້ຮັບທີ່ດີກວ່າ? ຕາມທໍາມະຊາດ, ນີ້ໄດ້ນໍາໄປສູ່ການສົນທະນາຢ່າງຕໍ່ເນື່ອງ.
ໃນສະຖາປັດຕະຍະກໍາຄອມພິວເຕີທີ່ເອີ້ນວ່າ GAN, ສອງ ເຄືອຂ່າຍ neural ຖືກຕໍ່ສູ້ກັບກັນແລະກັນເພື່ອຜະລິດຕົວຢ່າງທີ່ສັງເຄາະໃຫມ່ທີ່ສາມາດສົ່ງຂໍ້ມູນທີ່ແທ້ຈິງໄດ້.
ຮູບແບບການແຜ່ກະຈາຍແມ່ນໄດ້ຮັບຄວາມນິຍົມຫລາຍຂຶ້ນນັບຕັ້ງແຕ່ພວກເຂົາສະຫນອງຄວາມຫມັ້ນຄົງຂອງການຝຶກອົບຮົມແລະຜົນໄດ້ຮັບສູງສໍາລັບການຜະລິດດົນຕີແລະຮູບພາບ.
ບົດຄວາມນີ້ຈະໄປໂດຍຜ່ານຮູບແບບການແຜ່ກະຈາຍແລະ GANs ໃນລາຍລະອຽດ, ເຊັ່ນດຽວກັນກັບວິທີທີ່ພວກເຂົາແຕກຕ່າງຈາກກັນແລະກັນແລະສິ່ງອື່ນໆຈໍານວນຫນຶ່ງ.
ດັ່ງນັ້ນ, Generative Adversarial Networks ແມ່ນຫຍັງ?
ເພື່ອສ້າງຕົວຢ່າງໃຫມ່, ປອມຂອງຂໍ້ມູນທີ່ອາດຈະຖືກເຂົ້າໃຈຜິດເປັນຂໍ້ມູນທີ່ແທ້ຈິງ, ເຄືອຂ່າຍ adversarial ທົ່ວໄປ (GANs) ໃຊ້ເຄືອຂ່າຍ neural ສອງເຄືອຂ່າຍແລະຕີພວກເຂົາຕໍ່ກັນແລະກັນ (ດັ່ງນັ້ນ "ສັດຕູ" ໃນຊື່).
ພວກມັນຖືກນໍາໃຊ້ຢ່າງກວ້າງຂວາງສໍາລັບການເວົ້າ, ວິດີໂອ, ແລະການສ້າງຮູບພາບ.
ຈຸດປະສົງຂອງ GAN ແມ່ນເພື່ອສ້າງຂໍ້ມູນທີ່ບໍ່ໄດ້ຄົ້ນພົບໃນເມື່ອກ່ອນຈາກຊຸດຂໍ້ມູນສະເພາະ. ຄວາມພະຍາຍາມເພື່ອແນະນໍາຕົວແບບຂອງການແຈກຢາຍຂໍ້ມູນພື້ນຖານທີ່ແທ້ຈິງ, ບໍ່ຮູ້ຕົວຈາກຕົວຢ່າງ, ເຮັດແນວນີ້.
ເວົ້າອີກທາງເລືອກ, ເຄືອຂ່າຍເຫຼົ່ານີ້ແມ່ນຕົວແບບ implicit ທີ່ພະຍາຍາມຮຽນຮູ້ການແຈກຢາຍສະຖິຕິສະເພາະ.
ວິທີການທີ່ GAN ໃຊ້ເພື່ອຄົ້ນພົບວິທີການບັນລຸເປົ້າຫມາຍນີ້ແມ່ນນະວະນິຍາຍ. ໃນຄວາມເປັນຈິງ, ພວກເຂົາເຈົ້າຜະລິດຂໍ້ມູນໂດຍການຫຼີ້ນເກມສອງຜູ້ນເພື່ອພັດທະນາຕົວແບບ implicit.
ຕໍ່ໄປນີ້ອະທິບາຍໂຄງສ້າງ:
- ການຈໍາແນກທີ່ເພີ່ມຄວາມສາມາດໃນການຈໍາແນກລະຫວ່າງຂໍ້ມູນທີ່ແທ້ຈິງແລະປອມ
- ເຄື່ອງກໍາເນີດໄຟຟ້າທີ່ເລືອກເອົາວິທີການໃຫມ່ໃນການສ້າງຂໍ້ມູນສາມາດຫລອກລວງຜູ້ຈໍາແນກ.
ການຈໍາແນກເປັນເຄືອຂ່າຍ neural. ດັ່ງນັ້ນ, ເຄື່ອງກໍາເນີດໄຟຟ້າຈໍາເປັນຕ້ອງສ້າງຮູບພາບທີ່ມີຄຸນນະພາບສູງເພື່ອຫລອກລວງມັນ.
ຄວາມຈິງທີ່ວ່າເຄື່ອງປັ່ນໄຟເຫຼົ່ານີ້ບໍ່ໄດ້ຖືກຝຶກອົບຮົມໂດຍໃຊ້ການແຈກຢາຍຜົນຜະລິດໃດໆແມ່ນຄວາມແຕກຕ່າງທີ່ມີຄວາມສໍາຄັນລະຫວ່າງຕົວແບບ autoencoder ແລະຮູບແບບອື່ນໆ.
ມີສອງວິທີທີ່ຈະ decompose ຫນ້າທີ່ສູນເສຍຂອງຕົວແບບ:
- ຄວາມສາມາດໃນການປະລິມານຖ້າຫາກວ່າຈໍາແນກໄດ້ຄາດຄະເນຂໍ້ມູນທີ່ແທ້ຈິງໄດ້ຢ່າງຖືກຕ້ອງ
- ຂໍ້ມູນທີ່ສ້າງຂຶ້ນແມ່ນຖືກຄາດຄະເນຢ່າງຖືກຕ້ອງໂດຍສ່ວນຫນຶ່ງ.
ໃນຕົວຈໍາແນກທີ່ເປັນໄປໄດ້ທີ່ດີທີ່ສຸດ, ຫນ້າທີ່ສູນເສຍນີ້ຈະຖືກຫຼຸດລົງ:
ຮູບແບບທົ່ວໄປສາມາດຖືກຄິດວ່າເປັນແບບຈໍາລອງການຫຼຸດຜ່ອນໄລຍະຫ່າງແລະ, ຖ້າການຈໍາແນກແມ່ນເຫມາະສົມ, ເປັນການຫຼຸດຜ່ອນຄວາມແຕກຕ່າງລະຫວ່າງການແຈກຢາຍທີ່ແທ້ຈິງແລະການຜະລິດ.
ໃນຄວາມເປັນຈິງ, ຄວາມແຕກຕ່າງທີ່ແຕກຕ່າງກັນອາດຈະຖືກຈ້າງງານແລະສົ່ງຜົນໃຫ້ວິທີການຝຶກອົບຮົມ GAN ຕ່າງໆ.
ນະໂຍບາຍດ້ານການຮຽນຮູ້, ເຊິ່ງລວມມີການຊື້ຂາຍລະຫວ່າງເຄື່ອງກໍາເນີດແລະການຈໍາແນກ, ມີຄວາມທ້າທາຍທີ່ຈະປະຕິບັດຕາມ, ເຖິງແມ່ນວ່າມັນງ່າຍດາຍທີ່ຈະປັບຫນ້າທີ່ສູນເສຍຂອງ GANs.
ຍັງບໍ່ມີການຮັບປະກັນວ່າການຮຽນຮູ້ຈະເຂົ້າກັນ. ດັ່ງນັ້ນ, ການຝຶກອົບຮົມຮູບແບບ GAN ແມ່ນມີຄວາມຫຍຸ້ງຍາກ, ເນື່ອງຈາກວ່າມັນເປັນເລື່ອງປົກກະຕິທີ່ຈະດໍາເນີນການຜ່ານບັນຫາຕ່າງໆເຊັ່ນ: gradients ຫາຍໄປແລະການລົ້ມລົງຂອງຮູບແບບ (ເມື່ອບໍ່ມີຄວາມຫຼາກຫຼາຍໃນຕົວຢ່າງທີ່ສ້າງຂຶ້ນ).
ໃນປັດຈຸບັນ, ມັນເປັນເວລາສໍາລັບຕົວແບບການແຜ່ກະຈາຍ
ບັນຫາກັບການປະສົມປະສານການຝຶກອົບຮົມຂອງ GANs ໄດ້ຖືກແກ້ໄຂໂດຍຜ່ານການພັດທະນາແບບຈໍາລອງການແຜ່ກະຈາຍ.
ຮູບແບບເຫຼົ່ານີ້ສົມມຸດວ່າຂະບວນການແຜ່ກະຈາຍແມ່ນທຽບເທົ່າກັບການສູນເສຍຂໍ້ມູນທີ່ນໍາມາໂດຍການແຊກແຊງກ້າວຫນ້າຂອງສິ່ງລົບກວນ (ສຽງ gaussian ຈະຖືກເພີ່ມຢູ່ໃນທຸກໆຂັ້ນຕອນຂອງຂະບວນການກະຈາຍ).
ຈຸດປະສົງຂອງແບບຈໍາລອງດັ່ງກ່າວແມ່ນເພື່ອກໍານົດວ່າສິ່ງລົບກວນມີຜົນກະທົບແນວໃດກັບຂໍ້ມູນທີ່ມີຢູ່ໃນຕົວຢ່າງ, ຫຼື, ຫຼືອີກວິທີຫນຶ່ງ, ຂໍ້ມູນຖືກສູນເສຍຍ້ອນການແຜ່ກະຈາຍ.
ຖ້າຕົວແບບສາມາດຄິດໄດ້, ມັນຄວນຈະສາມາດດຶງເອົາຕົວຢ່າງຕົ້ນສະບັບແລະຍົກເລີກການສູນເສຍຂໍ້ມູນທີ່ເກີດຂື້ນ.
ນີ້ແມ່ນສໍາເລັດໂດຍຜ່ານຮູບແບບການແຜ່ກະຈາຍ denoising. ຂະບວນການແຜ່ກະຈາຍໄປຂ້າງຫນ້າ ແລະຂະບວນການແຜ່ກະຈາຍແບບປີ້ນກັບກັນ ປະກອບເປັນສອງຂັ້ນຕອນ.
ຂະບວນການແຜ່ກະຈາຍໄປຂ້າງຫນ້າປະກອບດ້ວຍການຄ່ອຍໆເພີ່ມສິ່ງລົບກວນ Gaussian (ເຊັ່ນ, ຂະບວນການກະຈາຍ) ຈົນກ່ວາຂໍ້ມູນຖືກປົນເປື້ອນຢ່າງສົມບູນໂດຍສິ່ງລົບກວນ.
ເຄືອຂ່າຍ neural ຕໍ່ມາໄດ້ຮັບການຝຶກອົບຮົມໂດຍໃຊ້ວິທີການແຜ່ກະຈາຍແບບປີ້ນກັບກັນເພື່ອຮຽນຮູ້ຄວາມເປັນໄປໄດ້ຂອງການແຈກຢາຍຕາມເງື່ອນໄຂເພື່ອກັບຄືນສຽງ.
ໃນທີ່ນີ້ທ່ານສາມາດເຂົ້າໃຈເພີ່ມເຕີມກ່ຽວກັບການ ຮູບແບບການແຜ່ກະຈາຍ.
ຮູບແບບການແຜ່ກະຈາຍ Vs GANs
ເຊັ່ນດຽວກັນກັບຮູບແບບການແຜ່ກະຈາຍ, GANs ຜະລິດຮູບພາບຈາກສິ່ງລົບກວນ.
ຮູບແບບດັ່ງກ່າວແມ່ນປະກອບດ້ວຍເຄືອຂ່າຍ neural ຂອງເຄື່ອງກໍາເນີດໄຟຟ້າ, ເຊິ່ງເລີ່ມຕົ້ນດ້ວຍສຽງລົບກວນຂອງຕົວແປທີ່ມີຂໍ້ມູນບາງຢ່າງ, ເຊັ່ນ: ປ້າຍຊັ້ນຮຽນຫຼືການເຂົ້າລະຫັດຂໍ້ຄວາມ.
ຫຼັງຈາກນັ້ນ, ຜົນໄດ້ຮັບຄວນຈະເປັນບາງສິ່ງບາງຢ່າງທີ່ຄ້າຍຄືກັບຮູບພາບທີ່ແທ້ຈິງ.
ເພື່ອສ້າງຮູບພາບທີ່ແທ້ຈິງແລະຄວາມຊື່ສັດສູງ, ພວກເຮົາຈ້າງ GANs. ເຖິງແມ່ນວ່າຮູບພາບທີ່ແທ້ຈິງຫຼາຍກ່ວາ GANs ແມ່ນຜະລິດໂດຍໃຊ້ຕົວແບບການແຜ່ກະຈາຍ.
ໃນທາງກົງກັນຂ້າມ, ຮູບແບບການແຜ່ກະຈາຍແມ່ນຖືກຕ້ອງກວ່າໃນການອະທິບາຍຂໍ້ເທັດຈິງ.
ໃນຂະນະທີ່ GAN ໃຊ້ເວລາເປັນ input noise random ຫຼືຕົວແປການປັບລະດັບຫ້ອງຮຽນແລະ outputs ເປັນຕົວຢ່າງທີ່ແທ້ຈິງ, ຮູບແບບການແຜ່ກະຈາຍມັກຈະຊ້າລົງ, ຊ້ໍາຊ້ອນ, ແລະຕ້ອງການຄໍາແນະນໍາຫຼາຍ.
ບໍ່ມີຊ່ອງຫວ່າງຫຼາຍສໍາລັບຄວາມຜິດພາດໃນເວລາທີ່ denoising ຖືກນໍາໃຊ້ຊ້ໍາຊ້ອນກັບເປົ້າຫມາຍຂອງການກັບຄືນໄປຮູບພາບຕົ້ນສະບັບຈາກສິ່ງລົບກວນ.
ແຕ່ລະດ່ານຖືກຜ່ານຕະຫຼອດຂັ້ນຕອນການສ້າງ, ແລະດ້ວຍແຕ່ລະຂັ້ນຕອນ, ຮູບພາບອາດຈະໄດ້ຮັບຂໍ້ມູນເພີ່ມເຕີມ.
ສະຫຼຸບ
ສະຫຼຸບແລ້ວ, ເນື່ອງຈາກການຄົ້ນຄວ້າທີ່ສໍາຄັນຈໍານວນຫນ້ອຍທີ່ໄດ້ຖືກຈັດພີມມາພຽງແຕ່ໃນຊຸມປີ 2020 ແລະ 2021, ຮູບແບບການແຜ່ກະຈາຍສາມາດປະຕິບັດໄດ້ດີກວ່າ GANs ໃນແງ່ຂອງການສັງເຄາະຮູບພາບ.
ປີນີ້, OpenAI ໄດ້ເປີດຕົວ DALL-E2, ຮູບແບບການຜະລິດຮູບພາບທີ່ອະນຸຍາດໃຫ້ຜູ້ປະຕິບັດການຈ້າງຕົວແບບການແຜ່ກະຈາຍ.
ເຖິງແມ່ນວ່າ GANs ມີຄວາມກ້າວຫນ້າ, ແຕ່ຂໍ້ຈໍາກັດຂອງພວກມັນເຮັດໃຫ້ມັນທ້າທາຍທີ່ຈະຂະຫຍາຍຂະຫນາດແລະນໍາໃຊ້ພວກມັນໃນສະພາບການໃຫມ່.
ເພື່ອບັນລຸຄຸນນະພາບຕົວຢ່າງຂອງ GAN ໂດຍໃຊ້ຕົວແບບທີ່ອີງໃສ່ຄວາມເປັນໄປໄດ້, ວຽກງານຫຼາຍໄດ້ຖືກໃສ່ເຂົ້າໃນມັນ.
ອອກຈາກ Reply ເປັນ