ແບບຈໍາລອງການແຜ່ກະຈາຍ Vs GAN

ສາລະບານ[ເຊື່ອງ][ສະແດງ]

ດັ່ງນັ້ນ, Generative Adversarial Networks ແມ່ນຫຍັງ?
ໃນປັດຈຸບັນ, ມັນເປັນເວລາສໍາລັບຕົວແບບການແຜ່ກະຈາຍ
ຮູບແບບການແຜ່ກະຈາຍ Vs GANs
ສະຫຼຸບ

ໂດຍທົ່ວໄປ, ແບບຈໍາລອງການຜະລິດເລິກເຊັ່ນ GANs, VAEs, ແລະຕົວແບບ autoregressive ແກ້ໄຂບັນຫາການສັງເຄາະຮູບພາບ.

ເນື່ອງຈາກຂໍ້ມູນທີ່ມີຄຸນນະພາບສູງທີ່ເຂົາເຈົ້າສ້າງ, ເຄືອຂ່າຍ adversarial ທົ່ວໄປ (GANs) ໄດ້ຮັບຄວາມສົນໃຈຫຼາຍໃນຊຸມປີມໍ່ໆມານີ້.

ແບບຈໍາລອງການແຜ່ກະຈາຍແມ່ນອີກພາກສະຫນາມທີ່ຫນ້າສົນໃຈຂອງການສຶກສາທີ່ໄດ້ສ້າງຕັ້ງຕົວຂອງມັນເອງ. ຂົງເຂດຂອງຮູບພາບ, ວິດີໂອ, ແລະການຜະລິດສຽງໄດ້ພົບເຫັນການນໍາໃຊ້ຢ່າງກວ້າງຂວາງສໍາລັບທັງສອງຂອງເຂົາເຈົ້າ.

ຮູບແບບການແຜ່ກະຈາຍທຽບກັບ GANs: ອັນໃດໃຫ້ຜົນໄດ້ຮັບທີ່ດີກວ່າ? ຕາມທໍາມະຊາດ, ນີ້ໄດ້ນໍາໄປສູ່ການສົນທະນາຢ່າງຕໍ່ເນື່ອງ.

ໃນສະຖາປັດຕະຍະກໍາຄອມພິວເຕີທີ່ເອີ້ນວ່າ GAN, ສອງ ເຄືອຂ່າຍ neural ຖືກຕໍ່ສູ້ກັບກັນແລະກັນເພື່ອຜະລິດຕົວຢ່າງທີ່ສັງເຄາະໃຫມ່ທີ່ສາມາດສົ່ງຂໍ້ມູນທີ່ແທ້ຈິງໄດ້.

ຮູບແບບການແຜ່ກະຈາຍແມ່ນໄດ້ຮັບຄວາມນິຍົມຫລາຍຂຶ້ນນັບຕັ້ງແຕ່ພວກເຂົາສະຫນອງຄວາມຫມັ້ນຄົງຂອງການຝຶກອົບຮົມແລະຜົນໄດ້ຮັບສູງສໍາລັບການຜະລິດດົນຕີແລະຮູບພາບ.

ບົດຄວາມນີ້ຈະໄປໂດຍຜ່ານຮູບແບບການແຜ່ກະຈາຍແລະ GANs ໃນລາຍລະອຽດ, ເຊັ່ນດຽວກັນກັບວິທີທີ່ພວກເຂົາແຕກຕ່າງຈາກກັນແລະກັນແລະສິ່ງອື່ນໆຈໍານວນຫນຶ່ງ.

ດັ່ງນັ້ນ, Generative Adversarial Networks ແມ່ນຫຍັງ?

ເພື່ອສ້າງຕົວຢ່າງໃຫມ່, ປອມຂອງຂໍ້ມູນທີ່ອາດຈະຖືກເຂົ້າໃຈຜິດເປັນຂໍ້ມູນທີ່ແທ້ຈິງ, ເຄືອຂ່າຍ adversarial ທົ່ວໄປ (GANs) ໃຊ້ເຄືອຂ່າຍ neural ສອງເຄືອຂ່າຍແລະຕີພວກເຂົາຕໍ່ກັນແລະກັນ (ດັ່ງນັ້ນ "ສັດຕູ" ໃນຊື່).

ພວກມັນຖືກນໍາໃຊ້ຢ່າງກວ້າງຂວາງສໍາລັບການເວົ້າ, ວິດີໂອ, ແລະການສ້າງຮູບພາບ.

ຈຸດປະສົງຂອງ GAN ແມ່ນເພື່ອສ້າງຂໍ້ມູນທີ່ບໍ່ໄດ້ຄົ້ນພົບໃນເມື່ອກ່ອນຈາກຊຸດຂໍ້ມູນສະເພາະ. ຄວາມພະຍາຍາມເພື່ອແນະນໍາຕົວແບບຂອງການແຈກຢາຍຂໍ້ມູນພື້ນຖານທີ່ແທ້ຈິງ, ບໍ່ຮູ້ຕົວຈາກຕົວຢ່າງ, ເຮັດແນວນີ້.

ເວົ້າອີກທາງເລືອກ, ເຄືອຂ່າຍເຫຼົ່ານີ້ແມ່ນຕົວແບບ implicit ທີ່ພະຍາຍາມຮຽນຮູ້ການແຈກຢາຍສະຖິຕິສະເພາະ.

ວິທີການທີ່ GAN ໃຊ້ເພື່ອຄົ້ນພົບວິທີການບັນລຸເປົ້າຫມາຍນີ້ແມ່ນນະວະນິຍາຍ. ໃນຄວາມເປັນຈິງ, ພວກເຂົາເຈົ້າຜະລິດຂໍ້ມູນໂດຍການຫຼີ້ນເກມສອງຜູ້ນເພື່ອພັດທະນາຕົວແບບ implicit.

ຕໍ່ໄປນີ້ອະທິບາຍໂຄງສ້າງ:

ການຈໍາແນກທີ່ເພີ່ມຄວາມສາມາດໃນການຈໍາແນກລະຫວ່າງຂໍ້ມູນທີ່ແທ້ຈິງແລະປອມ
ເຄື່ອງກໍາເນີດໄຟຟ້າທີ່ເລືອກເອົາວິທີການໃຫມ່ໃນການສ້າງຂໍ້ມູນສາມາດຫລອກລວງຜູ້ຈໍາແນກ.

ການຈໍາແນກເປັນເຄືອຂ່າຍ neural. ດັ່ງນັ້ນ, ເຄື່ອງກໍາເນີດໄຟຟ້າຈໍາເປັນຕ້ອງສ້າງຮູບພາບທີ່ມີຄຸນນະພາບສູງເພື່ອຫລອກລວງມັນ.

ຄວາມຈິງທີ່ວ່າເຄື່ອງປັ່ນໄຟເຫຼົ່ານີ້ບໍ່ໄດ້ຖືກຝຶກອົບຮົມໂດຍໃຊ້ການແຈກຢາຍຜົນຜະລິດໃດໆແມ່ນຄວາມແຕກຕ່າງທີ່ມີຄວາມສໍາຄັນລະຫວ່າງຕົວແບບ autoencoder ແລະຮູບແບບອື່ນໆ.

ມີສອງວິທີທີ່ຈະ decompose ຫນ້າທີ່ສູນເສຍຂອງຕົວແບບ:

ຄວາມສາມາດໃນການປະລິມານຖ້າຫາກວ່າຈໍາແນກໄດ້ຄາດຄະເນຂໍ້ມູນທີ່ແທ້ຈິງໄດ້ຢ່າງຖືກຕ້ອງ
ຂໍ້ມູນທີ່ສ້າງຂຶ້ນແມ່ນຖືກຄາດຄະເນຢ່າງຖືກຕ້ອງໂດຍສ່ວນຫນຶ່ງ.

ໃນຕົວຈໍາແນກທີ່ເປັນໄປໄດ້ທີ່ດີທີ່ສຸດ, ຫນ້າທີ່ສູນເສຍນີ້ຈະຖືກຫຼຸດລົງ:

ຮູບແບບທົ່ວໄປສາມາດຖືກຄິດວ່າເປັນແບບຈໍາລອງການຫຼຸດຜ່ອນໄລຍະຫ່າງແລະ, ຖ້າການຈໍາແນກແມ່ນເຫມາະສົມ, ເປັນການຫຼຸດຜ່ອນຄວາມແຕກຕ່າງລະຫວ່າງການແຈກຢາຍທີ່ແທ້ຈິງແລະການຜະລິດ.

ໃນຄວາມເປັນຈິງ, ຄວາມແຕກຕ່າງທີ່ແຕກຕ່າງກັນອາດຈະຖືກຈ້າງງານແລະສົ່ງຜົນໃຫ້ວິທີການຝຶກອົບຮົມ GAN ຕ່າງໆ.

ນະໂຍບາຍດ້ານການຮຽນຮູ້, ເຊິ່ງລວມມີການຊື້ຂາຍລະຫວ່າງເຄື່ອງກໍາເນີດແລະການຈໍາແນກ, ມີຄວາມທ້າທາຍທີ່ຈະປະຕິບັດຕາມ, ເຖິງແມ່ນວ່າມັນງ່າຍດາຍທີ່ຈະປັບຫນ້າທີ່ສູນເສຍຂອງ GANs.

ຍັງບໍ່ມີການຮັບປະກັນວ່າການຮຽນຮູ້ຈະເຂົ້າກັນ. ດັ່ງນັ້ນ, ການຝຶກອົບຮົມຮູບແບບ GAN ແມ່ນມີຄວາມຫຍຸ້ງຍາກ, ເນື່ອງຈາກວ່າມັນເປັນເລື່ອງປົກກະຕິທີ່ຈະດໍາເນີນການຜ່ານບັນຫາຕ່າງໆເຊັ່ນ: gradients ຫາຍໄປແລະການລົ້ມລົງຂອງຮູບແບບ (ເມື່ອບໍ່ມີຄວາມຫຼາກຫຼາຍໃນຕົວຢ່າງທີ່ສ້າງຂຶ້ນ).

ໃນປັດຈຸບັນ, ມັນເປັນເວລາສໍາລັບຕົວແບບການແຜ່ກະຈາຍ

ບັນຫາກັບການປະສົມປະສານການຝຶກອົບຮົມຂອງ GANs ໄດ້ຖືກແກ້ໄຂໂດຍຜ່ານການພັດທະນາແບບຈໍາລອງການແຜ່ກະຈາຍ.

ຮູບແບບເຫຼົ່ານີ້ສົມມຸດວ່າຂະບວນການແຜ່ກະຈາຍແມ່ນທຽບເທົ່າກັບການສູນເສຍຂໍ້ມູນທີ່ນໍາມາໂດຍການແຊກແຊງກ້າວຫນ້າຂອງສິ່ງລົບກວນ (ສຽງ gaussian ຈະຖືກເພີ່ມຢູ່ໃນທຸກໆຂັ້ນຕອນຂອງຂະບວນການກະຈາຍ).

ຈຸດປະສົງຂອງແບບຈໍາລອງດັ່ງກ່າວແມ່ນເພື່ອກໍານົດວ່າສິ່ງລົບກວນມີຜົນກະທົບແນວໃດກັບຂໍ້ມູນທີ່ມີຢູ່ໃນຕົວຢ່າງ, ຫຼື, ຫຼືອີກວິທີຫນຶ່ງ, ຂໍ້ມູນຖືກສູນເສຍຍ້ອນການແຜ່ກະຈາຍ.

ຖ້າຕົວແບບສາມາດຄິດໄດ້, ມັນຄວນຈະສາມາດດຶງເອົາຕົວຢ່າງຕົ້ນສະບັບແລະຍົກເລີກການສູນເສຍຂໍ້ມູນທີ່ເກີດຂື້ນ.

ນີ້ແມ່ນສໍາເລັດໂດຍຜ່ານຮູບແບບການແຜ່ກະຈາຍ denoising. ຂະບວນການແຜ່ກະຈາຍໄປຂ້າງຫນ້າ ແລະຂະບວນການແຜ່ກະຈາຍແບບປີ້ນກັບກັນ ປະກອບເປັນສອງຂັ້ນຕອນ.

ຂະບວນການແຜ່ກະຈາຍໄປຂ້າງຫນ້າປະກອບດ້ວຍການຄ່ອຍໆເພີ່ມສິ່ງລົບກວນ Gaussian (ເຊັ່ນ, ຂະບວນການກະຈາຍ) ຈົນກ່ວາຂໍ້ມູນຖືກປົນເປື້ອນຢ່າງສົມບູນໂດຍສິ່ງລົບກວນ.

ເຄືອຂ່າຍ neural ຕໍ່ມາໄດ້ຮັບການຝຶກອົບຮົມໂດຍໃຊ້ວິທີການແຜ່ກະຈາຍແບບປີ້ນກັບກັນເພື່ອຮຽນຮູ້ຄວາມເປັນໄປໄດ້ຂອງການແຈກຢາຍຕາມເງື່ອນໄຂເພື່ອກັບຄືນສຽງ.

ໃນທີ່ນີ້ທ່ານສາມາດເຂົ້າໃຈເພີ່ມເຕີມກ່ຽວກັບການ ຮູບແບບການແຜ່ກະຈາຍ.

ຮູບແບບການແຜ່ກະຈາຍ Vs GANs

ເຊັ່ນດຽວກັນກັບຮູບແບບການແຜ່ກະຈາຍ, GANs ຜະລິດຮູບພາບຈາກສິ່ງລົບກວນ.

ຮູບແບບດັ່ງກ່າວແມ່ນປະກອບດ້ວຍເຄືອຂ່າຍ neural ຂອງເຄື່ອງກໍາເນີດໄຟຟ້າ, ເຊິ່ງເລີ່ມຕົ້ນດ້ວຍສຽງລົບກວນຂອງຕົວແປທີ່ມີຂໍ້ມູນບາງຢ່າງ, ເຊັ່ນ: ປ້າຍຊັ້ນຮຽນຫຼືການເຂົ້າລະຫັດຂໍ້ຄວາມ.

ຫຼັງຈາກນັ້ນ, ຜົນໄດ້ຮັບຄວນຈະເປັນບາງສິ່ງບາງຢ່າງທີ່ຄ້າຍຄືກັບຮູບພາບທີ່ແທ້ຈິງ.

ເພື່ອສ້າງຮູບພາບທີ່ແທ້ຈິງແລະຄວາມຊື່ສັດສູງ, ພວກເຮົາຈ້າງ GANs. ເຖິງແມ່ນວ່າຮູບພາບທີ່ແທ້ຈິງຫຼາຍກ່ວາ GANs ແມ່ນຜະລິດໂດຍໃຊ້ຕົວແບບການແຜ່ກະຈາຍ.

ໃນທາງກົງກັນຂ້າມ, ຮູບແບບການແຜ່ກະຈາຍແມ່ນຖືກຕ້ອງກວ່າໃນການອະທິບາຍຂໍ້ເທັດຈິງ.

ໃນຂະນະທີ່ GAN ໃຊ້ເວລາເປັນ input noise random ຫຼືຕົວແປການປັບລະດັບຫ້ອງຮຽນແລະ outputs ເປັນຕົວຢ່າງທີ່ແທ້ຈິງ, ຮູບແບບການແຜ່ກະຈາຍມັກຈະຊ້າລົງ, ຊ້ໍາຊ້ອນ, ແລະຕ້ອງການຄໍາແນະນໍາຫຼາຍ.

ບໍ່ມີຊ່ອງຫວ່າງຫຼາຍສໍາລັບຄວາມຜິດພາດໃນເວລາທີ່ denoising ຖືກນໍາໃຊ້ຊ້ໍາຊ້ອນກັບເປົ້າຫມາຍຂອງການກັບຄືນໄປຮູບພາບຕົ້ນສະບັບຈາກສິ່ງລົບກວນ.

ແຕ່ລະດ່ານຖືກຜ່ານຕະຫຼອດຂັ້ນຕອນການສ້າງ, ແລະດ້ວຍແຕ່ລະຂັ້ນຕອນ, ຮູບພາບອາດຈະໄດ້ຮັບຂໍ້ມູນເພີ່ມເຕີມ.

ສະຫຼຸບ

ສະຫຼຸບແລ້ວ, ເນື່ອງຈາກການຄົ້ນຄວ້າທີ່ສໍາຄັນຈໍານວນຫນ້ອຍທີ່ໄດ້ຖືກຈັດພີມມາພຽງແຕ່ໃນຊຸມປີ 2020 ແລະ 2021, ຮູບແບບການແຜ່ກະຈາຍສາມາດປະຕິບັດໄດ້ດີກວ່າ GANs ໃນແງ່ຂອງການສັງເຄາະຮູບພາບ.

ປີນີ້, OpenAI ໄດ້ເປີດຕົວ DALL-E2, ຮູບແບບການຜະລິດຮູບພາບທີ່ອະນຸຍາດໃຫ້ຜູ້ປະຕິບັດການຈ້າງຕົວແບບການແຜ່ກະຈາຍ.

ເຖິງແມ່ນວ່າ GANs ມີຄວາມກ້າວຫນ້າ, ແຕ່ຂໍ້ຈໍາກັດຂອງພວກມັນເຮັດໃຫ້ມັນທ້າທາຍທີ່ຈະຂະຫຍາຍຂະຫນາດແລະນໍາໃຊ້ພວກມັນໃນສະພາບການໃຫມ່.

ເພື່ອບັນລຸຄຸນນະພາບຕົວຢ່າງຂອງ GAN ໂດຍໃຊ້ຕົວແບບທີ່ອີງໃສ່ຄວາມເປັນໄປໄດ້, ວຽກງານຫຼາຍໄດ້ຖືກໃສ່ເຂົ້າໃນມັນ.

ຮູບແບບການແຜ່ກະຈາຍ Vs GAN

ດັ່ງນັ້ນ, Generative Adversarial Networks ແມ່ນຫຍັງ?

ໃນປັດຈຸບັນ, ມັນເປັນເວລາສໍາລັບຕົວແບບການແຜ່ກະຈາຍ

ຮູບແບບການແຜ່ກະຈາຍ Vs GANs

ສະຫຼຸບ

ກ່ຽວກັບ Jay

ບົດຄວາມເພີ່ມເຕີມກ່ຽວກັບ HashDork:

ວິທີການຫຼຸດຜ່ອນ Hallucinations ໃນ AI ຂອງທ່ານ

Colossyan vs Heygen

ຈົດໝາຍຂ່າວເທັກໂນໂລຍີໃນອະນາຄົດນີ້ບໍ່ດູດ

ຮູບແບບການແຜ່ກະຈາຍ Vs GAN

ດັ່ງນັ້ນ, Generative Adversarial Networks ແມ່ນຫຍັງ?

ໃນປັດຈຸບັນ, ມັນເປັນເວລາສໍາລັບຕົວແບບການແຜ່ກະຈາຍ

ຮູບແບບການແຜ່ກະຈາຍ Vs GANs

ສະຫຼຸບ

ກ່ຽວ​ກັບ Jay

ບົດຄວາມເພີ່ມເຕີມກ່ຽວກັບ HashDork:

ວິທີການຫຼຸດຜ່ອນ Hallucinations ໃນ AI ຂອງທ່ານ

10 ເຄື່ອງມື AI ທີ່ດີທີ່ສຸດສໍາລັບສື່ມວນຊົນສັງຄົມ

Colossyan vs Heygen

10 ເຄື່ອງມືສ້າງວິດີໂອເຄື່ອນໄຫວ AI ທີ່ດີທີ່ສຸດ

ຕິດຕໍ່ພົວພັນ Reader

ອອກຈາກ Reply ເປັນ ຍົກເລີກການຕອບ

ຈົດໝາຍຂ່າວເທັກໂນໂລຍີໃນອະນາຄົດນີ້ບໍ່ດູດ

ກ່ຽວກັບ Jay