ທ່ານເຄີຍຕັ້ງຄໍາຖາມແນວໃດວ່າລົດທີ່ຂັບລົດດ້ວຍຕົນເອງຮູ້ເວລາທີ່ຈະຢຸດຢູ່ໄຟແດງຫຼືໂທລະສັບຂອງທ່ານສາມາດລະບຸໃບຫນ້າຂອງເຈົ້າໄດ້ແນວໃດ?
ນີ້ແມ່ນບ່ອນທີ່ Convolutional Neural Network ຫຼື CNN ສໍາລັບສັ້ນເຂົ້າມາ.
CNN ແມ່ນທຽບໄດ້ກັບສະຫມອງຂອງມະນຸດທີ່ສາມາດວິເຄາະຮູບພາບເພື່ອກໍານົດສິ່ງທີ່ເກີດຂື້ນໃນພວກມັນ. ເຄືອຂ່າຍເຫຼົ່ານີ້ຍັງສາມາດກວດພົບສິ່ງທີ່ມະນຸດຈະເບິ່ງຂ້າມໄດ້!
ໃນບົດຂຽນນີ້, ພວກເຮົາຈະຄົ້ນຫາ CNN ໃນ ການຮຽນຮູ້ລຶກລັບ ສະພາບການ. ໃຫ້ເບິ່ງວ່າພື້ນທີ່ທີ່ຫນ້າຕື່ນເຕັ້ນນີ້ສາມາດສະເຫນີໃຫ້ພວກເຮົາໄດ້ແນວໃດ!
ການຮຽນຮູ້ເລິກເຊິ່ງແມ່ນຫຍັງ?
ການຮຽນຮູ້ເລິກແມ່ນປະເພດຂອງ ປັນຍາປະດິດ. ມັນຊ່ວຍໃຫ້ຄອມພິວເຕີຮຽນຮູ້.
ການຮຽນຮູ້ເລິກປະມວນຜົນຂໍ້ມູນໂດຍໃຊ້ຕົວແບບຄະນິດສາດທີ່ສັບສົນ. ດັ່ງນັ້ນ, ຄອມພິວເຕີສາມາດກວດພົບຮູບແບບແລະຈັດປະເພດຂໍ້ມູນ.
ຫຼັງຈາກການຝຶກອົບຮົມດ້ວຍຕົວຢ່າງຫຼາຍຢ່າງ, ມັນຍັງສາມາດຕັດສິນໃຈໄດ້.
ເປັນຫຍັງພວກເຮົາສົນໃຈ CNNs ໃນການຮຽນຮູ້ເລິກເຊິ່ງ?
Convolutional Neural Networks (CNNs) ແມ່ນອົງປະກອບທີ່ສໍາຄັນຂອງການຮຽນຮູ້ເລິກ.
ພວກເຂົາເຈົ້າອະນຸຍາດໃຫ້ຄອມພິວເຕີສາມາດເຂົ້າໃຈຮູບພາບແລະອື່ນໆ ຂໍ້ມູນພາບ. ພວກເຮົາສາມາດຝຶກອົບຮົມຄອມພິວເຕີເພື່ອກວດສອບຮູບແບບແລະກໍານົດວັດຖຸໂດຍອີງໃສ່ສິ່ງທີ່ເຂົາເຈົ້າ "ເບິ່ງ" ໂດຍການຈ້າງ CNN ໃນການຮຽນຮູ້ເລິກ.
CNNs ເຮັດຫນ້າທີ່ເປັນຕາການຮຽນຮູ້ເລິກ, ຊ່ວຍໃຫ້ຄອມພິວເຕີເຂົ້າໃຈສະພາບແວດລ້ອມ!
ແຮງບັນດານໃຈຈາກສະຖາປັດຕະຍະກຳຂອງສະໝອງ
CNNs ເອົາແຮງບັນດານໃຈຂອງພວກເຂົາຈາກວິທີທີ່ສະຫມອງຕີຄວາມຫມາຍຂໍ້ມູນ. neurons ທຽມ, ຫຼື nodes, ໃນ CNNs, ຍອມຮັບວັດສະດຸປ້ອນ, ປຸງແຕ່ງໃຫ້ເຂົາເຈົ້າ, ແລະສົ່ງຜົນໄດ້ຮັບເປັນຜົນຜະລິດ, ພຽງແຕ່ວິທີການ neurons ສະຫມອງເຮັດໃນທົ່ວຮ່າງກາຍ.
Input Layer
ຊັ້ນຂໍ້ມູນຂອງມາດຕະຖານ ເຄືອຂ່າຍ neural ໄດ້ຮັບວັດສະດຸປ້ອນໃນຮູບແບບຂອງອາເຣ, ເຊັ່ນ pixels ຮູບ. ໃນ CNNs, ຮູບພາບແມ່ນສະຫນອງໃຫ້ເປັນ input ກັບຊັ້ນ input.
ຊັ້ນທີ່ເຊື່ອງໄວ້
ມີຫຼາຍຊັ້ນທີ່ເຊື່ອງໄວ້ໃນ CNNs, ເຊິ່ງໃຊ້ຄະນິດສາດເພື່ອສະກັດລັກສະນະຕ່າງໆຈາກຮູບ. ມີຫຼາຍປະເພດຂອງຊັ້ນ, ລວມທັງການເຊື່ອມໂຍງຢ່າງສົມບູນ, ຫນ່ວຍເສັ້ນເສັ້ນທີ່ຖືກແກ້ໄຂ, ການລວບລວມ, ແລະຊັ້ນ convolution.
Convolution Layer
ຊັ້ນທໍາອິດທີ່ຈະສະກັດລັກສະນະຕ່າງໆຈາກຮູບການປ້ອນຂໍ້ມູນແມ່ນຊັ້ນ convolution. ຮູບພາບທີ່ປ້ອນເຂົ້າແມ່ນຂຶ້ນກັບການກັ່ນຕອງ, ແລະຜົນໄດ້ຮັບແມ່ນແຜນທີ່ຄຸນນະສົມບັດທີ່ຊີ້ໃຫ້ເຫັນອົງປະກອບທີ່ສໍາຄັນຂອງຮູບພາບ.
ການລວມຕົວຕໍ່ມາ
ຊັ້ນລວມແມ່ນໃຊ້ເພື່ອຫຍໍ້ຂະໜາດຂອງແຜນທີ່ຄຸນສົມບັດ. ມັນເສີມສ້າງຄວາມຕ້ານທານຂອງຕົວແບບໃນການປ່ຽນສະຖານທີ່ຂອງຮູບການປ້ອນຂໍ້ມູນ.
ຊັ້ນຫົວໜ່ວຍເສັ້ນທີ່ຖືກແກ້ໄຂ (ReLU)
ຊັ້ນ ReLU ຖືກຈ້າງງານເພື່ອໃຫ້ຕົວແບບບໍ່ມີເສັ້ນຊື່. ຜົນຜະລິດຂອງຊັ້ນກ່ອນຫນ້າແມ່ນເປີດໃຊ້ງານໂດຍຊັ້ນນີ້.
ຊັ້ນເຊື່ອມຕໍ່ຢ່າງເຕັມສ່ວນ
ຊັ້ນທີ່ເຊື່ອມຕໍ່ຢ່າງເຕັມສ່ວນຈະຈັດປະເພດລາຍການແລະມອບຫມາຍ ID ເປັນເອກະລັກໃນຊັ້ນຜົນຜະລິດແມ່ນຊັ້ນທີ່ເຊື່ອມຕໍ່ຢ່າງສົມບູນ.
CNNs ແມ່ນເຄືອຂ່າຍ Feedforward
ຂໍ້ມູນພຽງແຕ່ໄຫຼຈາກວັດສະດຸປ້ອນໄປຫາຜົນໄດ້ຮັບໃນທາງດຽວ. ສະຖາປັດຕະຍະກໍາຂອງພວກມັນໄດ້ຮັບການດົນໃຈຈາກ cortex ສາຍຕາຂອງສະຫມອງ, ເຊິ່ງປະກອບດ້ວຍຊັ້ນສະລັບຂອງຈຸລັງພື້ນຖານແລະຊັບຊ້ອນ.
CNNs ໄດ້ຮັບການຝຶກອົບຮົມແນວໃດ?
ພິຈາລະນາວ່າທ່ານກໍາລັງພະຍາຍາມສອນຄອມພິວເຕີເພື່ອກໍານົດແມວ.
ເຈົ້າສະແດງຮູບແມວຫຼາຍຮູບໃຫ້ມັນໃນຂະນະທີ່ເວົ້າວ່າ, "ນີ້ແມ່ນແມວ." ຫຼັງຈາກເບິ່ງຮູບພາບຂອງແມວພຽງພໍ, ຄອມພິວເຕີຈະເລີ່ມຕົ້ນທີ່ຈະຮັບຮູ້ລັກສະນະເຊັ່ນຫູແຫຼມແລະ whiskers.
ວິທີທີ່ CNN ດໍາເນີນການແມ່ນຂ້ອນຂ້າງຄ້າຍຄືກັນ. ຮູບຖ່າຍຫຼາຍຮູບຖືກສະແດງຢູ່ໃນຄອມພິວເຕີ, ແລະຊື່ຂອງສິ່ງຕ່າງໆໃນແຕ່ລະຮູບແມ່ນໄດ້ຖືກມອບໃຫ້.
ຢ່າງໃດກໍຕາມ, CNN ແບ່ງຮູບພາບອອກເປັນຕ່ອນນ້ອຍ, ເຊັ່ນ: ພາກພື້ນ. ແລະ, ມັນຮຽນຮູ້ທີ່ຈະກໍານົດຄຸນລັກສະນະໃນພາກພື້ນເຫຼົ່ານັ້ນແທນທີ່ຈະພຽງແຕ່ເບິ່ງຮູບພາບທັງຫມົດ.
ດັ່ງນັ້ນ, ຊັ້ນເບື້ອງຕົ້ນຂອງ CNN ອາດຈະກວດພົບພຽງແຕ່ລັກສະນະພື້ນຖານເຊັ່ນ: ຂອບຫຼືມຸມ. ຫຼັງຈາກນັ້ນ, ຊັ້ນຕໍ່ໄປກໍ່ສ້າງມັນເພື່ອຮັບຮູ້ລັກສະນະລາຍລະອຽດເພີ່ມເຕີມເຊັ່ນແບບຟອມຫຼືໂຄງສ້າງ.
ຊັ້ນຕ່າງໆສືບຕໍ່ປັບຕົວ ແລະໃຫ້ກຽດຄຸນນະພາບເຫຼົ່ານັ້ນ ເນື່ອງຈາກຄອມພິວເຕີເບິ່ງຮູບພາບຫຼາຍຂຶ້ນ. ມັນສືບຕໍ່ໄປຈົນກ່ວາມັນມີຄວາມຊໍານິຊໍານານຫຼາຍໃນການກໍານົດສິ່ງໃດກໍ່ຕາມທີ່ມັນຖືກຝຶກອົບຮົມ, ບໍ່ວ່າຈະເປັນແມວ, ໃບຫນ້າ, ຫຼືສິ່ງອື່ນໆ.
ເຄື່ອງມືການຮຽນຮູ້ເລິກເຊິ່ງທີ່ມີປະສິດທິພາບ: CNNs ຫັນປ່ຽນການຮັບຮູ້ຮູບພາບແນວໃດ
ໂດຍການກໍານົດແລະເຮັດໃຫ້ຄວາມຮູ້ສຶກຂອງຮູບແບບໃນຮູບພາບ, CNNs, ໄດ້ຫັນປ່ຽນການຮັບຮູ້ຮູບພາບ. ເນື່ອງຈາກພວກເຂົາໃຫ້ຜົນໄດ້ຮັບທີ່ມີຄວາມຖືກຕ້ອງສູງ, CNNs ແມ່ນສະຖາປັດຕະຍະກໍາທີ່ມີປະສິດທິພາບທີ່ສຸດສໍາລັບການຈັດປະເພດຮູບພາບ, ການດຶງຂໍ້ມູນແລະຄໍາຮ້ອງສະຫມັກການຊອກຄົ້ນຫາ.
ພວກເຂົາມັກຈະໃຫ້ຜົນໄດ້ຮັບທີ່ດີເລີດ. ແລະ, ພວກເຂົາເຈົ້າໄດ້ກໍານົດຢ່າງຊັດເຈນແລະກໍານົດວັດຖຸໃນຮູບພາບໃນຄໍາຮ້ອງສະຫມັກໃນໂລກທີ່ແທ້ຈິງ.
ຊອກຫາຮູບແບບໃນສ່ວນໃດນຶ່ງຂອງຮູບ
ບໍ່ວ່າຮູບແບບໃດຈະປາກົດຢູ່ໃນຮູບ, CNNs ຖືກອອກແບບມາເພື່ອຮັບຮູ້ມັນ. ພວກເຂົາສາມາດສະກັດຄຸນລັກສະນະທາງສາຍຕາໂດຍອັດຕະໂນມັດຈາກສະຖານທີ່ໃດໆໃນຮູບ.
ນີ້ເປັນໄປໄດ້ຍ້ອນຄວາມສາມາດຂອງເຂົາເຈົ້າເອີ້ນວ່າ "ຄວາມບໍ່ປ່ຽນແປງທາງພື້ນທີ່." ໂດຍການເຮັດໃຫ້ຂະບວນການງ່າຍຂຶ້ນ, CNNs ສາມາດຮຽນຮູ້ໂດຍກົງຈາກຮູບພາບໂດຍບໍ່ຈໍາເປັນຕ້ອງມີການສະກັດຄຸນສົມບັດຂອງມະນຸດ.
ຄວາມໄວການປະມວນຜົນຫຼາຍ ແລະໃຊ້ຄວາມຈຳໜ້ອຍລົງ
CNNs ປະມວນຜົນຮູບພາບໄວແລະມີປະສິດທິພາບຫຼາຍກ່ວາຂະບວນການແບບດັ້ງເດີມ. ນີ້ແມ່ນຜົນມາຈາກການລວມຊັ້ນ, ເຊິ່ງເຮັດໃຫ້ຈໍານວນພາລາມິເຕີທີ່ຕ້ອງໃຊ້ໃນການປະມວນຜົນຮູບໜ້ອຍລົງ.
ດ້ວຍວິທີນີ້, ພວກເຂົາຫຼຸດລົງການໃຊ້ຄວາມຊົງຈໍາແລະຄ່າໃຊ້ຈ່າຍໃນການປຸງແຕ່ງ. ຫຼາຍພື້ນທີ່ໃຊ້ CNNs, ເຊັ່ນ; ການຮັບຮູ້ໃບຫນ້າ, ການຈັດປະເພດວິດີໂອ, ແລະການວິເຄາະຮູບພາບ. ເຂົາເຈົ້າຍັງໃຊ້ເພື່ອ ຈັດປະເພດ galaxies.
ຕົວຢ່າງຊີວິດຈິງ
Google ຮູບພາບ ແມ່ນຫນຶ່ງໃນການນໍາໃຊ້ CNNs ໃນໂລກທີ່ແທ້ຈິງທີ່ຈ້າງພວກເຂົາເພື່ອກໍານົດຄົນແລະວັດຖຸໃນຮູບພາບ. ຍິ່ງໄປກວ່ານັ້ນ, ສີຟ້າສົດ ແລະ Amazon ໃຫ້ APIs ການຮັບຮູ້ຮູບພາບທີ່ແທັກແລະລະບຸວັດຖຸໂດຍໃຊ້ CNNs.
ການໂຕ້ຕອບອອນໄລນ໌ສໍາລັບການຝຶກອົບຮົມເຄືອຂ່າຍ neural ໂດຍໃຊ້ຊຸດຂໍ້ມູນ, ລວມທັງວຽກງານການຮັບຮູ້ຮູບພາບ, ແມ່ນສະຫນອງໃຫ້ໂດຍເວທີການຮຽນຮູ້ເລິກ. NVIDIA ຕົວເລກ.
ຄໍາຮ້ອງສະຫມັກເຫຼົ່ານີ້ສະແດງໃຫ້ເຫັນວິທີການ CNNs ອາດຈະຖືກນໍາໃຊ້ສໍາລັບວຽກງານທີ່ຫຼາກຫຼາຍ, ຈາກກໍລະນີການນໍາໃຊ້ການຄ້າຂະຫນາດນ້ອຍເພື່ອຈັດລະບຽບຮູບພາບຫນຶ່ງ. ຕົວຢ່າງເພີ່ມເຕີມສາມາດຄິດໄດ້.
ເຄືອຂ່າຍ Neural Convolutional ຈະພັດທະນາແນວໃດ?
ການດູແລສຸຂະພາບແມ່ນອຸດສາຫະກໍາທີ່ຫນ້າສົນໃຈທີ່ CNNs ຄາດວ່າຈະມີອິດທິພົນທີ່ສໍາຄັນ. ສໍາລັບຕົວຢ່າງ, ພວກເຂົາສາມາດຖືກນໍາໃຊ້ເພື່ອປະເມີນຮູບພາບທາງການແພດເຊັ່ນ X-rays ແລະ MRI scans. ພວກເຂົາສາມາດຊ່ວຍແພດຫມໍໃນການວິນິດໄສພະຍາດໄດ້ໄວແລະຊັດເຈນກວ່າ.
ລົດໃຫຍ່ທີ່ຂັບລົດດ້ວຍຕົນເອງແມ່ນຄໍາຮ້ອງສະຫມັກທີ່ຫນ້າສົນໃຈອີກອັນຫນຶ່ງທີ່ CNNs ອາດຈະຖືກນໍາໃຊ້ສໍາລັບການກໍານົດວັດຖຸ. ມັນສາມາດປັບປຸງວິທີການທີ່ຍານພາຫະນະເຂົ້າໃຈແລະປະຕິກິລິຍາກັບສິ່ງອ້ອມຂ້າງ.
ຈໍານວນຄົນທີ່ເພີ່ມຂຶ້ນຍັງມີຄວາມສົນໃຈໃນການສ້າງໂຄງສ້າງ CNN ທີ່ໄວແລະມີປະສິດທິພາບຫຼາຍຂຶ້ນ, ລວມທັງ CNN ມືຖື. ພວກມັນຄາດວ່າຈະຖືກໃຊ້ໃນອຸປະກອນທີ່ໃຊ້ພະລັງງານຕໍ່າເຊັ່ນ: ໂທລະສັບສະຫຼາດ ແລະເຄື່ອງສວມໃສ່.
ອອກຈາກ Reply ເປັນ