ມັນໝັ້ນໃຈທີ່ຈະຮູ້ວ່າພວກເຮົາໄດ້ຈັດການຫຸ່ນຍົນດ້ວຍຄວາມສາມາດທີ່ມາຈາກກໍາເນີດຂອງພວກເຮົາເພື່ອຮຽນຮູ້ໂດຍຕົວຢ່າງ ແລະຮັບຮູ້ສິ່ງອ້ອມຂ້າງຂອງມັນ. ສິ່ງທ້າທາຍພື້ນຖານແມ່ນການສອນຄອມພິວເຕີໃຫ້ "ເບິ່ງ" ຄືກັບວ່າມະນຸດຕ້ອງການເວລາແລະຄວາມພະຍາຍາມຫຼາຍກວ່າເກົ່າ.
ເຖິງຢ່າງໃດກໍຕາມ, ເມື່ອພິຈາລະນາຄຸນຄ່າຕົວຈິງທີ່ສີມືແຮງງານນີ້ສະໜອງໃຫ້ບັນດາອົງການ, ວິສາຫະກິດປະຈຸບັນ, ຄວາມມານະພະຍາຍາມກໍ່ມີຄຸນຄ່າ. ໃນບົດຄວາມນີ້, ທ່ານຈະຮຽນຮູ້ກ່ຽວກັບການຈັດປະເພດຮູບພາບ, ວິທີການເຮັດວຽກ, ແລະການປະຕິບັດຕົວຈິງຂອງມັນ. ໃຫ້ເລີ່ມຕົ້ນ.
ການຈັດປະເພດຮູບພາບແມ່ນຫຍັງ?
ວຽກເຮັດງານທໍາຂອງການໃຫ້ອາຫານຮູບພາບເປັນ ເຄືອຂ່າຍ neural ແລະການໃຫ້ມັນອອກບາງຮູບແບບຂອງປ້າຍຊື່ສໍາລັບຮູບນັ້ນເອີ້ນວ່າການຮັບຮູ້ຮູບພາບ. ປ້າຍກຳກັບຜົນຜະລິດຂອງເຄືອຂ່າຍຈະກົງກັບຊັ້ນທີ່ກຳນົດໄວ້ລ່ວງໜ້າ.
ອາດຈະມີຫ້ອງຮຽນຈໍານວນຫຼາຍທີ່ຖືກມອບຫມາຍໃຫ້ຮູບພາບ, ຫຼືພຽງແຕ່ຫນຶ່ງ. ເມື່ອມີຊັ້ນຮຽນດຽວ, ຄໍາວ່າ "ການຮັບຮູ້" ຖືກນໍາໃຊ້ເລື້ອຍໆ, ໃນຂະນະທີ່ມີຫລາຍຊັ້ນ, ຄໍາວ່າ "ການຈັດປະເພດ" ແມ່ນໃຊ້ເລື້ອຍໆ.
ກວດຫາວັດຖຸ ແມ່ນຊຸດຍ່ອຍຂອງການຈັດປະເພດຮູບພາບທີ່ບາງຕົວຢ່າງຂອງວັດຖຸຖືກກວດພົບວ່າເປັນຂອງປະເພດໃດໜຶ່ງ ເຊັ່ນ: ສັດ, ພາຫະນະ, ຫຼືມະນຸດ.
ການຈັດປະເພດຮູບພາບເຮັດວຽກແນວໃດ?
ຮູບພາບໃນຮູບແບບຂອງ pixels ໄດ້ຖືກວິເຄາະໂດຍຄອມພິວເຕີ. ມັນເຮັດສໍາເລັດນີ້ໂດຍການປິ່ນປົວຮູບພາບເປັນການລວບລວມຂອງ matrices, ຂະຫນາດທີ່ຖືກກໍານົດໂດຍຄວາມລະອຽດຂອງຮູບພາບ. ເວົ້າງ່າຍໆ, ການຈັດປະເພດຮູບພາບແມ່ນການສຶກສາຂໍ້ມູນສະຖິຕິໂດຍໃຊ້ algorithms ຈາກທັດສະນະຂອງຄອມພິວເຕີ້.
ການຈັດປະເພດຮູບພາບແມ່ນສໍາເລັດໃນການປະມວນຜົນຮູບພາບດິຈິຕອນໂດຍການຈັດກຸ່ມ pixels ເຂົ້າໄປໃນກຸ່ມທີ່ກໍານົດໄວ້ລ່ວງຫນ້າ, ຫຼື "ຫ້ອງຮຽນ." ສູດການຄິດໄລ່ການແບ່ງຮູບພາບເຂົ້າໄປໃນລໍາດັບຂອງລັກສະນະທີ່ຫນ້າສັງເກດ, ເຊິ່ງຊ່ວຍຫຼຸດຜ່ອນພາລະສໍາລັບຕົວຈັດປະເພດສຸດທ້າຍ.
ຄຸນນະພາບເຫຼົ່ານີ້ແຈ້ງໃຫ້ຜູ້ຈັດປະເພດກ່ຽວກັບຄວາມຫມາຍຂອງຮູບພາບແລະການຈັດປະເພດທີ່ມີທ່າແຮງ. ເນື່ອງຈາກວ່າສ່ວນທີ່ເຫຼືອຂອງຂະບວນການໃນການຈັດປະເພດຮູບພາບແມ່ນຂຶ້ນກັບມັນ, ວິທີການສະກັດເອົາລັກສະນະເປັນໄລຍະທີ່ສໍາຄັນທີ່ສຸດ.
ໄດ້ ຂໍ້ມູນສະຫນອງໃຫ້ ສູດການຄິດໄລ່ຍັງມີຄວາມສໍາຄັນໃນການຈັດປະເພດຮູບພາບ, ໂດຍສະເພາະການຈັດປະເພດທີ່ມີການເບິ່ງແຍງ. ໃນການສົມທຽບກັບຊຸດຂໍ້ມູນທີ່ຂີ້ຮ້າຍທີ່ມີຄວາມບໍ່ສົມດຸນຂອງຂໍ້ມູນໂດຍອີງໃສ່ຊັ້ນຮຽນແລະຄຸນນະພາບຂອງຮູບພາບແລະຄໍາບັນຍາຍ, ຊຸດຂໍ້ມູນການຈັດປະເພດທີ່ດີທີ່ສຸດປະຕິບັດຫນ້າຊົມເຊີຍ.
ການຈັດປະເພດຮູບພາບໂດຍໃຊ້ Tensorflow & Keras ໃນ python
ພວກເຮົາຈະໃຊ້ CIFAR-10 ຊຸດຂໍ້ມູນ (ເຊິ່ງລວມມີເຮືອບິນ, ເຮືອບິນ, ນົກ, ແລະອີກ 7 ຢ່າງ).
1. ການຕິດຕັ້ງຄວາມຕ້ອງການ
ລະຫັດຂ້າງລຸ່ມນີ້ຈະຕິດຕັ້ງທຸກເງື່ອນໄຂເບື້ອງຕົ້ນ.
2. ການນໍາເຂົ້າການຂຶ້ນກັບ
ສ້າງໄຟລ໌ train.py ໃນ Python. ລະຫັດຂ້າງລຸ່ມນີ້ຈະນໍາເຂົ້າ Tensorflow ແລະ Keras dependencies.
3. ການເລີ່ມຕົ້ນຕົວກໍານົດການ
CIFAR-10 ປະກອບມີພຽງແຕ່ 10 ປະເພດຮູບພາບ, ເພາະສະນັ້ນຫ້ອງການຈໍານວນພຽງແຕ່ຫມາຍເຖິງຈໍານວນຂອງປະເພດທີ່ຈະຈັດປະເພດ.
4. ກຳລັງໂຫຼດຊຸດຂໍ້ມູນ
ຟັງຊັນໃຊ້ໂມດູນ Tensorflow Datasets ເພື່ອໂຫລດຊຸດຂໍ້ມູນ, ແລະພວກເຮົາຕັ້ງດ້ວຍຂໍ້ມູນເປັນ True ເພື່ອໃຫ້ໄດ້ຂໍ້ມູນບາງຢ່າງກ່ຽວກັບມັນ. ທ່ານສາມາດພິມມັນອອກເພື່ອເບິ່ງວ່າພາກສະຫນາມແລະຄຸນຄ່າຂອງພວກເຂົາແມ່ນ, ແລະພວກເຮົາຈະນໍາໃຊ້ຂໍ້ມູນເພື່ອດຶງເອົາຈໍານວນຂອງຕົວຢ່າງໃນຊຸດການຝຶກອົບຮົມແລະການທົດສອບ.
5. ການສ້າງຕົວແບບ
ຕອນນີ້ພວກເຮົາຈະສ້າງສາມຊັ້ນ, ແຕ່ລະຊັ້ນປະກອບດ້ວຍສອງ ConvNets ທີ່ມີຟັງຊັນ max-pooling ແລະ ReLU, ຕິດຕາມດ້ວຍລະບົບ 1024-unit ທີ່ເຊື່ອມຕໍ່ຢ່າງເຕັມສ່ວນ. ໃນການປຽບທຽບກັບ ResNet50 ຫຼື Xception, ເຊິ່ງເປັນຕົວແບບທີ່ທັນສະໄຫມ, ນີ້ອາດຈະເປັນແບບຈໍາລອງຂະຫນາດນ້ອຍ.
6. ການຝຶກອົບຮົມຕົວແບບ
ຂ້ອຍໃຊ້ Tensorboard ເພື່ອວັດແທກຄວາມຖືກຕ້ອງແລະການສູນເສຍໃນແຕ່ລະ epoch ແລະໃຫ້ພວກເຮົາມີການສະແດງທີ່ຫນ້າຮັກຫຼັງຈາກນໍາເຂົ້າຂໍ້ມູນແລະສ້າງຕົວແບບ. ແລ່ນລະຫັດຕໍ່ໄປນີ້; ອີງຕາມ CPU/GPU ຂອງທ່ານ, ການຝຶກອົບຮົມຈະໃຊ້ເວລາຫຼາຍນາທີ.
ເພື່ອໃຊ້ tensorboard, ພຽງແຕ່ພິມຄໍາສັ່ງຕໍ່ໄປນີ້ໃນ terminal ຫຼື command prompt ໃນໄດເລກະທໍລີປະຈຸບັນ:
ທ່ານຈະເຫັນວ່າການສູນເສຍການກວດສອບແມ່ນຫຼຸດລົງແລະຄວາມຖືກຕ້ອງແມ່ນເພີ່ມຂຶ້ນເຖິງປະມານ 81%. ນັ້ນເປັນສິ່ງມະຫັດສະຈັນ!
ການທົດສອບຮູບແບບ
ເມື່ອການຝຶກອົບຮົມສໍາເລັດ, ຮູບແບບສຸດທ້າຍແລະນ້ໍາຫນັກຖືກບັນທຶກໄວ້ໃນໂຟນເດີຜົນໄດ້ຮັບ, ໃຫ້ພວກເຮົາຝຶກອົບຮົມຫນຶ່ງຄັ້ງແລະເຮັດການຄາດເດົາທຸກຄັ້ງທີ່ພວກເຮົາເລືອກ. ປະຕິບັດຕາມລະຫັດໃນໄຟລ໌ python ໃຫມ່ທີ່ມີຊື່ວ່າ test.py.
7. ການນໍາເຂົ້າອຸປະກອນສໍາລັບການທົດສອບ
8. ການສ້າງບັນຊີ python
ສ້າງວັດຈະນານຸກົມ Python ທີ່ແປແຕ່ລະຄ່າ integer ເປັນປ້າຍຊື່ທີ່ເຫມາະສົມຂອງຊຸດຂໍ້ມູນ:
9. ການໂຫຼດຂໍ້ມູນການທົດສອບ & ຮູບແບບ
ລະຫັດຕໍ່ໄປນີ້ຈະໂຫຼດຂໍ້ມູນການທົດສອບ ແລະແບບຈໍາລອງ.
10. ການປະເມີນຜົນ & ການຄາດເດົາ
ລະຫັດຕໍ່ໄປນີ້ຈະປະເມີນແລະເຮັດໃຫ້ການຄາດຄະເນກ່ຽວກັບຮູບພາບກົບ.
11 ຜົນໄດ້ຮັບ
ຮູບແບບຄາດຄະເນການກົບດ້ວຍຄວາມຖືກຕ້ອງ 80.62%.
ສະຫຼຸບ
ຕົກລົງ, ພວກເຮົາຈົບບົດຮຽນນີ້ແລ້ວ. ໃນຂະນະທີ່ 80.62% ບໍ່ດີສໍາລັບ CNN ເລັກນ້ອຍ, ຂ້າພະເຈົ້າຂໍແນະນໍາໃຫ້ທ່ານປ່ຽນຕົວແບບຫຼືເບິ່ງ ResNet50, Xception, ຫຼືຮູບແບບທີ່ທັນສະ ໄໝ ອື່ນໆເພື່ອໃຫ້ໄດ້ຜົນທີ່ດີກວ່າ.
ໃນປັດຈຸບັນທີ່ທ່ານໄດ້ສ້າງເຄືອຂ່າຍການຮັບຮູ້ຮູບພາບທໍາອິດຂອງທ່ານໃນ Keras, ທ່ານຄວນທົດລອງກັບຕົວແບບເພື່ອຄົ້ນພົບວ່າຕົວກໍານົດການຕ່າງໆມີຜົນກະທົບແນວໃດຕໍ່ການປະຕິບັດຂອງມັນ.
ອອກຈາກ Reply ເປັນ