ການຈັດປະເພດຮູບພາບການຮຽນຮູ້ເລິກເຊິ່ງກັບ Tensorflow & Keras ໃນ Python

ສາລະບານ[ເຊື່ອງ][ສະແດງ]

ການຈັດປະເພດຮູບພາບແມ່ນຫຍັງ?
ການຈັດປະເພດຮູບພາບເຮັດວຽກແນວໃດ?
ການຈັດປະເພດຮູບພາບໂດຍໃຊ້ Tensorflow & Keras ໃນ python+-
ສະຫຼຸບ

ມັນໝັ້ນໃຈທີ່ຈະຮູ້ວ່າພວກເຮົາໄດ້ຈັດການຫຸ່ນຍົນດ້ວຍຄວາມສາມາດທີ່ມາຈາກກໍາເນີດຂອງພວກເຮົາເພື່ອຮຽນຮູ້ໂດຍຕົວຢ່າງ ແລະຮັບຮູ້ສິ່ງອ້ອມຂ້າງຂອງມັນ. ສິ່ງທ້າທາຍພື້ນຖານແມ່ນການສອນຄອມພິວເຕີໃຫ້ "ເບິ່ງ" ຄືກັບວ່າມະນຸດຕ້ອງການເວລາແລະຄວາມພະຍາຍາມຫຼາຍກວ່າເກົ່າ.

ເຖິງຢ່າງໃດກໍຕາມ, ເມື່ອພິຈາລະນາຄຸນຄ່າຕົວຈິງທີ່ສີມືແຮງງານນີ້ສະໜອງໃຫ້ບັນດາອົງການ, ວິສາຫະກິດປະຈຸບັນ, ຄວາມມານະພະຍາຍາມກໍ່ມີຄຸນຄ່າ. ໃນບົດຄວາມນີ້, ທ່ານຈະຮຽນຮູ້ກ່ຽວກັບການຈັດປະເພດຮູບພາບ, ວິທີການເຮັດວຽກ, ແລະການປະຕິບັດຕົວຈິງຂອງມັນ. ໃຫ້ເລີ່ມຕົ້ນ.

ການຈັດປະເພດຮູບພາບແມ່ນຫຍັງ?

ວຽກເຮັດງານທໍາຂອງການໃຫ້ອາຫານຮູບພາບເປັນ ເຄືອຂ່າຍ neural ແລະການໃຫ້ມັນອອກບາງຮູບແບບຂອງປ້າຍຊື່ສໍາລັບຮູບນັ້ນເອີ້ນວ່າການຮັບຮູ້ຮູບພາບ. ປ້າຍກຳກັບຜົນຜະລິດຂອງເຄືອຂ່າຍຈະກົງກັບຊັ້ນທີ່ກຳນົດໄວ້ລ່ວງໜ້າ.

ອາດຈະມີຫ້ອງຮຽນຈໍານວນຫຼາຍທີ່ຖືກມອບຫມາຍໃຫ້ຮູບພາບ, ຫຼືພຽງແຕ່ຫນຶ່ງ. ເມື່ອມີຊັ້ນຮຽນດຽວ, ຄໍາວ່າ "ການຮັບຮູ້" ຖືກນໍາໃຊ້ເລື້ອຍໆ, ໃນຂະນະທີ່ມີຫລາຍຊັ້ນ, ຄໍາວ່າ "ການຈັດປະເພດ" ແມ່ນໃຊ້ເລື້ອຍໆ.

ກວດຫາວັດຖຸ ແມ່ນຊຸດຍ່ອຍຂອງການຈັດປະເພດຮູບພາບທີ່ບາງຕົວຢ່າງຂອງວັດຖຸຖືກກວດພົບວ່າເປັນຂອງປະເພດໃດໜຶ່ງ ເຊັ່ນ: ສັດ, ພາຫະນະ, ຫຼືມະນຸດ.

ການຈັດປະເພດຮູບພາບເຮັດວຽກແນວໃດ?

ຮູບພາບໃນຮູບແບບຂອງ pixels ໄດ້ຖືກວິເຄາະໂດຍຄອມພິວເຕີ. ມັນເຮັດສໍາເລັດນີ້ໂດຍການປິ່ນປົວຮູບພາບເປັນການລວບລວມຂອງ matrices, ຂະຫນາດທີ່ຖືກກໍານົດໂດຍຄວາມລະອຽດຂອງຮູບພາບ. ເວົ້າງ່າຍໆ, ການຈັດປະເພດຮູບພາບແມ່ນການສຶກສາຂໍ້ມູນສະຖິຕິໂດຍໃຊ້ algorithms ຈາກທັດສະນະຂອງຄອມພິວເຕີ້.

ການຈັດປະເພດຮູບພາບແມ່ນສໍາເລັດໃນການປະມວນຜົນຮູບພາບດິຈິຕອນໂດຍການຈັດກຸ່ມ pixels ເຂົ້າໄປໃນກຸ່ມທີ່ກໍານົດໄວ້ລ່ວງຫນ້າ, ຫຼື "ຫ້ອງຮຽນ." ສູດການຄິດໄລ່ການແບ່ງຮູບພາບເຂົ້າໄປໃນລໍາດັບຂອງລັກສະນະທີ່ຫນ້າສັງເກດ, ເຊິ່ງຊ່ວຍຫຼຸດຜ່ອນພາລະສໍາລັບຕົວຈັດປະເພດສຸດທ້າຍ.

ຄຸນນະພາບເຫຼົ່ານີ້ແຈ້ງໃຫ້ຜູ້ຈັດປະເພດກ່ຽວກັບຄວາມຫມາຍຂອງຮູບພາບແລະການຈັດປະເພດທີ່ມີທ່າແຮງ. ເນື່ອງຈາກວ່າສ່ວນທີ່ເຫຼືອຂອງຂະບວນການໃນການຈັດປະເພດຮູບພາບແມ່ນຂຶ້ນກັບມັນ, ວິທີການສະກັດເອົາລັກສະນະເປັນໄລຍະທີ່ສໍາຄັນທີ່ສຸດ.

ໄດ້ ຂໍ້ມູນສະຫນອງໃຫ້ ສູດການຄິດໄລ່ຍັງມີຄວາມສໍາຄັນໃນການຈັດປະເພດຮູບພາບ, ໂດຍສະເພາະການຈັດປະເພດທີ່ມີການເບິ່ງແຍງ. ໃນການສົມທຽບກັບຊຸດຂໍ້ມູນທີ່ຂີ້ຮ້າຍທີ່ມີຄວາມບໍ່ສົມດຸນຂອງຂໍ້ມູນໂດຍອີງໃສ່ຊັ້ນຮຽນແລະຄຸນນະພາບຂອງຮູບພາບແລະຄໍາບັນຍາຍ, ຊຸດຂໍ້ມູນການຈັດປະເພດທີ່ດີທີ່ສຸດປະຕິບັດຫນ້າຊົມເຊີຍ.

ການຈັດປະເພດຮູບພາບໂດຍໃຊ້ Tensorflow & Keras ໃນ python

ພວກເຮົາຈະໃຊ້ CIFAR-10 ຊຸດຂໍ້ມູນ (ເຊິ່ງລວມມີເຮືອບິນ, ເຮືອບິນ, ນົກ, ແລະອີກ 7 ຢ່າງ).

1. ການຕິດຕັ້ງຄວາມຕ້ອງການ

ລະຫັດຂ້າງລຸ່ມນີ້ຈະຕິດຕັ້ງທຸກເງື່ອນໄຂເບື້ອງຕົ້ນ.

ຂໍ້ກໍານົດການຕິດຕັ້ງ 1

2. ການນໍາເຂົ້າການຂຶ້ນກັບ

ສ້າງໄຟລ໌ train.py ໃນ Python. ລະຫັດຂ້າງລຸ່ມນີ້ຈະນໍາເຂົ້າ Tensorflow ແລະ Keras dependencies.

ການນຳເຂົ້າ 1

3. ການເລີ່ມຕົ້ນຕົວກໍານົດການ

CIFAR-10 ປະກອບມີພຽງແຕ່ 10 ປະເພດຮູບພາບ, ເພາະສະນັ້ນຫ້ອງການຈໍານວນພຽງແຕ່ຫມາຍເຖິງຈໍານວນຂອງປະເພດທີ່ຈະຈັດປະເພດ.

ການເລີ່ມຕົ້ນພາລາມິເຕີ

4. ກຳລັງໂຫຼດຊຸດຂໍ້ມູນ

ຟັງຊັນໃຊ້ໂມດູນ Tensorflow Datasets ເພື່ອໂຫລດຊຸດຂໍ້ມູນ, ແລະພວກເຮົາຕັ້ງດ້ວຍຂໍ້ມູນເປັນ True ເພື່ອໃຫ້ໄດ້ຂໍ້ມູນບາງຢ່າງກ່ຽວກັບມັນ. ທ່ານສາມາດພິມມັນອອກເພື່ອເບິ່ງວ່າພາກສະຫນາມແລະຄຸນຄ່າຂອງພວກເຂົາແມ່ນ, ແລະພວກເຮົາຈະນໍາໃຊ້ຂໍ້ມູນເພື່ອດຶງເອົາຈໍານວນຂອງຕົວຢ່າງໃນຊຸດການຝຶກອົບຮົມແລະການທົດສອບ.

5. ການສ້າງຕົວແບບ

ຕອນນີ້ພວກເຮົາຈະສ້າງສາມຊັ້ນ, ແຕ່ລະຊັ້ນປະກອບດ້ວຍສອງ ConvNets ທີ່ມີຟັງຊັນ max-pooling ແລະ ReLU, ຕິດຕາມດ້ວຍລະບົບ 1024-unit ທີ່ເຊື່ອມຕໍ່ຢ່າງເຕັມສ່ວນ. ໃນການປຽບທຽບກັບ ResNet50 ຫຼື Xception, ເຊິ່ງເປັນຕົວແບບທີ່ທັນສະໄຫມ, ນີ້ອາດຈະເປັນແບບຈໍາລອງຂະຫນາດນ້ອຍ.

ການສ້າງຕົວແບບ 1

6. ການຝຶກອົບຮົມຕົວແບບ

ຂ້ອຍໃຊ້ Tensorboard ເພື່ອວັດແທກຄວາມຖືກຕ້ອງແລະການສູນເສຍໃນແຕ່ລະ epoch ແລະໃຫ້ພວກເຮົາມີການສະແດງທີ່ຫນ້າຮັກຫຼັງຈາກນໍາເຂົ້າຂໍ້ມູນແລະສ້າງຕົວແບບ. ແລ່ນລະຫັດຕໍ່ໄປນີ້; ອີງຕາມ CPU/GPU ຂອງທ່ານ, ການຝຶກອົບຮົມຈະໃຊ້ເວລາຫຼາຍນາທີ.

ການຝຶກອົບຮົມຕົວແບບ

ເພື່ອໃຊ້ tensorboard, ພຽງແຕ່ພິມຄໍາສັ່ງຕໍ່ໄປນີ້ໃນ terminal ຫຼື command prompt ໃນໄດເລກະທໍລີປະຈຸບັນ:

Tensorboard 1

ທ່ານຈະເຫັນວ່າການສູນເສຍການກວດສອບແມ່ນຫຼຸດລົງແລະຄວາມຖືກຕ້ອງແມ່ນເພີ່ມຂຶ້ນເຖິງປະມານ 81%. ນັ້ນເປັນສິ່ງມະຫັດສະຈັນ!

ການກວດສອບຄວາມຖືກຕ້ອງ

ການສູນເສຍການກວດສອບ

ການທົດສອບຮູບແບບ

ເມື່ອການຝຶກອົບຮົມສໍາເລັດ, ຮູບແບບສຸດທ້າຍແລະນ້ໍາຫນັກຖືກບັນທຶກໄວ້ໃນໂຟນເດີຜົນໄດ້ຮັບ, ໃຫ້ພວກເຮົາຝຶກອົບຮົມຫນຶ່ງຄັ້ງແລະເຮັດການຄາດເດົາທຸກຄັ້ງທີ່ພວກເຮົາເລືອກ. ປະຕິບັດຕາມລະຫັດໃນໄຟລ໌ python ໃຫມ່ທີ່ມີຊື່ວ່າ test.py.

7. ການນໍາເຂົ້າອຸປະກອນສໍາລັບການທົດສອບ

ການນໍາເຂົ້າອຸປະກອນທີ່ຈໍາເປັນສໍາລັບການທົດສອບ

8. ການສ້າງບັນຊີ python

ສ້າງວັດຈະນານຸກົມ Python ທີ່ແປແຕ່ລະຄ່າ integer ເປັນປ້າຍຊື່ທີ່ເຫມາະສົມຂອງຊຸດຂໍ້ມູນ:

ການສ້າງບັນຊີ Python 1

9. ການໂຫຼດຂໍ້ມູນການທົດສອບ & ຮູບແບບ

ລະຫັດຕໍ່ໄປນີ້ຈະໂຫຼດຂໍ້ມູນການທົດສອບ ແລະແບບຈໍາລອງ.

10. ການປະເມີນຜົນ & ການຄາດເດົາ

ລະຫັດຕໍ່ໄປນີ້ຈະປະເມີນແລະເຮັດໃຫ້ການຄາດຄະເນກ່ຽວກັບຮູບພາບກົບ.

ການຄາດຄະເນການປະເມີນຜົນ 1

11 ຜົນໄດ້ຮັບ

ຮູບແບບຄາດຄະເນການກົບດ້ວຍຄວາມຖືກຕ້ອງ 80.62%.

ຜົນການຄົ້ນຫາ

ສະຫຼຸບ

ຕົກລົງ, ພວກເຮົາຈົບບົດຮຽນນີ້ແລ້ວ. ໃນຂະນະທີ່ 80.62% ບໍ່ດີສໍາລັບ CNN ເລັກນ້ອຍ, ຂ້າພະເຈົ້າຂໍແນະນໍາໃຫ້ທ່ານປ່ຽນຕົວແບບຫຼືເບິ່ງ ResNet50, Xception, ຫຼືຮູບແບບທີ່ທັນສະ ໄໝ ອື່ນໆເພື່ອໃຫ້ໄດ້ຜົນທີ່ດີກວ່າ.

ໃນປັດຈຸບັນທີ່ທ່ານໄດ້ສ້າງເຄືອຂ່າຍການຮັບຮູ້ຮູບພາບທໍາອິດຂອງທ່ານໃນ Keras, ທ່ານຄວນທົດລອງກັບຕົວແບບເພື່ອຄົ້ນພົບວ່າຕົວກໍານົດການຕ່າງໆມີຜົນກະທົບແນວໃດຕໍ່ການປະຕິບັດຂອງມັນ.

ການຈັດປະເພດຮູບພາບການຮຽນຮູ້ເລິກເຊິ່ງກັບ Tensorflow & Keras ໃນ Python

ການຈັດປະເພດຮູບພາບແມ່ນຫຍັງ?

ການຈັດປະເພດຮູບພາບເຮັດວຽກແນວໃດ?