ສາລະບານ[ເຊື່ອງ][ສະແດງ]
ຫນຶ່ງໃນແນວຄວາມຄິດທີ່ງ່າຍດາຍແລະຫນ້າສົນໃຈທີ່ສຸດໃນການຮຽນຮູ້ເລິກແມ່ນການຊອກຄົ້ນຫາວັດຖຸ. ແນວຄວາມຄິດພື້ນຖານແມ່ນການແບ່ງແຕ່ລະລາຍການອອກເປັນຊັ້ນຮຽນຢ່າງຕໍ່ເນື່ອງເຊິ່ງເປັນຕົວແທນລັກສະນະທີ່ສົມທຽບກັນແລະຫຼັງຈາກນັ້ນແຕ້ມກ່ອງໃສ່ມັນ.
ຄຸນລັກສະນະຈໍາແນກເຫຼົ່ານີ້ສາມາດງ່າຍດາຍເຊັ່ນຮູບແບບຫຼືສີ, ເຊິ່ງຊ່ວຍໃນຄວາມສາມາດໃນການຈັດປະເພດພວກມັນ.
ຄໍາຮ້ອງສະຫມັກຂອງ ການກວດສອບວັດຖຸ ໄດ້ຮັບການຈ້າງງານຢ່າງກວ້າງຂວາງໃນວິທະຍາສາດການແພດ, ການຂັບລົດອັດຕະໂນມັດ, ການປ້ອງກັນແລະການທະຫານ, ການບໍລິຫານສາທາລະນະ, ແລະຫຼາຍຂົງເຂດອື່ນໆຍ້ອນການປັບປຸງຢ່າງຫຼວງຫຼາຍໃນຄອມພິວເຕີວິໄສທັດແລະການປະມວນຜົນຮູບພາບ.
ໃນທີ່ນີ້ພວກເຮົາມີ MMDetection, ຊຸດເຄື່ອງມືກວດຫາວັດຖຸໂອເພນຊອດທີ່ດີເລີດທີ່ສ້າງຂຶ້ນໃນ Pytarch. ໃນບົດຄວາມນີ້, ພວກເຮົາຈະກວດເບິ່ງ MMDetection ຢ່າງລະອຽດ, ໄປກັບມັນ, ປຶກສາຫາລືກ່ຽວກັບຄຸນສົມບັດຂອງມັນ, ແລະອື່ນໆອີກ.
ແມ່ນຫຍັງ MMDetection?
ໄດ້ MMDetection ກ່ອງເຄື່ອງມືຖືກສ້າງເປັນລະຫັດ Python ໂດຍສະເພາະສໍາລັບບັນຫາທີ່ກ່ຽວຂ້ອງກັບການກໍານົດວັດຖຸແລະການແບ່ງສ່ວນຕົວຢ່າງ.
ການປະຕິບັດ PyTorch ຖືກນໍາໃຊ້, ແລະມັນຖືກສ້າງຂື້ນໃນແບບໂມດູນ. ສໍາລັບການຮັບຮູ້ວັດຖຸແລະການແບ່ງສ່ວນຕົວຢ່າງ, ລະດັບຄວາມກ້ວາງຂອງຕົວແບບທີ່ມີປະສິດທິພາບໄດ້ຖືກລວບລວມເຂົ້າໄປໃນຫຼາຍໆວິທີການ.
ມັນອະນຸຍາດໃຫ້ inference ປະສິດທິພາບແລະການຝຶກອົບຮົມຢ່າງໄວວາ. ໃນທາງກົງກັນຂ້າມ, ກ່ອງເຄື່ອງມືປະກອບມີນ້ໍາຫນັກສໍາລັບຫຼາຍກວ່າ 200 ເຄືອຂ່າຍທາງສ່ວນຫນ້າຂອງການຝຶກອົບຮົມ, ເຮັດໃຫ້ມັນເປັນການແກ້ໄຂຢ່າງໄວວາໃນຂົງເຂດການກໍານົດວັດຖຸ.
ດ້ວຍຄວາມສາມາດໃນການດັດແປງເຕັກນິກໃນປະຈຸບັນຫຼືສ້າງເຄື່ອງກວດຈັບໃຫມ່ໂດຍໃຊ້ໂມດູນທີ່ມີຢູ່, MMDetection ປະຕິບັດຫນ້າທີ່ເປັນມາດຕະຖານ.
ຄຸນນະສົມບັດທີ່ສໍາຄັນຂອງກ່ອງເຄື່ອງມືແມ່ນການລວມຂອງຕົນຂອງກົງໄປກົງມາ, ສ່ວນ modular ຈາກປົກກະຕິ ການຊອກຄົ້ນຫາວັດຖຸ ກອບທີ່ສາມາດຖືກນໍາໃຊ້ເພື່ອສ້າງທໍ່ທີ່ເປັນເອກະລັກຫຼືຮູບແບບທີ່ເປັນເອກະລັກ.
ຄວາມສາມາດໃນການ benchmarking ຂອງຊຸດເຄື່ອງມືນີ້ເຮັດໃຫ້ມັນງ່າຍດາຍທີ່ຈະສ້າງກອບເຄື່ອງກວດຈັບໃຫມ່ຢູ່ເທິງກອບທີ່ມີຢູ່ແລ້ວແລະປຽບທຽບການປະຕິບັດຂອງມັນ.
ຄຸນລັກສະນະ
- ກອບການຊອກຄົ້ນຫາທີ່ນິຍົມ ແລະທັນສະໄໝ, ເຊັ່ນ Faster RCNN, Mask RCNN, RetinaNet, ແລະອື່ນໆ, ໄດ້ຮັບການສະຫນັບສະຫນູນໂດຍກົງຈາກຊຸດເຄື່ອງມື.
- ການນໍາໃຊ້ຂອງ 360+ ຕົວແບບທາງສ່ວນຫນ້າຂອງການຝຶກອົບຮົມສໍາລັບການປັບປັບ (ຫຼືການຝຶກອົບຮົມໃຫມ່).
- ສໍາລັບຊຸດຂໍ້ມູນວິໄສທັດທີ່ມີຊື່ສຽງລວມທັງ COCO, Cityscapes, LVIS, ແລະ PASCAL VOC.
- ໃນ GPUs, ການປະຕິບັດ bbox ແລະຫນ້າກາກພື້ນຖານທັງຫມົດແມ່ນປະຕິບັດ. codebases ອື່ນໆ, ເຊັ່ນ Detectron2, maskrcnn-benchmark, ແລະ SimpleDet, ສາມາດໄດ້ຮັບການຝຶກອົບຮົມໃນອັດຕາທີ່ໄວກວ່າຫຼືເທົ່າກັບອັນນີ້.
- ນັກຄົ້ນຄວ້າທໍາລາຍການ ການຊອກຄົ້ນຫາວັດຖຸ ກອບເປັນຫຼາຍໂມດູນ, ເຊິ່ງຫຼັງຈາກນັ້ນສາມາດຖືກລວມເຂົ້າກັນເພື່ອສ້າງລະບົບການກວດພົບວັດຖຸທີ່ເປັນເອກະລັກ.
MMDetection ສະຖາປັດຕະຍະກໍາ
MMDetection ກໍານົດການອອກແບບທົ່ວໄປທີ່ສາມາດນໍາໃຊ້ກັບຕົວແບບໃດໆນັບຕັ້ງແຕ່ມັນເປັນກ່ອງເຄື່ອງມືທີ່ມີຮູບແບບທີ່ສ້າງຂຶ້ນກ່ອນຫນ້າ, ແຕ່ລະແບບມີສະຖາປັດຕະຍະກໍາຂອງຕົນເອງ. ອົງປະກອບຕໍ່ໄປນີ້ປະກອບເປັນສະຖາປັດຕະຍະກໍາທັງຫມົດນີ້:
- Backbone: Backbone, ເຊັ່ນ ResNet-50 ທີ່ບໍ່ມີຊັ້ນສຸດທ້າຍທີ່ເຊື່ອມຕໍ່ຢ່າງເຕັມສ່ວນ, ແມ່ນອົງປະກອບທີ່ປ່ຽນຮູບພາບເປັນແຜນທີ່ຄຸນນະສົມບັດ.
- ຄໍ: ຄໍແມ່ນສ່ວນທີ່ເຊື່ອມຕໍ່ກະດູກສັນຫຼັງກັບຫົວ. ໃນແຜນທີ່ລັກສະນະວັດຖຸດິບຂອງກະດູກສັນຫຼັງ, ມັນເຮັດການປັບຕົວ ຫຼືການຕັ້ງຄ່າຄືນໃໝ່. Feature Pyramid Network ເປັນຕົວຢ່າງໜຶ່ງ (FPN).
- DenseHead (AnchorHead/AnchorFreeHead): ມັນເປັນອົງປະກອບທີ່ດໍາເນີນການໃນພື້ນທີ່ຫນາແຫນ້ນຂອງແຜນທີ່ຄຸນນະສົມບັດ, ເຊັ່ນ: AnchorHead ແລະ AnchorFreeHead, ເຊັ່ນ RPNHead, RetinaHead, ແລະ FCOSHead.
- RoIEExtractor: ດ້ວຍການໃຊ້ຕົວປະຕິບັດການທີ່ຄ້າຍຄືກັບ RoIPooling, ມັນແມ່ນສ່ວນທີ່ດຶງຄຸນສົມບັດ RoIwise ອອກຈາກແຜນທີ່ອັນດຽວຫຼືຊຸດຂອງແຜນທີ່ຄຸນນະສົມບັດ. ຕົວຢ່າງ SingleRoIExtractor ສະກັດຄຸນສົມບັດ RoI ຈາກລະດັບທີ່ກົງກັນຂອງ pyramids ຄຸນນະສົມບັດ.
- RoIHead (BBoxHead/MaskHead): ມັນແມ່ນສ່ວນຂອງລະບົບທີ່ໃຊ້ຄຸນລັກສະນະ RoI ເປັນການປ້ອນຂໍ້ມູນ ແລະສ້າງການຄາດຄະເນສະເພາະໜ້າວຽກທີ່ອີງໃສ່ RoI, ເຊັ່ນ: ການຈັດປະເພດ/ການຖົດຖອຍຂອງກ່ອງ ແລະການຄາດຄະເນໜ້າກາກ.
ການກໍ່ສ້າງເຄື່ອງກວດຈັບແບບດຽວແລະສອງຂັ້ນຕອນແມ່ນສະແດງໃຫ້ເຫັນໂດຍນໍາໃຊ້ແນວຄວາມຄິດທີ່ໄດ້ກ່າວມາຂ້າງເທິງ. ພວກເຮົາສາມາດພັດທະນາຂັ້ນຕອນການຂອງຕົນເອງໂດຍການສ້າງພາກສ່ວນສົດຈໍານວນຫນຶ່ງແລະການປະສົມບາງສ່ວນທີ່ມີຢູ່ແລ້ວ.
ບັນຊີລາຍຊື່ຂອງແບບຈໍາລອງລວມຢູ່ໃນ MMDetection
MMDetection ສະໜອງຖານລະຫັດອັນດັບຕົ້ນໆສຳລັບຕົວແບບທີ່ມີຊື່ສຽງຫຼາຍອັນ ແລະໂມດູນທີ່ເນັ້ນໃສ່ໜ້າວຽກ. ແບບຈໍາລອງທີ່ໄດ້ເຮັດມາກ່ອນຫນ້ານີ້ແລະວິທີການປັບຕົວທີ່ອາດຈະຖືກນໍາໃຊ້ກັບກ່ອງເຄື່ອງມື MMDetection ແມ່ນມີລາຍຊື່ຂ້າງລຸ່ມນີ້. ບັນຊີລາຍຊື່ສືບຕໍ່ຂະຫຍາຍຕົວຍ້ອນວ່າຮູບແບບແລະວິທີການເພີ່ມເຕີມໄດ້ຖືກເພີ່ມ.
- R-CNN ໄວ
- R-CNN ໄວກວ່າ
- ຫນ້າກາກ R-CNN
- RetinaNet
- DCN
- DCNv2
- Cascade R-CNN
- M2det
- GHM
- ScatchDet
- Double-Head R-CNN
- ຕາຂ່າຍ R-CNN
- FSAF
- Libra R-CNN
- GCNet
- HRNet
- Mask Scoring R-CNN
- FCOS
- SSD
- R-FCN
- ການຝຶກອົບຮົມຄວາມຊັດເຈນແບບປະສົມ
- ມາດຕະຖານນ້ໍາຫນັກ
- Hybrid Task Cascade
- Anching ຄູ່ມື
- ຄວາມສົນໃຈທົ່ວໄປ
ການສ້າງຕົວແບບການກວດຫາວັດຖຸໂດຍໃຊ້ MMDetection
ໃນບົດສອນນີ້, ພວກເຮົາຈະເປັນປື້ມບັນທຶກຂອງ Google collab ເພາະວ່າມັນງ່າຍຕໍ່ການຕັ້ງຄ່າແລະໃຊ້.
ການຕິດຕັ້ງ
ເພື່ອຕິດຕັ້ງທຸກສິ່ງທີ່ພວກເຮົາຕ້ອງການ, ພວກເຮົາທໍາອິດຈະຕິດຕັ້ງຫ້ອງສະຫມຸດທີ່ຈໍາເປັນແລະ clone ໂຄງການ MMdetection GitHub.
ການນໍາເຂົ້າ env
ສະພາບແວດລ້ອມສໍາລັບໂຄງການຂອງພວກເຮົາໃນປັດຈຸບັນຈະຖືກນໍາເຂົ້າຈາກ repository.
ການນໍາເຂົ້າຫ້ອງສະຫມຸດແລະ MMdetection
ໃນປັດຈຸບັນພວກເຮົາຈະນໍາເຂົ້າຫ້ອງສະຫມຸດທີ່ຕ້ອງການ, ພ້ອມກັບ MMdetection ແນ່ນອນ.
ດາວນ໌ໂຫລດຈຸດກວດສອບທາງສ່ວນຫນ້າຂອງການຝຶກອົບຮົມ
ຕອນນີ້ຈຸດກວດກາແບບຈໍາລອງທີ່ຜ່ານການຝຶກອົບຮົມຈາກ MMdetection ຄວນຈະໄດ້ຮັບການດາວໂຫຼດສໍາລັບການປັບຕົວເພີ່ມເຕີມ ແລະ inference.
ຮູບແບບອາຄານ
ຕອນນີ້ພວກເຮົາຈະສ້າງແບບຈໍາລອງແລະນໍາໃຊ້ຈຸດກວດກາກັບຊຸດຂໍ້ມູນ.
Inference ເຄື່ອງກວດຈັບ
ໃນປັດຈຸບັນວ່າຕົວແບບໄດ້ຖືກກໍ່ສ້າງແລະໂຫລດຢ່າງຖືກຕ້ອງ, ໃຫ້ກວດເບິ່ງວ່າມັນດີເລີດແນວໃດ. ພວກເຮົານໍາໃຊ້ເຄື່ອງກວດສອບການ inference API ລະດັບສູງຂອງ MMDetection. API ນີ້ໄດ້ຖືກອອກແບບເພື່ອເຮັດໃຫ້ຂະບວນການ inference ງ່າຍຂຶ້ນ.
ຜົນ
ຂໍໃຫ້ເບິ່ງຜົນໄດ້ຮັບ.
ສະຫຼຸບ
ສະຫຼຸບແລ້ວ, ກ່ອງເຄື່ອງມື MMDetection ເຮັດວຽກໄດ້ດີກວ່າ codebases ທີ່ປ່ອຍອອກມາເມື່ອບໍ່ດົນມານີ້ເຊັ່ນ: SimpleDet, Detectron, ແລະ Maskrcnn-benchmark. ດ້ວຍການເກັບຕົວແບບຂະຫນາດໃຫຍ່,
MMDetection ປະຈຸບັນເປັນເທັກໂນໂລຍີທີ່ທັນສະໄໝ. MMDetection ດີກວ່າທຸກ codebases ອື່ນໆໃນແງ່ຂອງປະສິດທິພາບແລະການປະຕິບັດ.
ຫນຶ່ງໃນສິ່ງທີ່ດີທີ່ສຸດກ່ຽວກັບ MMdetection ແມ່ນວ່າຕອນນີ້ທ່ານສາມາດຊີ້ໄປຫາໄຟລ໌ການຕັ້ງຄ່າທີ່ແຕກຕ່າງກັນ, ດາວໂຫລດຈຸດກວດກາທີ່ແຕກຕ່າງກັນ, ແລະດໍາເນີນການລະຫັດດຽວກັນຖ້າທ່ານຕ້ອງການປ່ຽນຮູບແບບຕ່າງໆ.
ຂ້າພະເຈົ້າແນະນໍາໃຫ້ເບິ່ງຂອງເຂົາເຈົ້າ ຄໍາແນະນໍາ ຖ້າຫາກວ່າທ່ານດໍາເນີນການເຂົ້າໄປໃນບັນຫາກັບຂັ້ນຕອນໃດຫນຶ່ງຫຼືຕ້ອງການທີ່ຈະປະຕິບັດບາງຢ່າງທີ່ແຕກຕ່າງກັນ.
ອອກຈາກ Reply ເປັນ