မာတိကာ[ဖျောက်][ရှိုး]
နက်ရှိုင်းသောသင်ယူမှုတွင် အရိုးရှင်းဆုံးနှင့် စိတ်ဝင်စားစရာအကောင်းဆုံး စိတ်ကူးများထဲမှတစ်ခုမှာ အရာဝတ္ထုရှာဖွေခြင်းပင်ဖြစ်သည်။ အခြေခံအယူအဆမှာ အကြောင်းအရာတစ်ခုစီကို နှိုင်းယှဉ်နိုင်သော စရိုက်လက္ခဏာများကို ကိုယ်စားပြုသည့် အတန်းများအထိ ခွဲပြီး ၎င်းနှင့်ပတ်ပတ်လည်တွင် ဘောက်စ်တစ်ခုဆွဲရန်ဖြစ်သည်။
ဤထူးခြားသောလက္ခဏာများသည် ကျွန်ုပ်တို့၏အမျိုးအစားခွဲခြားနိုင်စွမ်းကို အထောက်အကူဖြစ်စေသော ပုံစံ သို့မဟုတ် အရောင်ကဲ့သို့ရိုးရှင်းနိုင်သည်။
လျှောက်လွှာများ object ထောက်လှမ်းခြင်း Computer Vision နှင့် Image Processing တွင် သိသိသာသာ တိုးတက်မှုများကြောင့် ဆေးဘက်ဆိုင်ရာ သိပ္ပံ၊ ကိုယ်ပိုင်အုပ်ချုပ်ခွင့်ရ မောင်းနှင်မှု၊ ကာကွယ်ရေးနှင့် စစ်ရေး၊ ပြည်သူ့အုပ်ချုပ်ရေးနှင့် အခြားသော နယ်ပယ်များစွာတွင် ကျယ်ပြန့်စွာ အသုံးချလျက်ရှိသည်။
ဤတွင် ကျွန်ုပ်တို့တွင် Pytorch တွင်တည်ဆောက်ထားသော အံ့သြဖွယ် open-source object detection toolset MMDetection ရှိသည်။ ဤဆောင်းပါးတွင်၊ ကျွန်ုပ်တို့သည် MMDetection ကိုအသေးစိတ်စစ်ဆေးပြီး၊ ၎င်းနှင့်လက်တွေ့လုပ်ဆောင်ပါ၊ ၎င်း၏အင်္ဂါရပ်များနှင့် အခြားအရာများကို ဆွေးနွေးပါမည်။
ဘာဖြစ်သလဲ MMDetection?
အဆိုပါ MMDetection Object identification နှင့် instance segmentation ပါ၀င်သော ပြဿနာများအတွက် ကိရိယာပုံးကို Python codebase အဖြစ် ဖန်တီးထားပါသည်။
PyTorch အကောင်အထည်ဖော်မှုကို အသုံးပြုထားပြီး ၎င်းကို modular ပုံစံဖြင့် ဖန်တီးထားသည်။ Object recognition နှင့် instance segmentation အတွက် ကျယ်ပြန့်သော ထိရောက်သော မော်ဒယ်များကို methodologies အမျိုးမျိုးဖြင့် စုစည်းထားပါသည်။
၎င်းသည် ထိရောက်သော ကောက်ချက်ချမှုနှင့် လျင်မြန်သော လေ့ကျင့်မှုကို ခွင့်ပြုသည်။ အခြားတစ်ဖက်တွင်၊ ကိရိယာပုံးတွင် ကြိုတင်လေ့ကျင့်ထားသည့် ကွန်ရက်ပေါင်း ၂၀၀ ကျော်အတွက် အလေးများပါရှိပြီး အရာဝတ္ထုသတ်မှတ်ခြင်းနယ်ပယ်တွင် အမြန်ပြင်ဆင်မှုဖြစ်စေသည်။
လက်ရှိနည်းပညာများကို လိုက်လျောညီထွေဖြစ်အောင် သို့မဟုတ် ရရှိနိုင်သော module များကို အသုံးပြု၍ detector အသစ်တစ်ခုဖန်တီးနိုင်ခြင်းဖြင့် MMDetection သည် စံသတ်မှတ်ချက်တစ်ခုအဖြစ် လုပ်ဆောင်ပါသည်။
ကိရိယာပုံး၏ အဓိကအင်္ဂါရပ်မှာ သာမာန်တစ်ခုမှ ရိုးရှင်းသော၊ မော်ဂျူလာ အစိတ်အပိုင်းများ ပါဝင်သည်။ အရာဝတ္ထုထောက်လှမ်း ထူးခြားသော ပိုက်လိုင်းများ သို့မဟုတ် ထူးခြားသော မော်ဒယ်များ ဖန်တီးရန် အသုံးပြုနိုင်သည့် ဘောင်။
ဤကိရိယာအစုံ၏ စံသတ်မှတ်နိုင်စွမ်းသည် ရှိပြီးသားဘောင်တစ်ခု၏ထိပ်တွင် detector framework အသစ်တစ်ခုတည်ဆောက်ရန်နှင့် ၎င်း၏စွမ်းဆောင်ရည်ကို နှိုင်းယှဉ်ရန် ရိုးရှင်းစေသည်။
အင်္ဂါရပ်များ
- ပိုမြန်သော RCNN၊ Mask RCNN၊ RetinaNet စသဖြင့် လူကြိုက်များပြီး ခေတ်မီသော ထောက်လှမ်းမှုဘောင်များကို ကိရိယာအစုံမှ တိုက်ရိုက်ပံ့ပိုးပေးပါသည်။
- ချိန်ညှိခြင်း (သို့မဟုတ် အသစ်ပြန်လည်လေ့ကျင့်ခြင်း) အတွက် 360+ ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ်များကို အသုံးပြုခြင်း။
- COCO၊ Cityscapes၊ LVIS နှင့် PASCAL VOC အပါအဝင် လူသိများသော အမြင်ဒေတာအတွဲများအတွက်။
- GPU များတွင်၊ အခြေခံ bbox နှင့် mask လုပ်ဆောင်ချက်အားလုံးကို လုပ်ဆောင်သည်။ Detectron2၊ maskrcnn-benchmark နှင့် SimpleDet ကဲ့သို့သော အခြားသော ကုဒ်ဘေ့စ်များကို ဤတစ်ခုထက် ပိုမိုမြန်ဆန်သောနှုန်းဖြင့် လေ့ကျင့်နိုင်ပါသည်။
- သုတေသီများက ဖြိုခွဲသည်။ အရာဝတ္ထုထောက်လှမ်း မူဘောင်များကို မော်ဂျူးများစွာသို့ ပေါင်းစပ်နိုင်ပြီး ထူးခြားသော အရာဝတ္ထုကို ထောက်လှမ်းခြင်းစနစ်ကို ဖန်တီးရန်။
MMDetection ဗိသုကာ
MMDetection သည် ၎င်း၏ကိုယ်ပိုင်ဗိသုကာလက်ရာများပါရှိသော ကိရိယာအစုံအလင်ပါရှိသော ကိရိယာပုံးဖြစ်သောကြောင့် မည်သည့်မော်ဒယ်အတွက်မဆို အသုံးပြုနိုင်သည့် ယေဘူယျဒီဇိုင်းကို သတ်မှတ်ပေးပါသည်။ အောက်ဖော်ပြပါ အစိတ်အပိုင်းများသည် ဤအလုံးစုံသော ဗိသုကာပညာဖြင့် ဖွဲ့စည်းသည်-
- ကြောရိုး: နောက်ဆုံးချိတ်ဆက်ထားသော အလွှာမပါဘဲ ResNet-50 ကဲ့သို့သော ကျောရိုးသည် ပုံတစ်ပုံကို အင်္ဂါရပ်မြေပုံများအဖြစ် ပြောင်းလဲပေးသည့် အစိတ်အပိုင်းဖြစ်သည်။
- လည်ပင်းလည်ပင်းသည် ဦးခေါင်းများနှင့် ကျောရိုးကို ဆက်သွယ်ပေးသည့် အပိုင်းဖြစ်သည်။ ကျောရိုး၏ အကြမ်းထည်အင်္ဂါရပ်မြေပုံများတွင် ၎င်းသည် အချို့သော ချိန်ညှိမှုများ သို့မဟုတ် ပြန်လည်ဖွဲ့စည်းမှုများကို လုပ်ဆောင်သည်။ Feature Pyramid Network သည် သရုပ်ဖော်ပုံ (FPN) တစ်ခုဖြစ်သည်။
- DenseHead (AnchorHead/AnchorFreeHead): ၎င်းသည် RPNHead၊ RetinaHead နှင့် FCOSHead ကဲ့သို့သော AnchorHead နှင့် AnchorFreeHead ကဲ့သို့သော အင်္ဂါရပ်မြေပုံများ၏ သိပ်သည်းသောနေရာများတွင် လုပ်ဆောင်သည့် အစိတ်အပိုင်းဖြစ်သည်။
- RoIextractor- RoIPooling ကဲ့သို့သော အော်ပရေတာများကို အသုံးပြုခြင်းဖြင့်၊ ၎င်းသည် RoIwise အင်္ဂါရပ်များကို တစ်ခုတည်း သို့မဟုတ် အင်္ဂါရပ်မြေပုံများစုစည်းမှုမှ ဆွဲထုတ်သည့်အပိုင်းဖြစ်သည်။ SingleRoIextractor နမူနာသည် တူညီသောအင်္ဂါရပ်ပိရမစ်အဆင့်မှ RoI အင်္ဂါရပ်များကို ထုတ်ယူသည်။
- RoIHead (BBoxHead/MaskHead): ၎င်းသည် RoI လက္ခဏာများကို ထည့်သွင်းမှုအဖြစ် အသုံးပြုကာ RoI-based အလုပ်-သတ်သတ်မှတ်မှတ် ခန့်မှန်းချက်များကို ထုတ်ပေးသည့် စနစ်၏ အပိုင်းဖြစ်သည်။
အထက်ဖော်ပြပါ သဘောတရားများကို အသုံးပြု၍ single-stage နှင့် two-stage detectors များ၏ တည်ဆောက်မှုကို သရုပ်ဖော်ထားပါသည်။ အသစ်အသစ်သော အစိတ်အပိုင်းအချို့ကို တည်ဆောက်ပြီး အချို့သော ရှိပြီးသားအရာများကို ပေါင်းစပ်ခြင်းဖြင့် ကျွန်ုပ်တို့၏ကိုယ်ပိုင်လုပ်ထုံးလုပ်နည်းများကို ရိုးရှင်းစွာ ဖွံ့ဖြိုးတိုးတက်နိုင်ပါသည်။
MMDetection တွင်ပါဝင်သော မော်ဒယ်များစာရင်း
MMDetection သည် နာမည်ကြီးမော်ဒယ်များနှင့် လုပ်ငန်းဆောင်တာများကို ဦးတည်သည့် မော်ဂျူးများစွာအတွက် ထိပ်တန်းကုဒ်ဘေ့စ်များကို ပံ့ပိုးပေးပါသည်။ MMDetection toolbox တွင် ယခင်က ပြုလုပ်ခဲ့ပြီး လိုက်လျောညီထွေဖြစ်စေသော နည်းလမ်းများကို အောက်တွင် ဖော်ပြထားပါသည်။ မော်ဒယ်များနှင့် နည်းလမ်းများကို ထပ်မံထည့်သွင်းထားသောကြောင့် အဆိုပါစာရင်းသည် ဆက်လက်ကြီးထွားလာသည်။
- R-CNN အမြန်
- R-CNN ပိုမြန်တယ်။
- R-CNN မျက်နှာဖုံး
- RetinaNet
- DCN
- DCNv2
- Cascade R-CNN
- M2Det
- GHM
- ခြစ်ရာ
- Double-Head R-CNN
- ဂရစ် R-CNN
- FSAF
- Libra R-CNN
- GCNet
- HRNet
- မျက်နှာဖုံးအမှတ်ပေး R-CNN
- FCOS
- SSD ကို
- R-FCN
- ရောစပ်တိကျမှုသင်တန်း
- အလေးချိန်စံနှုန်းသတ်မှတ်ခြင်း။
- Hybrid Task Cascade
- ပဲ့ထိန်းကျောက်ချ
- ယေဘုယျအာရုံစိုက်
MMDetection ကို အသုံးပြု၍ အရာဝတ္ထု ထောက်လှမ်းခြင်း မော်ဒယ်ကို တည်ဆောက်ခြင်း။
ဤသင်ခန်းစာတွင်၊ ကျွန်ုပ်တို့သည် သတ်မှတ်ရန်နှင့် အသုံးပြုရလွယ်ကူသောကြောင့် ကျွန်ုပ်တို့သည် Google collab notebook ဖြစ်လာပါမည်။
installation
ကျွန်ုပ်တို့လိုအပ်သမျှကို ထည့်သွင်းရန်အတွက် လိုအပ်သောစာကြည့်တိုက်များကို ဦးစွာထည့်သွင်းပြီး MMdetection GitHub ပရောဂျက်ကို ပွားပါမည်။
တင်သွင်းခြင်း env
ကျွန်ုပ်တို့၏ ပရောဂျက်အတွက် ပတ်ဝန်းကျင်ကို ယခုအခါ သိုလှောင်ရုံမှ တင်သွင်းမည်ဖြစ်သည်။
စာကြည့်တိုက်များနှင့် MMdetection ကို တင်သွင်းခြင်း။
MMdetection နှင့်အတူ လိုအပ်သော စာကြည့်တိုက်များကို ယခု တင်သွင်းပါမည်။
ကြိုတင်လေ့ကျင့်ထားသော စစ်ဆေးရေးဂိတ်များကို ဒေါင်းလုဒ်လုပ်ပါ။
MMdetection မှ ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ် စစ်ဆေးရေးဂိတ်များကို ယခု ထပ်မံ ချိန်ညှိမှု နှင့် အနုမာနအတွက် ဒေါင်းလုဒ်လုပ်သင့်ပါသည်။
အဆောက်အဦပုံစံ
ကျွန်ုပ်တို့သည် ယခု ပုံစံကို တည်ဆောက်ပြီး ဒေတာအတွဲတွင် စစ်ဆေးရေးဂိတ်များကို အသုံးပြုပါမည်။
detector ကို ကောက်ချက်ချသည်။
အခု မော်ဒယ်ကို စနစ်တကျ တည်ဆောက်ပြီး တင်လိုက်တာနဲ့ ဘယ်လောက်တောင် ကောင်းနေလဲဆိုတာ စစ်ဆေးကြည့်ရအောင်။ ကျွန်ုပ်တို့သည် MMDetection ၏အဆင့်မြင့် API အနုမာနရှာဖွေစက်ကို အသုံးပြုပါသည်။ ဤ API သည် ကောက်ချက်ချခြင်းလုပ်ငန်းစဉ်ကို ပိုမိုလွယ်ကူစေရန် ဒီဇိုင်းထုတ်ထားပါသည်။
ရလဒ်
ရလဒ်တွေကို ကြည့်ရအောင်။
ကောက်ချက်
နိဂုံးချုပ်အားဖြင့်၊ MMDetection toolbox သည် မကြာသေးမီက ထုတ်ပြန်ခဲ့သော SimpleDet၊ Detectron နှင့် Maskrcnn-benchmark ကဲ့သို့သော ကုဒ်အခြေခံများကို သာလွန်ကောင်းမွန်ပါသည်။ မော်ဒယ်ကြီးများ စုစည်းမှုနှင့်အတူ၊
MMDetection သည် ယခုအခါ ခေတ်မီနည်းပညာဖြစ်သည်။ MMDetection သည် စွမ်းဆောင်ရည်နှင့် စွမ်းဆောင်ရည်သတ်မှတ်ချက်များတွင် အခြားကုဒ်ဘေ့စ်အားလုံးကို စွမ်းဆောင်ရည်ထက် သာလွန်စေသည်။
MMdetection ၏ အကောင်းမွန်ဆုံးအရာများထဲမှတစ်ခုမှာ ယခုသင်သည် မတူညီသော configuration ဖိုင်ကိုညွှန်ပြနိုင်ပြီး မတူညီသောစစ်ဆေးရေးဂိတ်တစ်ခုကို ဒေါင်းလုဒ်လုပ်ကာ မော်ဒယ်များကိုပြောင်းလဲလိုပါက တူညီသောကုဒ်ကိုဖွင့်နိုင်ပြီဖြစ်သည်။
ငါသူတို့ကိုကြည့်ဖို့အကြံပေးတယ်။ ညွှန်ကြားချက်များ အဆင့်တစ်ခုခုနဲ့ ပြဿနာကြုံနေတယ်ဆိုရင် ဒါမှမဟုတ် အဲဒီထဲက တချို့ကို ကွဲပြားစွာ အကောင်အထည်ဖော်လိုရင်၊
တစ်ဦးစာပြန်ရန် Leave