Object Detection အတွက် MMDetection Toolbox

မာတိကာ[ဖျောက်][ရှိုး]

MMDetection ဆိုတာဘာလဲ။
အင်္ဂါရပ်များ
MMDetection ဗိသုကာ
MMDetection တွင်ပါဝင်သော မော်ဒယ်များစာရင်း
MMDetection ကို အသုံးပြု၍ အရာဝတ္ထု ထောက်လှမ်းခြင်း မော်ဒယ်ကို တည်ဆောက်ခြင်း။ +-
ကောက်ချက်

နက်ရှိုင်းသောသင်ယူမှုတွင် အရိုးရှင်းဆုံးနှင့် စိတ်ဝင်စားစရာအကောင်းဆုံး စိတ်ကူးများထဲမှတစ်ခုမှာ အရာဝတ္ထုရှာဖွေခြင်းပင်ဖြစ်သည်။ အခြေခံအယူအဆမှာ အကြောင်းအရာတစ်ခုစီကို နှိုင်းယှဉ်နိုင်သော စရိုက်လက္ခဏာများကို ကိုယ်စားပြုသည့် အတန်းများအထိ ခွဲပြီး ၎င်းနှင့်ပတ်ပတ်လည်တွင် ဘောက်စ်တစ်ခုဆွဲရန်ဖြစ်သည်။

ဤထူးခြားသောလက္ခဏာများသည် ကျွန်ုပ်တို့၏အမျိုးအစားခွဲခြားနိုင်စွမ်းကို အထောက်အကူဖြစ်စေသော ပုံစံ သို့မဟုတ် အရောင်ကဲ့သို့ရိုးရှင်းနိုင်သည်။

လျှောက်လွှာများ object ထောက်လှမ်းခြင်း Computer Vision နှင့် Image Processing တွင် သိသိသာသာ တိုးတက်မှုများကြောင့် ဆေးဘက်ဆိုင်ရာ သိပ္ပံ၊ ကိုယ်ပိုင်အုပ်ချုပ်ခွင့်ရ မောင်းနှင်မှု၊ ကာကွယ်ရေးနှင့် စစ်ရေး၊ ပြည်သူ့အုပ်ချုပ်ရေးနှင့် အခြားသော နယ်ပယ်များစွာတွင် ကျယ်ပြန့်စွာ အသုံးချလျက်ရှိသည်။

ဤတွင် ကျွန်ုပ်တို့တွင် Pytorch တွင်တည်ဆောက်ထားသော အံ့သြဖွယ် open-source object detection toolset MMDetection ရှိသည်။ ဤဆောင်းပါးတွင်၊ ကျွန်ုပ်တို့သည် MMDetection ကိုအသေးစိတ်စစ်ဆေးပြီး၊ ၎င်းနှင့်လက်တွေ့လုပ်ဆောင်ပါ၊ ၎င်း၏အင်္ဂါရပ်များနှင့် အခြားအရာများကို ဆွေးနွေးပါမည်။

ဘာဖြစ်သလဲ MMDetection?

အဆိုပါ MMDetection Object identification နှင့် instance segmentation ပါ၀င်သော ပြဿနာများအတွက် ကိရိယာပုံးကို Python codebase အဖြစ် ဖန်တီးထားပါသည်။

PyTorch အကောင်အထည်ဖော်မှုကို အသုံးပြုထားပြီး ၎င်းကို modular ပုံစံဖြင့် ဖန်တီးထားသည်။ Object recognition နှင့် instance segmentation အတွက် ကျယ်ပြန့်သော ထိရောက်သော မော်ဒယ်များကို methodologies အမျိုးမျိုးဖြင့် စုစည်းထားပါသည်။

၎င်းသည် ထိရောက်သော ကောက်ချက်ချမှုနှင့် လျင်မြန်သော လေ့ကျင့်မှုကို ခွင့်ပြုသည်။ အခြားတစ်ဖက်တွင်၊ ကိရိယာပုံးတွင် ကြိုတင်လေ့ကျင့်ထားသည့် ကွန်ရက်ပေါင်း ၂၀၀ ကျော်အတွက် အလေးများပါရှိပြီး အရာဝတ္ထုသတ်မှတ်ခြင်းနယ်ပယ်တွင် အမြန်ပြင်ဆင်မှုဖြစ်စေသည်။

လက်ရှိနည်းပညာများကို လိုက်လျောညီထွေဖြစ်အောင် သို့မဟုတ် ရရှိနိုင်သော module များကို အသုံးပြု၍ detector အသစ်တစ်ခုဖန်တီးနိုင်ခြင်းဖြင့် MMDetection သည် စံသတ်မှတ်ချက်တစ်ခုအဖြစ် လုပ်ဆောင်ပါသည်။

ကိရိယာပုံး၏ အဓိကအင်္ဂါရပ်မှာ သာမာန်တစ်ခုမှ ရိုးရှင်းသော၊ မော်ဂျူလာ အစိတ်အပိုင်းများ ပါဝင်သည်။ အရာဝတ္ထုထောက်လှမ်း ထူးခြားသော ပိုက်လိုင်းများ သို့မဟုတ် ထူးခြားသော မော်ဒယ်များ ဖန်တီးရန် အသုံးပြုနိုင်သည့် ဘောင်။

ဤကိရိယာအစုံ၏ စံသတ်မှတ်နိုင်စွမ်းသည် ရှိပြီးသားဘောင်တစ်ခု၏ထိပ်တွင် detector framework အသစ်တစ်ခုတည်ဆောက်ရန်နှင့် ၎င်း၏စွမ်းဆောင်ရည်ကို နှိုင်းယှဉ်ရန် ရိုးရှင်းစေသည်။

အင်္ဂါရပ်များ

ပိုမြန်သော RCNN၊ Mask RCNN၊ RetinaNet စသဖြင့် လူကြိုက်များပြီး ခေတ်မီသော ထောက်လှမ်းမှုဘောင်များကို ကိရိယာအစုံမှ တိုက်ရိုက်ပံ့ပိုးပေးပါသည်။
ချိန်ညှိခြင်း (သို့မဟုတ် အသစ်ပြန်လည်လေ့ကျင့်ခြင်း) အတွက် 360+ ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ်များကို အသုံးပြုခြင်း။
COCO၊ Cityscapes၊ LVIS နှင့် PASCAL VOC အပါအဝင် လူသိများသော အမြင်ဒေတာအတွဲများအတွက်။
GPU များတွင်၊ အခြေခံ bbox နှင့် mask လုပ်ဆောင်ချက်အားလုံးကို လုပ်ဆောင်သည်။ Detectron2၊ maskrcnn-benchmark နှင့် SimpleDet ကဲ့သို့သော အခြားသော ကုဒ်ဘေ့စ်များကို ဤတစ်ခုထက် ပိုမိုမြန်ဆန်သောနှုန်းဖြင့် လေ့ကျင့်နိုင်ပါသည်။
သုတေသီများက ဖြိုခွဲသည်။ အရာဝတ္ထုထောက်လှမ်း မူဘောင်များကို မော်ဂျူးများစွာသို့ ပေါင်းစပ်နိုင်ပြီး ထူးခြားသော အရာဝတ္ထုကို ထောက်လှမ်းခြင်းစနစ်ကို ဖန်တီးရန်။

MMDetection ဗိသုကာ

MMDetection သည် ၎င်း၏ကိုယ်ပိုင်ဗိသုကာလက်ရာများပါရှိသော ကိရိယာအစုံအလင်ပါရှိသော ကိရိယာပုံးဖြစ်သောကြောင့် မည်သည့်မော်ဒယ်အတွက်မဆို အသုံးပြုနိုင်သည့် ယေဘူယျဒီဇိုင်းကို သတ်မှတ်ပေးပါသည်။ အောက်ဖော်ပြပါ အစိတ်အပိုင်းများသည် ဤအလုံးစုံသော ဗိသုကာပညာဖြင့် ဖွဲ့စည်းသည်-

ကြောရိုး: နောက်ဆုံးချိတ်ဆက်ထားသော အလွှာမပါဘဲ ResNet-50 ကဲ့သို့သော ကျောရိုးသည် ပုံတစ်ပုံကို အင်္ဂါရပ်မြေပုံများအဖြစ် ပြောင်းလဲပေးသည့် အစိတ်အပိုင်းဖြစ်သည်။
လည်ပင်းလည်ပင်းသည် ဦးခေါင်းများနှင့် ကျောရိုးကို ဆက်သွယ်ပေးသည့် အပိုင်းဖြစ်သည်။ ကျောရိုး၏ အကြမ်းထည်အင်္ဂါရပ်မြေပုံများတွင် ၎င်းသည် အချို့သော ချိန်ညှိမှုများ သို့မဟုတ် ပြန်လည်ဖွဲ့စည်းမှုများကို လုပ်ဆောင်သည်။ Feature Pyramid Network သည် သရုပ်ဖော်ပုံ (FPN) တစ်ခုဖြစ်သည်။
DenseHead (AnchorHead/AnchorFreeHead): ၎င်းသည် RPNHead၊ RetinaHead နှင့် FCOSHead ကဲ့သို့သော AnchorHead နှင့် AnchorFreeHead ကဲ့သို့သော အင်္ဂါရပ်မြေပုံများ၏ သိပ်သည်းသောနေရာများတွင် လုပ်ဆောင်သည့် အစိတ်အပိုင်းဖြစ်သည်။
RoIextractor- RoIPooling ကဲ့သို့သော အော်ပရေတာများကို အသုံးပြုခြင်းဖြင့်၊ ၎င်းသည် RoIwise အင်္ဂါရပ်များကို တစ်ခုတည်း သို့မဟုတ် အင်္ဂါရပ်မြေပုံများစုစည်းမှုမှ ဆွဲထုတ်သည့်အပိုင်းဖြစ်သည်။ SingleRoIextractor နမူနာသည် တူညီသောအင်္ဂါရပ်ပိရမစ်အဆင့်မှ RoI အင်္ဂါရပ်များကို ထုတ်ယူသည်။
RoIHead (BBoxHead/MaskHead): ၎င်းသည် RoI လက္ခဏာများကို ထည့်သွင်းမှုအဖြစ် အသုံးပြုကာ RoI-based အလုပ်-သတ်သတ်မှတ်မှတ် ခန့်မှန်းချက်များကို ထုတ်ပေးသည့် စနစ်၏ အပိုင်းဖြစ်သည်။

အထက်ဖော်ပြပါ သဘောတရားများကို အသုံးပြု၍ single-stage နှင့် two-stage detectors များ၏ တည်ဆောက်မှုကို သရုပ်ဖော်ထားပါသည်။ အသစ်အသစ်သော အစိတ်အပိုင်းအချို့ကို တည်ဆောက်ပြီး အချို့သော ရှိပြီးသားအရာများကို ပေါင်းစပ်ခြင်းဖြင့် ကျွန်ုပ်တို့၏ကိုယ်ပိုင်လုပ်ထုံးလုပ်နည်းများကို ရိုးရှင်းစွာ ဖွံ့ဖြိုးတိုးတက်နိုင်ပါသည်။

MMDetection တွင်ပါဝင်သော မော်ဒယ်များစာရင်း

MMDetection သည် နာမည်ကြီးမော်ဒယ်များနှင့် လုပ်ငန်းဆောင်တာများကို ဦးတည်သည့် မော်ဂျူးများစွာအတွက် ထိပ်တန်းကုဒ်ဘေ့စ်များကို ပံ့ပိုးပေးပါသည်။ MMDetection toolbox တွင် ယခင်က ပြုလုပ်ခဲ့ပြီး လိုက်လျောညီထွေဖြစ်စေသော နည်းလမ်းများကို အောက်တွင် ဖော်ပြထားပါသည်။ မော်ဒယ်များနှင့် နည်းလမ်းများကို ထပ်မံထည့်သွင်းထားသောကြောင့် အဆိုပါစာရင်းသည် ဆက်လက်ကြီးထွားလာသည်။

R-CNN အမြန်
R-CNN ပိုမြန်တယ်။
R-CNN မျက်နှာဖုံး
RetinaNet
DCN
DCNv2
Cascade R-CNN
M2Det
GHM
ခြစ်ရာ
Double-Head R-CNN
ဂရစ် R-CNN
FSAF
Libra R-CNN
GCNet
HRNet
မျက်နှာဖုံးအမှတ်ပေး R-CNN
FCOS
SSD ကို
R-FCN
ရောစပ်တိကျမှုသင်တန်း
အလေးချိန်စံနှုန်းသတ်မှတ်ခြင်း။
Hybrid Task Cascade
ပဲ့ထိန်းကျောက်ချ
ယေဘုယျအာရုံစိုက်

MMDetection ကို အသုံးပြု၍ အရာဝတ္ထု ထောက်လှမ်းခြင်း မော်ဒယ်ကို တည်ဆောက်ခြင်း။

ဤသင်ခန်းစာတွင်၊ ကျွန်ုပ်တို့သည် သတ်မှတ်ရန်နှင့် အသုံးပြုရလွယ်ကူသောကြောင့် ကျွန်ုပ်တို့သည် Google collab notebook ဖြစ်လာပါမည်။

installation

ကျွန်ုပ်တို့လိုအပ်သမျှကို ထည့်သွင်းရန်အတွက် လိုအပ်သောစာကြည့်တိုက်များကို ဦးစွာထည့်သွင်းပြီး MMdetection GitHub ပရောဂျက်ကို ပွားပါမည်။

တင်သွင်းခြင်း env

ကျွန်ုပ်တို့၏ ပရောဂျက်အတွက် ပတ်ဝန်းကျင်ကို ယခုအခါ သိုလှောင်ရုံမှ တင်သွင်းမည်ဖြစ်သည်။

စာကြည့်တိုက်များနှင့် MMdetection ကို တင်သွင်းခြင်း။

MMdetection နှင့်အတူ လိုအပ်သော စာကြည့်တိုက်များကို ယခု တင်သွင်းပါမည်။

ကြိုတင်လေ့ကျင့်ထားသော စစ်ဆေးရေးဂိတ်များကို ဒေါင်းလုဒ်လုပ်ပါ။

MMdetection မှ ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ် စစ်ဆေးရေးဂိတ်များကို ယခု ထပ်မံ ချိန်ညှိမှု နှင့် အနုမာနအတွက် ဒေါင်းလုဒ်လုပ်သင့်ပါသည်။

အဆောက်အဦပုံစံ

ကျွန်ုပ်တို့သည် ယခု ပုံစံကို တည်ဆောက်ပြီး ဒေတာအတွဲတွင် စစ်ဆေးရေးဂိတ်များကို အသုံးပြုပါမည်။

detector ကို ကောက်ချက်ချသည်။

အခု မော်ဒယ်ကို စနစ်တကျ တည်ဆောက်ပြီး တင်လိုက်တာနဲ့ ဘယ်လောက်တောင် ကောင်းနေလဲဆိုတာ စစ်ဆေးကြည့်ရအောင်။ ကျွန်ုပ်တို့သည် MMDetection ၏အဆင့်မြင့် API အနုမာနရှာဖွေစက်ကို အသုံးပြုပါသည်။ ဤ API သည် ကောက်ချက်ချခြင်းလုပ်ငန်းစဉ်ကို ပိုမိုလွယ်ကူစေရန် ဒီဇိုင်းထုတ်ထားပါသည်။

ရလဒ်

ရလဒ်တွေကို ကြည့်ရအောင်။

ကောက်ချက်

နိဂုံးချုပ်အားဖြင့်၊ MMDetection toolbox သည် မကြာသေးမီက ထုတ်ပြန်ခဲ့သော SimpleDet၊ Detectron နှင့် Maskrcnn-benchmark ကဲ့သို့သော ကုဒ်အခြေခံများကို သာလွန်ကောင်းမွန်ပါသည်။ မော်ဒယ်ကြီးများ စုစည်းမှုနှင့်အတူ၊

MMDetection သည် ယခုအခါ ခေတ်မီနည်းပညာဖြစ်သည်။ MMDetection သည် စွမ်းဆောင်ရည်နှင့် စွမ်းဆောင်ရည်သတ်မှတ်ချက်များတွင် အခြားကုဒ်ဘေ့စ်အားလုံးကို စွမ်းဆောင်ရည်ထက် သာလွန်စေသည်။

MMdetection ၏ အကောင်းမွန်ဆုံးအရာများထဲမှတစ်ခုမှာ ယခုသင်သည် မတူညီသော configuration ဖိုင်ကိုညွှန်ပြနိုင်ပြီး မတူညီသောစစ်ဆေးရေးဂိတ်တစ်ခုကို ဒေါင်းလုဒ်လုပ်ကာ မော်ဒယ်များကိုပြောင်းလဲလိုပါက တူညီသောကုဒ်ကိုဖွင့်နိုင်ပြီဖြစ်သည်။

ငါသူတို့ကိုကြည့်ဖို့အကြံပေးတယ်။ ညွှန်ကြားချက်များ အဆင့်တစ်ခုခုနဲ့ ပြဿနာကြုံနေတယ်ဆိုရင် ဒါမှမဟုတ် အဲဒီထဲက တချို့ကို ကွဲပြားစွာ အကောင်အထည်ဖော်လိုရင်၊

Object Detection အတွက် MMDetection Toolbox

ဘာဖြစ်သလဲ MMDetection?

အင်္ဂါရပ်များ

MMDetection ဗိသုကာ

MMDetection တွင်ပါဝင်သော မော်ဒယ်များစာရင်း