Kaundan[Itago][Ipakita]
Usa sa pinakasimple apan labing makaiikag nga mga ideya sa lawom nga pagkat-on mao ang pagkakita sa butang. Ang sukaranan nga ideya mao ang pagbahin sa matag aytem sa sunud-sunod nga mga klase nga nagrepresentar sa parehas nga mga kinaiya ug dayon pagdrowing og kahon sa palibot niini.
Kining nagpalahi nga mga kinaiya mahimong yano sama sa porma o kolor, nga makatabang sa atong abilidad sa pagkategorya niini.
Ang mga aplikasyon sa Pagsusi sa butang kay kaylap nga nagtrabaho sa medikal nga siyensya, awtonomous nga pagmaneho, depensa ug militar, administrasyong publiko, ug daghang uban pang mga natad salamat sa daghang pag-uswag sa Computer Vision ug Image Processing.
Ania kami adunay MMDetection, usa ka talagsaon nga open-source nga tool sa pagtuki sa butang nga gitukod sa Pytorch. Niini nga artikulo, atong susihon ang MMDetection sa detalye, ipadayon kini, hisgutan ang mga bahin niini, ug daghan pa.
Unsa ang MMDetection?
ang MMDetection Ang toolbox gimugna isip Python codebase ilabi na alang sa mga problema nga naglambigit sa pag-ila sa butang ug pagbahin sa instance.
Ang pagpatuman sa PyTorch gigamit, ug kini gihimo sa modular nga paagi. Alang sa pag-ila sa butang ug pagbahinbahin sa pananglitan, usa ka halapad nga hanay sa epektibo nga mga modelo ang natipon sa lainlaing mga pamaagi.
Gitugotan niini ang epektibo nga pagsabut ug paspas nga pagbansay. Sa laing bahin, ang toolbox naglakip sa mga gibug-aton alang sa kapin sa 200 ka pre-trained network, nga naghimo niini nga dali nga ayuhon sa natad sa pag-ila sa butang.
Uban ang katakus sa pagpahiangay sa karon nga mga teknik o paghimo usa ka bag-ong detektor gamit ang magamit nga mga module, ang MMDetection naglihok ingon usa ka benchmark.
Ang yawe nga bahin sa toolbox mao ang paglakip niini sa prangka, modular nga mga bahin gikan sa usa ka normal pagpangita sa butang balangkas nga magamit sa paghimo og talagsaon nga mga pipeline o talagsaon nga mga modelo.
Ang mga kapabilidad sa pag-benchmark sa kini nga toolkit nagpasayon sa paghimo og bag-ong framework sa detector sa ibabaw sa kasamtangan nga framework ug itandi ang performance niini.
Features
- Ang popular ug moderno nga mga framework sa detection, sama sa Faster RCNN, Mask RCNN, RetinaNet, ug uban pa, direktang gisuportahan sa toolkit.
- Paggamit sa 360+ nga pre-trained nga mga modelo para sa fine-tuning (o pagbansay pag-usab).
- Para sa iladong vision datasets lakip na ang COCO, Cityscapes, LVIS, ug PASCAL VOC.
- Sa mga GPU, ang tanan nga sukaranan nga mga operasyon sa bbox ug maskara gipatuman. Ang ubang mga codebase, sama sa Detectron2, maskrcnn-benchmark, ug SimpleDet, mahimong mabansay sa mas paspas nga rate kaysa o parehas niini.
- Gibungkag sa mga tigdukiduki ang pagpangita sa butang gambalay ngadto sa pipila ka mga modules, nga mahimo unya nga gihiusa sa paghimo sa usa ka talagsaon nga butang detection system.
Arkitektura sa MMDetection
Gitino sa MMDetection ang usa ka generic nga disenyo nga mahimong magamit sa bisan unsang modelo tungod kay kini usa ka toolbox nga adunay lainlaing mga pre-built nga mga modelo, ang matag usa adunay kaugalingon nga arkitektura. Ang mosunod nga mga sangkap naglangkob niining kinatibuk-ang arkitektura:
- backbone: Ang backbone, sama sa usa ka ResNet-50 nga wala ang katapusang hingpit nga konektado nga layer, mao ang sangkap nga nag-convert sa usa ka imahe aron adunay mga mapa.
- Ang liog: Ang liog mao ang bahin nga nagkonektar sa bukobuko sa mga ulo. Sa mga mapa sa hilaw nga bahin sa backbone, kini naghimo sa piho nga mga pag-adjust o pag-configure. Ang Feature Pyramid Network usa ka ilustrasyon (FPN).
- DenseHead (AnchorHead/AnchorFreeHead): Kini ang component nga naglihok sa dasok nga mga lugar sa feature nga mga mapa, sama sa AnchorHead ug AnchorFreeHead, sama sa RPNHead, RetinaHead, ug FCOSHead.
- RoIExtractor: Sa paggamit sa mga operator nga sama sa RoIPooling, kini ang seksyon nga nagbira sa mga bahin sa RoIwise gikan sa usa o usa ka koleksyon sa mga mapa nga bahin. Ang SingleRoIExtractor sample nagkuha sa RoI nga mga feature gikan sa katugbang nga lebel sa feature pyramids.
- RoIHead (BBoxHead/MaskHead): Kini ang bahin sa sistema nga naggamit sa RoI nga mga kinaiya isip usa ka input ug nagmugna sa RoI-based task-specific nga mga panagna, sama sa bounding box classification/regression ug mask prediction.
Ang pagtukod sa single-stage ug two-stage detectors gihulagway gamit ang nahisgutang mga konsepto. Kita makahimo sa atong kaugalingon nga mga pamaagi pinaagi lamang sa paghimo sa pipila ka bag-ong mga bahin ug paghiusa sa pipila ka mga kasamtangan nga mga.
Listahan sa mga modelo nga gilakip sa MMDetection
Naghatag ang MMDetection og mga top-notch codebase alang sa daghang mga ilado nga modelo ug mga module nga gipunting sa buluhaton. Ang mga modelo nga nahimo na kaniadto ug mapahiangay nga mga pamaagi nga mahimong magamit sa toolbox sa MMDetection gilista sa ubos. Ang lista nagpadayon sa pagtubo samtang daghang mga modelo ug pamaagi ang gidugang.
- Dali nga R-CNN
- Mas paspas nga R-CNN
- Maskara R-CNN
- RetinaNet
- DCN
- DCNv2
- Cascade R-CNN
- M2Det
- GHM
- ScratchDet
- Doble nga Ulo R-CNN
- Grid R-CNN
- FSAF
- Libra R-CNN
- GCNet
- HRNet
- Pagmarka sa Maskara R-CNN
- FCOS
- SSD
- R-FCN
- Nagsagol nga Precision Training
- Standardisasyon sa Timbang
- Hybrid Task Cascade
- Gigiyahan nga Pag-angkla
- Kinatibuk-ang Atensyon
Pagtukod og modelo sa pagkakita sa butang gamit ang MMDetection
Sa kini nga panudlo, kita mahimong Google collab notebook tungod kay kini dali nga itakda ug gamiton.
Instalar
Aron ma-install ang tanan nga kinahanglan namon, una namon nga i-install ang kinahanglan nga mga librarya ug i-clone ang proyekto sa MMdetection GitHub.
Pag-import sa env
Ang palibot alang sa among proyekto i-import na gikan sa repository.
Pag-import sa mga librarya ug MMdetection
Atong i-import karon ang gikinahanglan nga mga librarya, uban ang MMdetection siyempre.
I-download ang pre-trained checkpoints
Ang pre-trained model checkpoints gikan sa MMdetection kinahanglan na nga ma-download para sa dugang nga adjustment ug inference.
Modelo sa pagtukod
Magtukod kami karon sa modelo ug magamit ang mga checkpoint sa dataset.
Isulti ang detector
Karon nga ang modelo husto nga pagkatukod ug gikarga, atong susihon kung unsa kini ka maayo. Gigamit namo ang high-level nga API inference detector sa MMDetection. Gidisenyo kini nga API aron mapasayon ang proseso sa pag-inference.
resulta
Atong tan-awon ang mga resulta.
Panapos
Sa konklusyon, ang MMDetection toolbox milabaw sa bag-ong gipagawas nga mga codebase sama sa SimpleDet, Detectron, ug Maskrcnn-benchmark. Uban sa usa ka dako nga koleksyon sa modelo,
Ang MMDetection karon state-of-the-art nga teknolohiya. Ang MMDetection milabaw sa tanan nga uban pang mga codebase sa termino sa kahusayan ug pasundayag.
Usa sa labing nindot nga mga butang bahin sa MMdetection mao nga mahimo ka na nga magtudlo sa usa ka lahi nga file sa pag-configure, mag-download sa usa ka lahi nga checkpoint, ug magpadagan sa parehas nga code kung gusto nimo usbon ang mga modelo.
Tambag ko sa pagtan-aw sa ilang mga panudlo kung adunay mga problema sa bisan unsang mga yugto o gusto nimo nga buhaton ang pipila niini sa lahi nga paagi.
Leave sa usa ka Reply