Werrej[Aħbi][Uri]
Waħda mill-ideat l-aktar sempliċi iżda l-aktar intriganti fit-tagħlim fil-fond hija l-iskoperta tal-oġġetti. L-idea fundamentali hija li taqsam kull oġġett fi klassijiet suċċessivi li jirrappreżentaw karatteristiċi komparabbli u mbagħad tiġbed kaxxa madwaru.
Dawn il-karatteristiċi distintivi jistgħu jkunu sempliċi daqs forma jew kulur, li jgħin fil-kapaċità tagħna li nikkategorizzawhom.
L-applikazzjonijiet ta' Sejbien tal-Oġġetti huma impjegati ħafna fix-xjenzi mediċi, sewqan awtonomu, difiża u militari, amministrazzjoni pubblika, u ħafna oqsma oħra grazzi għal titjib sostanzjali fil-Viżjoni tal-Kompjuter u l-Ipproċessar tal-Immaġini.
Hawnhekk għandna MMDetection, sett ta 'għodda meraviljuż ta' sejbien ta 'oġġetti open-source mibni fuq Pytorch. F'dan l-artikolu, aħna ser neżaminaw MMDetection fid-dettall, nimxu prattikament magħha, niddiskutu l-karatteristiċi tagħha, u ħafna aktar.
X'inhu MMDdetection?
il MMDdetection toolbox inħoloq bħala codebase Python speċifikament għal problemi li jinvolvu l-identifikazzjoni tal-oġġett u s-segmentazzjoni tal-istanza.
L-implimentazzjoni PyTorch tintuża, u hija maħluqa b'mod modulari. Għar-rikonoxximent tal-oġġetti u s-segmentazzjoni tal-istanzi, ġiet miġbura firxa wiesgħa ta 'mudelli effettivi f'varjetà ta' metodoloġiji.
Jippermetti inferenza effettiva u taħriġ rapidu. Min-naħa l-oħra, il-kaxxa tal-għodda tinkludi piżijiet għal aktar minn 200 netwerk imħarreġ minn qabel, li jagħmilha soluzzjoni ta 'malajr fil-qasam tal-identifikazzjoni tal-oġġett.
Bil-kapaċità li tadatta t-tekniki attwali jew toħloq ditekter ġdid bl-użu tal-moduli disponibbli, MMDetection jiffunzjona bħala punt ta 'referenza.
Il-karatteristika ewlenija tal-kaxxa tal-għodda hija l-inklużjoni tagħha ta 'partijiet sempliċi u modulari minn normali sejbien ta 'oġġett qafas li jista 'jintuża biex jinħolqu pipelines uniċi jew mudelli uniċi.
Il-kapaċitajiet ta' benchmarking ta' dan is-sett ta' għodod jagħmluha sempliċi biex jinbena qafas ta' ditekter ġdid fuq qafas eżistenti u jitqabbel il-prestazzjoni tiegħu.
Karatteristiċi
- Oqfsa ta 'skoperta popolari u moderni, bħal Faster RCNN, Mask RCNN, RetinaNet, eċċ., huma appoġġjati direttament mill-għodda.
- Użu ta' 360+ mudelli mħarrġa minn qabel għall-irfinar (jew taħriġ mill-ġdid).
- Għal settijiet ta' dejta tal-viżjoni magħrufa inklużi COCO, Cityscapes, LVIS, u PASCAL VOC.
- Fuq il-GPUs, l-operazzjonijiet fundamentali kollha tal-bbox u tal-maskra huma esegwiti. Codebases oħra, bħal Detectron2, maskrcnn-benchmark, u SimpleDet, jistgħu jiġu mħarrġa b'rata aktar mgħaġġla minn jew fuq l-istess livell ta 'dan.
- Ir-riċerkaturi jkissru l- sejbien ta 'oġġett qafas f'diversi moduli, li mbagħad jistgħu jiġu kkombinati biex tinħoloq sistema unika ta 'skoperta ta' oġġetti.
Arkitettura MMDetection
MMDetection jispeċifika disinn ġeneriku li jista 'jiġi applikat għal kwalunkwe mudell peress li huwa kaxxa tal-għodda b'varjetà ta' mudelli mibnija minn qabel, li kull wieħed minnhom għandu l-arkitettura tiegħu stess. Il-komponenti li ġejjin jiffurmaw din l-arkitettura ġenerali:
- Sinsla: Sinsla, bħal ResNet-50 mingħajr is-saff finali kompletament konness, huwa l-komponent li jikkonverti immaġini għal mapep tal-karatteristiċi.
- għonq: L-għonq huwa s-segment li jgħaqqad is-sinsla mal-irjus. Fuq il-mapep tal-karatteristiċi mhux maħduma tas-sinsla, jagħmel ċerti aġġustamenti jew konfigurazzjonijiet mill-ġdid. Feature Pyramid Network huwa illustrazzjoni waħda (FPN).
- DensHead (AnchorHead/AnchorFreeHead): Huwa l-komponent li jopera fuq żoni densi ta 'mapep tal-karatteristiċi, bħal AnchorHead u AnchorFreeHead, bħal RPNHead, RetinaHead, u FCOSHead.
- RoIExtractor: Bl-użu ta’ operaturi li jixbhu lil RoIPooling, hija s-sezzjoni li tiġbed karatteristiċi RoIwise minn waħda jew ġabra ta’ mapep tal-karatteristiċi. Il-kampjun SingleRoIExtractor estratti karatteristiċi RoI mil-livell ta 'tqabbil tal-piramidi tal-karatteristiċi.
- RoIHead (BBoxHead/MaskHead): Hija l-parti tas-sistema li tuża l-karatteristiċi RoI bħala input u tiġġenera tbassir speċifiku għall-kompitu bbażat fuq RoI, bħall-klassifikazzjoni/rigressjoni tal-kaxxa tal-konfini u tbassir tal-maskra.
Il-kostruzzjoni ta 'ditekters ta' stadju wieħed u żewġ stadji hija illustrata bl-użu tal-kunċetti msemmija hawn fuq. Nistgħu niżviluppaw il-proċeduri tagħna stess sempliċement billi nibnu ftit partijiet ġodda u ngħaqqdu xi wħud eżistenti.
Lista ta' mudelli inklużi f'MMDetection
MMDetection jipprovdi codebases tal-ogħla livell għal diversi mudelli magħrufa u moduli orjentati lejn il-kompiti. Il-mudelli li saru qabel u l-metodi adattabbli li jistgħu jiġu utilizzati mal-kaxxa tal-għodda MMDetection huma elenkati hawn taħt. Il-lista tkompli tikber hekk kif jiżdiedu aktar mudelli u metodi.
- Fast R-CNN
- R-CNN aktar mgħaġġel
- Maskra R-CNN
- RetinaNet
- DCN
- DCNv2
- Kaskata R-CNN
- M2Det
- GHM
- ScratchDet
- Double-Head R-CNN
- Grid R-CNN
- FSAF
- Libra R-CNN
- GCNet
- HRNet
- Maskra Scoring R-CNN
- FCOS
- SSD
- R-FCN
- Taħriġ ta' Preċiżjoni Mħallta
- Standardizzazzjoni tal-Piż
- Kaskata tal-Kompitu Ibridi
- Ankraġġ Iggwidat
- Attenzjoni Ġeneralizzata
Mudell ta' skoperta ta' oġġetti tal-bini bl-użu ta' MMDetection
F'dan it-tutorja, se nkunu n-notebook tal-collab ta 'Google minħabba li huwa faċli biex tissettja u tuża.
installazzjoni
Biex ninstallaw dak kollu li għandna bżonn, l-ewwel se ninstallaw il-libreriji meħtieġa u nikklonu l-proġett MMdetection GitHub.
Importazzjoni env
L-ambjent għall-proġett tagħna issa se jiġi importat mir-repożitorju.
L-importazzjoni ta' libreriji u MMdetection
Issa se nimportaw il-libreriji meħtieġa, flimkien mal-MMdetection ovvjament.
Niżżel il-punti ta' kontroll imħarrġa minn qabel
Il-punti ta' kontroll tal-mudell imħarrġa minn qabel minn MMdetection issa għandhom jitniżżlu għal aktar aġġustament u inferenza.
Mudell tal-bini
Issa se nibnu l-mudell u napplikaw il-punti ta 'kontroll għas-sett tad-dejta.
Inferenza tad-ditekter
Issa li l-mudell ġie mibni u mgħobbi sew, ejja niċċekkjaw kemm hu eċċellenti. Aħna nużaw id-ditekter ta' inferenza API ta' livell għoli ta' MMDetection. Din l-API kienet iddisinjata biex tagħmel il-proċess ta 'inferenza aktar faċli.
Riżultat
Ejja nagħtu ħarsa lejn ir-riżultati.
konklużjoni
Bħala konklużjoni, il-kaxxa tal-għodda MMDetection tegħleb il-bażijiet tal-kodiċi rilaxxati reċentement bħal SimpleDet, Detectron u Maskrcnn-benchmark. B'ġbir kbir ta 'mudelli,
MMDetection issa hija teknoloġija avvanzata. MMDetection tegħleb il-kodiċijiet l-oħra kollha f'termini ta 'effiċjenza u prestazzjoni.
Waħda mill-isbaħ affarijiet dwar MMdetection hija li issa tista' sempliċement tipponta lejn fajl ta' konfigurazzjoni differenti, tniżżel punt ta' kontroll differenti, u tħaddem l-istess kodiċi jekk tixtieq tibdel il-mudelli.
Nagħti parir li tħares lejn tagħhom istruzzjonijiet jekk tiltaqa' ma' problemi ma' xi stadji jew tixtieq twettaq xi wħud minnhom b'mod differenti.
Ħalli Irrispondi