INHOUDSOPGAWE[Versteek][Wys]
Een van die eenvoudigste dog mees intrigerende idees in diep leer is objekbespeuring. Die fundamentele idee is om elke item in opeenvolgende klasse te verdeel wat vergelykbare eienskappe verteenwoordig en dan 'n boks om dit te teken.
Hierdie onderskeidende eienskappe kan so eenvoudig soos vorm of kleur wees, wat ons help om hulle te kategoriseer.
Die toepassings van Objekdeteksie is wyd werksaam in die mediese wetenskappe, outonome bestuur, verdediging en militêre, openbare administrasie, en baie ander velde danksy aansienlike verbeterings in Rekenaarvisie en Beeldverwerking.
Hier het ons MMDetection, 'n fantastiese oopbron-voorwerpopsporing-gereedskapstel wat op Pytorch gebou is. In hierdie artikel sal ons MMDetection in detail ondersoek, dit in die hande doen, die kenmerke daarvan bespreek en nog baie meer.
Wat is MMDeteksie?
Die MMDeteksie toolbox is geskep as 'n Python-kodebasis spesifiek vir probleme wat objekidentifikasie en instansiesegmentering behels.
Die PyTorch-implementering word gebruik, en dit word op 'n modulêre manier geskep. Vir objekherkenning en instansiesegmentering is 'n wye reeks effektiewe modelle saamgestel in 'n verskeidenheid metodologieë.
Dit laat effektiewe afleidings en vinnige opleiding toe. Aan die ander kant bevat die gereedskapkas gewigte vir meer as 200 vooraf-opgeleide netwerke, wat dit 'n vinnige oplossing in die voorwerpidentifikasieveld maak.
Met die vermoë om die huidige tegnieke aan te pas of 'n nuwe detektor te skep deur die beskikbare modules te gebruik, funksioneer MMDetection as 'n maatstaf.
Die sleutelkenmerk van die gereedskapkas is die insluiting van eenvoudige, modulêre onderdele van 'n normale objekopsporing raamwerk wat gebruik kan word om unieke pyplyne of unieke modelle te skep.
Die maatstafvermoëns van hierdie gereedskapstel maak dit maklik om 'n nuwe detektorraamwerk bo-op 'n bestaande raamwerk te bou en die werkverrigting daarvan te vergelyk.
Kenmerke
- Gewilde en moderne opsporingsraamwerke, soos Faster RCNN, Mask RCNN, RetinaNet, ens., word direk deur die toolkit ondersteun.
- Gebruik van 360+ vooraf-opgeleide modelle vir fyn instel (of heropleiding).
- Vir bekende visiedatastelle insluitend COCO, Cityscapes, LVIS en PASCAL VOC.
- Op GPU's word alle fundamentele bbox- en maskerbewerkings uitgevoer. Ander kodebasisse, soos Detectron2, maskrcnn-benchmark en SimpleDet, kan vinniger opgelei word as of op gelyke voet met hierdie een.
- Navorsers breek die objekopsporing raamwerk in verskeie modules, wat dan gekombineer kan word om 'n unieke objekbespeuringstelsel te skep.
MMDetection Argitektuur
MMDetection spesifiseer 'n generiese ontwerp wat op enige model toegepas kan word aangesien dit 'n gereedskapskis is met 'n verskeidenheid voorafgeboude modelle, wat elkeen sy eie argitektuur het. Die volgende komponente vorm hierdie algehele argitektuur:
- Ruggraat: Ruggraat, soos 'n ResNet-50 sonder die laaste volledig gekoppelde laag, is die komponent wat 'n prent omskakel na kenmerkkaarte.
- nek: Die nek is die segment wat die ruggraat met die koppe verbind. Op die ruggraat se rou kenmerkkaarte doen dit sekere aanpassings of herkonfigurasies. Feature Pyramid Network is een illustrasie (FPN).
- Digkop (AnchorHead/AnchorFreeHead): Dit is die komponent wat op digte areas van kenmerkkaarte werk, soos AnchorHead en AnchorFreeHead, soos RPNHead, RetinaHead en FCOSHead.
- RoIExtractor: Met die gebruik van RoIPooling-agtige operateurs, is dit die afdeling wat RoIwise-kenmerke uit 'n enkele of 'n versameling kenmerkkaarte trek. Die SingleRoIExtractor-monster onttrek RoI-kenmerke uit die ooreenstemmende vlak van kenmerkpiramides.
- RoIHead (BBoxHead/MaskHead): Dit is die gedeelte van die stelsel wat RoI-eienskappe as 'n inset gebruik en RoI-gebaseerde taakspesifieke voorspellings genereer, soos begrenskasklassifikasie/regressie en maskervoorspelling.
Die konstruksie van enkel- en twee-stadium detektors word geïllustreer met behulp van die voorgenoemde konsepte. Ons kan ons eie prosedures ontwikkel bloot deur 'n paar vars dele te bou en 'n paar bestaandes te kombineer.
Lys van modelle ingesluit in MMDetection
MMDetection bied top-notch kodebasisse vir verskeie bekende modelle en taak-georiënteerde modules. Die modelle wat voorheen gemaak is en aanpasbare metodes wat met die MMDetection-nutsdingskis gebruik kan word, word hieronder gelys. Die lys groei steeds namate meer modelle en metodes bygevoeg word.
- Vinnige R-CNN
- Vinniger R-CNN
- Masker R-CNN
- RetinaNet
- DCN
- DCNv2
- Cascade R-CNN
- M2Det
- GHM
- ScratchDet
- Dubbelkop R-CNN
- Rooster R-CNN
- FSAF
- Weegskaal R-CNN
- GCNet
- HRNet
- Maskertelling R-CNN
- FCOS
- SSD
- R-FCN
- Gemengde Presisie Opleiding
- Gewigstandaardisering
- Hibriede Taak Cascade
- Begeleide Ankering
- Algemene aandag
Bou voorwerpopsporingsmodel met behulp van MMDetection
In hierdie tutoriaal sal ons die Google-samewerknotaboek wees omdat dit maklik is om op te stel en te gebruik.
installasie
Om alles te installeer wat ons nodig het, sal ons eers die nodige biblioteke installeer en die MMdetection GitHub-projek kloon.
Voer env
Die omgewing vir ons projek sal nou vanaf die bewaarplek ingevoer word.
Invoer van biblioteke en MMdetection
Ons sal nou die vereiste biblioteke invoer, saam met die MMdetection natuurlik.
Laai die vooraf opgeleide kontrolepunte af
Die vooraf-opgeleide modelkontrolepunte van MMdetection moet nou afgelaai word vir verdere aanpassing en afleiding.
Bou model
Ons sal nou die model bou en die kontrolepunte op die datastel toepas.
Lei die detektor af
Noudat die model behoorlik gebou en gelaai is, kom ons kyk hoe uitstekend dit is. Ons gebruik MMDetection se hoëvlak API-inferensiedetektor. Hierdie API is ontwerp om die afleidingsproses makliker te maak.
Gevolg
Kom ons kyk na die resultate.
Gevolgtrekking
Ten slotte, die MMDetection-nutsdingskas vaar beter as onlangs vrygestelde kodebasisse soos SimpleDet, Detectron en Maskrcnn-benchmark. Met 'n groot modelversameling,
MMDetection is nou die nuutste tegnologie. MMDetection presteer beter as alle ander kodebasisse in terme van doeltreffendheid en werkverrigting.
Een van die lekkerste dinge van MMdetection is dat jy nou net na 'n ander konfigurasielêer kan wys, 'n ander kontrolepunt kan aflaai en dieselfde kode kan laat loop as jy die modelle wil verander.
Ek raai aan om na hulle te kyk instruksies as jy probleme ondervind met enige van die stadiums of wil sommige daarvan anders uitvoer.
Lewer Kommentaar