Table of Contents[Ferstopje][Toanje]
Ien fan 'e ienfâldichste, mar meast yntrigearjende ideeën yn djip learen is objektdeteksje. It fûnemintele idee is om elk item te ferdielen yn opienfolgjende klassen dy't fergelykbere eigenskippen fertsjintwurdigje en dan in doaze omhinne tekenje.
Dizze ûnderskiedende skaaimerken kinne sa ienfâldich wêze as foarm of kleur, wat helpt yn ús fermogen om se te kategorisearjen.
De applikaasjes fan Objektdeteksje wurde in soad brûkt yn 'e medyske wittenskippen, autonoom riden, definsje en militêr, iepenbier bestjoer, en in protte oare fjilden, tank oan substansjele ferbetteringen yn Computer Vision en Image Processing.
Hjir hawwe wy MMDetection, in fantastyske arkset foar iepenboarne-objektdeteksje boud op Pytorch. Yn dit artikel sille wy MMDetection yn detail ûndersykje, der mei dwaan, har funksjes besprekke, en folle mear.
Wat is MMDetection?
De MMDetection toolbox is makke as in Python-koadebase spesifyk foar problemen mei objektidentifikaasje en eksimplaarsegmentaasje.
De PyTorch-ymplemintaasje wurdt brûkt, en it is makke op in modulêre manier. Foar objekterkenning en eksimplaarsegmentaasje is in breed oanbod fan effektive modellen gearstald yn in ferskaat oan metodologyen.
It makket effektive konklúzjes en rappe training mooglik. Oan 'e oare kant omfettet de toolbox gewichten foar mear dan 200 foarôf oplaat netwurken, wêrtroch it in flugge oplossing is yn it fjild foar objektidentifikaasje.
Mei de mooglikheid om de hjoeddeistige techniken oan te passen of in nije detektor te meitsjen mei de beskikbere modules, fungearret MMDetection as benchmark.
De kaaifunksje fan 'e toolbox is it opnimmen fan rjochtlinige, modulêre dielen fan in normale objektdeteksje ramt dat kin wurde brûkt om unike pipelines as unike modellen te meitsjen.
De benchmarkingmooglikheden fan dizze toolkit meitsje it ienfâldich om in nij detektorkader te bouwen boppe op in besteand ramt en de prestaasjes te fergelykjen.
Features
- Populêre en moderne deteksjekaders, lykas Faster RCNN, Mask RCNN, RetinaNet, ensfh., wurde direkt stipe troch de toolkit.
- Gebrûk fan 360+ pre-trained modellen foar fine-tuning (as training op 'e nij).
- Foar bekende fyzje datasets ynklusyf COCO, Cityscapes, LVIS, en PASCAL VOC.
- Op GPU's wurde alle fûnemintele bbox- en maskeroperaasjes útfierd. Oare codebases, lykas Detectron2, maskrcnn-benchmark, en SimpleDet, kinne wurde trainearre op in flugger taryf dan of op par mei dizze.
- Undersikers brekke de objektdeteksje ramt yn ferskate modules, dy't dan kinne wurde kombineare om in unyk objektdeteksjesysteem te meitsjen.
MMDetection Architecture
MMDetection spesifisearret in generysk ûntwerp dat kin wurde tapast op elk model, om't it in ark is mei in ferskaat oan foarboude modellen, dy't elk in eigen arsjitektuer hat. De folgjende komponinten meitsje dizze algemiene arsjitektuer út:
- Rêchbonke: Backbone, lykas in ResNet-50 sûnder de lêste folslein ferbûne laach, is de komponint dy't in ôfbylding konvertearret nei funksjekaarten.
- Nekke: De nekke is it segmint dat de rêchbonke mei de koppen ferbynt. Op de rauwe funksjekaarten fan 'e rêchbonke docht it bepaalde oanpassingen as rekonfiguraasjes. Feature Pyramid Network is ien yllustraasje (FPN).
- DenseHead (AnchorHead / AnchorFreeHead): It is de komponint dy't wurket op tichte gebieten fan funksjekaarten, lykas AnchorHead en AnchorFreeHead, lykas RPNHead, RetinaHead en FCOSHead.
- RoIExtractor: Mei it brûken fan RoIPooling-like operators is it de seksje dy't RoIwise-funksjes lûkt fan ien of in kolleksje fan funksjekaarten. De SingleRoIExtractor-monster ekstrakt RoI-funksjes út it oerienkommende nivo fan funksjepiramiden.
- RoIHead (BBoxHead / MaskHead): It is it diel fan it systeem dat RoI skaaimerken brûkt as in ynfier en generearret RoI-basearre taak-spesifike foarsizzings, lykas bounding box klassifikaasje / regression en masker foarsizzing.
De konstruksje fan ien- en twa-poadium detectors wurdt yllustrearre mei de hjirboppe neamde konsepten. Wy kinne ús eigen prosedueres gewoan ûntwikkelje troch in pear frisse dielen te bouwen en guon besteande te kombinearjen.
List fan modellen opnommen yn MMDetection
MMDetection jout top-notch codebases foar ferskate bekende modellen en taak-rjochte modules. De modellen dy't earder binne makke en oanpasbere metoaden dy't kinne wurde brûkt mei de MMDetection-arkbox wurde hjirûnder neamd. De list bliuwt groeie as mear modellen en metoaden wurde tafoege.
- Snelle R-CNN
- Sneller R-CNN
- Masker R-CNN
- RetinaNet
- DCN
- DCNv2
- Cascade R-CNN
- M2Det
- GHM
- ScratchDet
- Double-Head R-CNN
- Grid R-CNN
- FSAF
- Libra R-CNN
- GCNet
- HRNet
- Masker skoare R-CNN
- FCOS
- SSD
- R-FCN
- Mixed Precision Training
- Gewicht Standerdisearring
- Hybride Task Cascade
- Begeliede Anchoring
- Algemien omtinken
Bouwe objektdeteksjemodel mei MMDetection
Yn dit tutorial sille wy it Google-kollab-notebook wêze, om't it maklik is yn te stellen en te brûken.
Ynstallaasje
Om alles te ynstallearjen wat wy nedich binne, sille wy earst de nedige biblioteken ynstallearje en it MMdetection GitHub-projekt klonje.
Ymportearje env
De omjouwing foar ús projekt sil no wurde ymportearre út de repository.
It ymportearjen fan biblioteken en MMdetection
Wy sille no de fereaske biblioteken ymportearje, tegearre mei de MMdetection fansels.
Download de pre-trained checkpoints
De pre-trained modelkontrôlepunten fan MMdetection moatte no wurde downloade foar fierdere oanpassing en konklúzje.
Bouwmodel
Wy sille no it model konstruearje en de kontrôlepunten tapasse op de dataset.
Ferklearje de detektor
No't it model goed konstruearre en laden is, litte wy kontrolearje hoe poerbêst it is. Wy brûke MMDetection's API-ynferensdetektor op hege nivo. Dizze API is ûntworpen om it konklúzjeproses makliker te meitsjen.
Resultaat
Litte wy nei de resultaten sjen.
Konklúzje
As konklúzje presteart de MMDetection-arkbox better as koartlyn útbrochte koadebases lykas SimpleDet, Detectron, en Maskrcnn-benchmark. Mei in grutte modelkolleksje,
MMDetection is no state-of-the-art technology. MMDetection prestearret alle oare codebases yn termen fan effisjinsje en prestaasjes.
Ien fan 'e moaiste dingen oer MMdetection is dat jo no gewoan kinne wize op in oar konfiguraasjebestân, in oar kontrôlepunt downloade, en deselde koade útfiere as jo de modellen feroarje wolle.
Ik advisearje sjen nei harren ynstruksjes as jo problemen hawwe mei ien fan 'e stadia of wolle guon fan har oars útfiere.
Leave a Reply