Inhaltsverzeechnes[Verstoppen][Show]
Eng vun den einfachsten awer meeschten interessantsten Iddien am Deep Learning ass Objekterkennung. Déi fundamental Iddi ass all Element an successive Klassen opzedeelen, déi vergläichbar Eegeschafte duerstellen an dann eng Këscht ronderëm ze zéien.
Dës z'ënnerscheedde Charakteristiken kënnen esou einfach wéi Form oder Faarf sinn, wat hëlleft eis Fäegkeet fir se ze kategoriséieren.
D'Applikatiounen vun Objektdetektioun si wäit an de medizinesche Wëssenschaften beschäftegt, autonom Fuere, Verteidegung a Militär, ëffentlech Verwaltung, a vill aner Felder dank wesentlech Verbesserungen an der Computer Visioun a Bildveraarbechtung.
Hei hu mir MMDetection, e fantastesche Open-Source Objekterkennungstoolset op Pytorch gebaut. An dësem Artikel wäerte mir d'MMDetection am Detail ënnersichen, praktesch domat goen, seng Features diskutéieren a vill méi.
Wat ass MMDetektioun?
d' MMDetektioun Toolbox gouf als Python Codebase speziell fir Probleemer mat Objektidentifikatioun an Instanzsegmentatioun erstallt.
D'PyTorch Implementatioun gëtt benotzt, an et gëtt op eng modulär Manéier erstallt. Fir Objekterkennung an Instanzsegmentéierung ass eng breet Palette vun effektive Modeller a verschidde Methodologien zesummegesat ginn.
Et erlaabt effektiv Inferenz a séier Training. Op der anerer Säit enthält d'Toolbox Gewiichter fir iwwer 200 pre-trainéiert Netzwierker, wat et e schnelle Fix am Objektidentifikatiounsfeld mécht.
Mat der Fäegkeet fir déi aktuell Techniken unzepassen oder en neien Detektor mat de verfügbare Moduler ze kreéieren, funktionnéiert MMDetection als Benchmark.
D'Schlëssel Feature vun der Toolbox ass seng Inklusioun vun einfachen, modulare Deeler vun engem normalen Objet Detektioun Kader déi benotzt ka ginn fir eenzegaarteg Pipelines oder eenzegaarteg Modeller ze kreéieren.
D'Benchmarkingfäegkeeten vun dësem Toolkit maachen et einfach en neien Detektorkader uewen op engem existente Kader ze bauen a seng Leeschtung ze vergläichen.
Eegeschaften
- Populär a modern Detektiounskader, wéi Faster RCNN, Mask RCNN, RetinaNet, etc., ginn direkt vum Toolkit ënnerstëtzt.
- Benotzt vun 360+ pre-trainéiert Modeller fir Feintuning (oder Training nei).
- Fir bekannte Visiounsdatesätz abegraff COCO, Cityscapes, LVIS, a PASCAL VOC.
- Op GPUs ginn all fundamental bbox a Mask Operatiounen ausgefouert. Aner Codebasen, wéi Detectron2, maskrcnn-Benchmark, an SimpleDet, kënne mat engem méi séieren Taux trainéiert ginn wéi oder par par mat dësem.
- Fuerscher zerbriechen d' Objet Detektioun Kader a verschidde Moduler, déi dann kombinéiert kënne ginn fir en eenzegaartegen Objekterkennungssystem ze kreéieren.
MMDetection Architecture
MMDetection spezifizéiert e generesche Design deen op all Modell applizéiert ka ginn well et eng Toolbox ass mat enger Vielfalt vu virgebaute Modeller, déi jidderee seng eege Architektur huet. Déi folgend Komponente maachen dës Gesamtarchitektur aus:
- Réckrad: Backbone, wéi e ResNet-50 ouni déi lescht komplett verbonne Schicht, ass de Komponent deen e Bild op Feature Kaarten konvertéiert.
- Hals: Den Hals ass de Segment deen de Réckgrat mat de Käpp verbënnt. Op de roude Feature Kaarten vum Réckgrat mécht et gewësse Upassungen oder Rekonfiguratiounen. Feature Pyramid Network ass eng Illustratioun (FPN).
- DenseHead (AnchorHead / AnchorFreeHead): Et ass de Komponent deen op dichte Beräicher vu Featurekaarten funktionnéiert, wéi AnchorHead an AnchorFreeHead, wéi RPNHead, RetinaHead, an FCOSHead.
- RoIextractor: Mat der Notzung vu RoIPooling-ähnlechen Betreiber ass et d'Sektioun déi RoIwise Features vun enger eenzeger oder enger Sammlung vu Featurekaarten zitt. D'SingleRoIExtractor Probe extrahéiert RoI Features aus dem passenden Niveau vun Feature Pyramiden.
- RoIHead (BBoxHead / MaskHead): Et ass den Deel vum System deen RoI Charakteristiken als Input benotzt a RoI-baséiert Aufgab-spezifesch Prognosen generéiert, sou wéi Begrenzungsbox Klassifikatioun / Regressioun a Mask Viraussoen.
D'Konstruktioun vun Een-Stuf- an Zwee-Etapp Detektoren gëtt mat de genannte Konzepter illustréiert. Mir kënnen eis eege Prozeduren einfach entwéckelen andeems mir e puer frësch Deeler bauen an e puer existéierend kombinéieren.
Lëscht vun de Modeller abegraff an MMDetection
MMDetection bitt Top-Notch Codebase fir verschidde bekannte Modeller an Aufgab-orientéiert Moduler. D'Modeller déi virdru gemaach goufen an adaptéierbar Methoden déi mat der MMDetection Toolbox benotzt kënne ginn hei ënnen opgezielt. D'Lëscht wuesse weider wéi méi Modeller a Methoden derbäi ginn.
- Schnell R-CNN
- Méi séier R-CNN
- Mask R-CNN
- Netzhaut
- DCN
- DCNv2
- Kaskade R-CNN
- M2 Det
- GHM
- ScratchDet
- Duebel-Kapp R-CNN
- Gitter R-CNN
- FSAF
- Libra R-CNN
- GCNet
- HRNet
- Mask Punktzuel R-CNN
- FCOS
- natierlech nach
- R-FCN
- Mixed Präzisioun Training
- Gewiicht Standardiséierung
- Hybrid Aufgab Kaskade
- Guided Verankerung
- Generaliséiert Opmierksamkeet
Bauen Objekterkennungsmodell mat MMDetection
An dësem Tutorial wäerte mir de Google Collab Notizbuch sinn well et einfach ass ze setzen an ze benotzen.
Installatioun
Fir alles ze installéieren wat mir brauchen, wäerte mir als éischt déi néideg Bibliothéiken installéieren an de MMdetection GitHub Projet klonen.
Importer env
D'Ëmwelt fir eise Projet gëtt elo aus dem Repository importéiert.
Bibliothéiken importéieren an MMdetection
Mir importéieren elo déi erfuerderlech Bibliothéiken, zesumme mat der MMdetection natierlech.
Luet d'pre-trainéiert Checkpoints erof
Déi viraus trainéiert Modellcheckpunkte vun MMdetection sollen elo erofgeluede ginn fir weider Upassung an Inferenz.
Baumodell
Mir wäerten elo de Modell konstruéieren an d'Kontrollpunkte fir d'Datetaz uwenden.
Inferen den Detektor
Elo datt de Modell richteg konstruéiert a gelueden ass, loosst eis kucken wéi exzellent et ass. Mir benotzen den High-Level API Inference Detector vum MMDetection. Dës API gouf entwéckelt fir den Inferenzprozess méi einfach ze maachen.
Resultat
Loosst eis d'Resultater kucken.
Konklusioun
Als Conclusioun ass d'MMDetection Toolbox besser wéi kierzlech verëffentlecht Codebasen wéi SimpleDet, Detectron, a Maskrcnn-Benchmark. Mat enger grousser Modellkollektioun,
MMDetection ass elo modernste Technologie. MMDetection iwwerhëlt all aner Codebasen a punkto Effizienz a Leeschtung.
Ee vun de schéinste Saachen iwwer MMdetection ass datt Dir elo just op eng aner Konfiguratiounsdatei kënnt weisen, en anere Kontrollpunkt eroflueden an dee selwechte Code lafen wann Dir d'Modeller wëllt änneren.
Ech roden hir ze kucken Instruktiounen wann Dir Problemer mat enger vun den Etappen hutt oder wëllt e puer vun hinnen anescht ausféieren.
Hannerlooss eng Äntwert