Efnisyfirlit[Fela][Sýna]
Ein einfaldasta en samt forvitnileg hugmynd í djúpnámi er hlutgreining. Grundvallarhugmyndin er að skipta hverjum hlut í flokka í röð sem tákna sambærilega eiginleika og teikna síðan kassa utan um það.
Þessi sérkenni geta verið eins einföld og form eða litur, sem hjálpar okkur við að flokka þau.
Umsóknir frá Hlutgreining eru mikið starfandi í læknavísindum, sjálfvirkum akstri, varnarmálum og her, opinberri stjórnsýslu og mörgum öðrum sviðum þökk sé umtalsverðum endurbótum á tölvusjón og myndvinnslu.
Hér höfum við MMDetection, frábært opinn uppspretta hlutgreiningarverkfærasett byggt á Pytorch. Í þessari grein munum við skoða MMDetection í smáatriðum, fara í gegnum hana, ræða eiginleika þess og margt fleira.
Hvað er MMDetection?
The MMDetection verkfærakistan var búin til sem Python kóðagrunnur sérstaklega fyrir vandamál sem snúa að hlutagreiningu og skiptingu tilvika.
PyTorch útfærslan er notuð og hún er búin til á máta hátt. Fyrir hlutgreiningu og skiptingu tilvika hefur fjölbreytt úrval af áhrifaríkum líkönum verið safnað saman í margs konar aðferðafræði.
Það gerir skilvirka ályktun og hraða þjálfun. Á hinn bóginn inniheldur verkfærakassinn lóð fyrir yfir 200 fyrirfram þjálfuð net, sem gerir það að skyndilausn í hlutagreiningarreitnum.
Með getu til að aðlaga núverandi tækni eða búa til nýjan skynjara með því að nota tiltækar einingar, virkar MMDetection sem viðmið.
Lykilatriði verkfærakassans er að innihalda einfalda, máthluta frá venjulegum hlutum hlutgreining ramma sem hægt er að nota til að búa til einstakar leiðslur eða einstök líkön.
Viðmiðunargeta þessa verkfærasetts gerir það einfalt að byggja nýja skynjararamma ofan á núverandi ramma og bera saman frammistöðu hans.
Aðstaða
- Vinsælir og nútímalegir uppgötvunarrammar, eins og Faster RCNN, Mask RCNN, RetinaNet, osfrv., eru beint studd af verkfærakistunni.
- Notkun á 360+ forþjálfuðum gerðum til að fínstilla (eða þjálfa upp á nýtt).
- Fyrir vel þekkt sjóngagnasett, þar á meðal COCO, Cityscapes, LVIS og PASCAL VOC.
- Á GPU eru allar grundvallar bbox og grímuaðgerðir framkvæmdar. Hægt er að þjálfa aðra kóðabasa, eins og Detectron2, maskrcnn-benchmark og SimpleDet, á hraðari hraða en eða á pari við þennan.
- Vísindamenn brjóta niður hlutgreining ramma í nokkrar einingar, sem síðan er hægt að sameina til að búa til einstakt hlutgreiningarkerfi.
MMDetection arkitektúr
MMDetection tilgreinir almenna hönnun sem hægt er að nota á hvaða líkan sem er þar sem það er verkfærakista með ýmsum forsmíðuðum gerðum, sem hvert um sig hefur sinn arkitektúr. Eftirfarandi þættir mynda þennan heildararkitektúr:
- Burðarás: Backbone, eins og ResNet-50 án loka fullkomlega tengda lagsins, er hluti sem breytir mynd í lögun kort.
- Neck: Hálsinn er hluti sem tengir burðarásina við höfuðin. Á hráum eiginleikakortum burðarásarinnar gerir það ákveðnar breytingar eða endurstillingar. Feature Pyramid Network er ein mynd (FPN).
- Þétthaus (AnchorHead/AnchorFreeHead): Það er íhluturinn sem starfar á þéttum svæðum eiginleikakorta, eins og AnchorHead og AnchorFreeHead, eins og RPNHead, RetinaHead og FCOSHead.
- RoIExtractor: Með því að nota RoIPooling-líka rekstraraðila, er það hluti sem dregur RoIwise eiginleika úr einu eða safni eiginleikakorta. SingleRoIExtractor sýnishornið dregur RoI eiginleika út úr samsvarandi stigi lögunarpýramída.
- RoIHead (BBoxHead/MaskHead): Það er sá hluti kerfisins sem notar RoI-eiginleika sem inntak og býr til RoI-undirstaða verkefnasértækar spár, svo sem flokkun/aðhvarf og grímuspá.
Smíði eins þrepa og tveggja þrepa skynjara er sýnd með áðurnefndum hugtökum. Við getum þróað okkar eigin verklagsreglur einfaldlega með því að smíða nokkra ferska hluta og sameina þá sem fyrir eru.
Listi yfir gerðir sem eru með í MMDetection
MMDetection veitir fyrsta flokks kóðabasa fyrir nokkrar vel þekktar gerðir og verkefnamiðaðar einingar. Líkönin sem áður hafa verið gerð og aðlögunaraðferðir sem hægt er að nota með MMDetection verkfærakistunni eru taldar upp hér að neðan. Listinn heldur áfram að stækka eftir því sem fleiri gerðir og aðferðir bætast við.
- Hratt R-CNN
- Hraðari R-CNN
- Gríma R-CNN
- RetinaNet
- DCN
- DCNv2
- Cascade R-CNN
- M2Det
- GHM
- ScratchDet
- Tvíhöfða R-CNN
- Grid R-CNN
- FSAF
- Vog R-CNN
- GCNet
- HRNet
- Grímustig R-CNN
- FCOS
- SSD
- R-FCN
- Blandað nákvæmnisþjálfun
- Þyngdarstöðlun
- Hybrid Task Cascade
- Leiðsögn við akkeri
- Almenn athygli
Byggja upp hlutgreiningarlíkan með því að nota MMDetection
Í þessari kennslu munum við vera Google samstarfsbókin vegna þess að það er auðvelt að stilla hana og nota.
uppsetning
Til að setja upp allt sem við þurfum munum við fyrst setja upp nauðsynleg bókasöfn og klóna MMdetection GitHub verkefnið.
Flytur inn env
Umhverfið fyrir verkefnið okkar verður nú flutt inn úr geymslunni.
Flytja inn bókasöfn og MMdetection
Við munum nú flytja inn nauðsynleg bókasöfn, ásamt MMdetection auðvitað.
Hlaða niður fyrirfram þjálfuðum eftirlitsstöðvum
Nú ætti að hlaða niður forþjálfuðum líkanaeftirlitsstöðvum frá MMdetection til frekari aðlögunar og ályktunar.
Byggingarlíkan
Við munum nú smíða líkanið og nota eftirlitspunktana á gagnasafnið.
Ályktaðu um skynjarann
Nú þegar líkanið hefur verið rétt smíðað og hlaðið, skulum við athuga hversu frábært það er. Við notum há-stigi API ályktunarskynjara MMDetection. Þetta API var hannað til að gera ályktunarferlið auðveldara.
Niðurstaða
Við skulum skoða niðurstöðurnar.
Niðurstaða
Að lokum er MMDetection verkfærakistan betri en nýlega útgefin kóðabasar eins og SimpleDet, Detectron og Maskrcnn-viðmið. Með mikið módelsafn,
MMDetection er nú háþróaða tækni. MMDetection fer fram úr öllum öðrum kóðagrunnum hvað varðar skilvirkni og frammistöðu.
Eitt af því skemmtilegasta við MMdetection er að þú getur nú bara bent á aðra stillingarskrá, hlaðið niður öðrum eftirlitsstað og keyrt sama kóðann ef þú vilt breyta gerðum.
Ég ráðlegg að skoða þeirra leiðbeiningar ef þú lendir í vandræðum með eitthvað af þrepunum eða vilt framkvæma sum þeirra öðruvísi.
Skildu eftir skilaboð