Enhavtabelo[Kaŝi][Montri]
Unu el la plej simplaj ankoraŭ plej interesaj ideoj en profunda lernado estas objektodetekto. La fundamenta ideo estas dividi ĉiun objekton en sinsekvajn klasojn kiuj reprezentas kompareblajn trajtojn kaj poste desegni skatolon ĉirkaŭ ĝi.
Ĉi tiuj distingaj trajtoj povas esti tiel simplaj kiel formo aŭ koloro, kio helpas en nia kapablo kategoriigi ilin.
La aplikoj de Detekta Objekto estas vaste dungitaj en la medicinaj sciencoj, aŭtonoma veturado, defendo kaj militistaro, publika administrado, kaj multaj aliaj kampoj danke al grandaj plibonigoj en Komputila Vizio kaj Bilda Pretigo.
Ĉi tie ni havas MMDetection, mirindan malfermfontan objektan detektan ilaron konstruitan sur Pytorch. En ĉi tiu artikolo, ni ekzamenos MMDetection detale, traktos ĝin, diskutos ĝiajn funkciojn kaj multe pli.
Kio estas MMDekto?
la MMDekto ilarkesto estis kreita kiel Python-kodbazo specife por problemoj implikantaj objektoidentigon kaj kazosegmentadon.
La efektivigo de PyTorch estas uzata, kaj ĝi estas kreita en modula modo. Por objektorekono kaj ekzemplersegmentado, larĝa gamo de efikaj modeloj estis kompilita en gamon da metodaroj.
Ĝi permesas efikan inferencon kaj rapidan trejnadon. Aliflanke, la ilarkesto inkluzivas pezojn por pli ol 200 antaŭtrejnitaj retoj, igante ĝin rapida solvo en la objekto-identigkampo.
Kun la kapablo adapti la nunajn teknikojn aŭ krei novan detektilon uzante la disponeblajn modulojn, MMDetection funkcias kiel komparnormo.
La ŝlosila trajto de la ilarkesto estas ĝia inkludo de simplaj, modulaj partoj de normalo detekto de objektoj kadro kiu povas esti uzata por krei unikajn duktoj aŭ unikajn modelojn.
La benchmarking-kapabloj de ĉi tiu ilaro faciligas konstrui novan detektilkadron aldone al ekzistanta kadro kaj kompari ĝian efikecon.
Trajtoj
- Popularaj kaj modernaj detektkadroj, kiel Faster RCNN, Mask RCNN, RetinaNet, ktp., estas rekte subtenataj de la ilaro.
- Uzo de 360+ antaŭtrejnitaj modeloj por fajnagordi (aŭ trejni denove).
- Por bonkonataj viziaj datenoj inkluzive de COCO, Urbaj pejzaĝoj, LVIS kaj PASCAL VOC.
- Sur GPU-oj, ĉiuj fundamentaj bbox kaj maskaj operacioj estas efektivigitaj. Aliaj kodbazoj, kiel ekzemple Detectron2, maskrcnn-benchmark, kaj SimpleDet, povas esti trejnitaj kun pli rapida rapideco ol aŭ egale kun ĉi tiu.
- Esploristoj malkonstruas la detekto de objektoj kadro en plurajn modulojn, kiuj tiam povas esti kombinitaj por krei unikan objektodetektosistemon.
MMDetection Arkitekturo
MMDetection precizigas senmarkan dezajnon kiu povas esti aplikita al iu modelo ĉar ĝi estas ilarkesto kun gamo da antaŭkonstruitaj modeloj, ĉiu el kiuj havas sian propran arkitekturon. La sekvaj komponentoj konsistigas tiun totalan arkitekturon:
- spinon: Backbone, kiel ekzemple ResNet-50 sen la fina plene ligita tavolo, estas la komponento kiu konvertas bildon al trajtomapoj.
- kolon: La kolo estas la segmento, kiu ligas la spinon al la kapoj. Sur la krudaj trajtomapoj de la spino, ĝi faras iujn alĝustigojn aŭ reagordojn. Feature Pyramid Network estas unu ilustraĵo (FPN).
- Densa Kapo (AnchorHead/AnchorFreeHead): Ĝi estas la komponento kiu funkciigas sur densaj areoj de trajtomapoj, kiel ekzemple AnchorHead kaj AnchorFreeHead, kiel ekzemple RPNHead, RetinaHead, kaj FCOSHead.
- RoIEextractor: Kun la uzo de RoIPooling-similaj funkciigistoj, estas la sekcio kiu tiras RoIwise-ecojn de unuopa aŭ kolekto de trajtomapoj. La specimeno SingleRoIExtractor ĉerpas RoI-ecojn de la kongrua nivelo de trajtopiramidoj.
- RoIHead (BBoxHead/MaskHead): Ĝi estas la parto de la sistemo kiu utiligas RoI-karakterizaĵojn kiel enigaĵon kaj generas RoI-bazitajn task-specifajn prognozojn, kiel ekzemple limkestoklasifiko/regreso kaj maskprognozo.
La konstruado de unufazaj kaj dufazaj detektiloj estas ilustrita uzante la menciitajn konceptojn. Ni povas evoluigi niajn proprajn procedurojn simple konstruante kelkajn freŝajn partojn kaj kombinante kelkajn ekzistantajn.
Listo de modeloj inkluditaj en MMDetection
MMDetection disponigas altnivelajn kodbazojn por pluraj konataj modeloj kaj task-orientitaj moduloj. La modeloj kiuj antaŭe estis faritaj kaj adapteblaj metodoj kiuj povas esti utiligitaj kun la ilarkesto MMDetection estas listigitaj malsupre. La listo daŭre kreskas dum pliaj modeloj kaj metodoj estas aldonitaj.
- Rapida R-CNN
- Pli rapida R-CNN
- Masko R-CNN
- RetinaNet
- DCN
- DCNv2
- Kaskado R-CNN
- M2Det
- GHM
- ScratchDet
- Duobla kapo R-CNN
- Krado R-CNN
- FSAF
- Pesilo R-CNN
- GCNet
- HRNet
- Masko-Poentado R-CNN
- FCOS
- SSD
- R-FCN
- Miksita Preciza Trejnado
- Normigado de pezo
- Hibrida Taska Kaskado
- Gvidita Ankrado
- Ĝeneraligita Atento
Konstruanta objektodetektomodelon uzante MMDetection
En ĉi tiu lernilo, ni estos la Guglo-kunlabora kajero ĉar ĝi estas facile agordi kaj uzi.
instalado
Por instali ĉion, kion ni bezonas, ni unue instalos la necesajn bibliotekojn kaj klonos la projekton MMdetection GitHub.
Importado de env
La medio por nia projekto nun estos importita el la deponejo.
Importi bibliotekojn kaj MMdetection
Ni nun importos la postulatajn bibliotekojn, kune kun la MMdetection kompreneble.
Elŝutu la antaŭtrejnitajn transirejojn
La antaŭtrejnitaj modelaj transirejoj de MMdetection nun devus esti elŝutitaj por plia alĝustigo kaj inferenco.
Konstrua modelo
Ni nun konstruos la modelon kaj aplikos la kontrolpunktojn al la datumaro.
Inferenco la detektilo
Nun kiam la modelo estis ĝuste konstruita kaj ŝarĝita, ni kontrolu kiom bonega ĝi estas. Ni uzas la altnivelan API-inferdetektilon de MMDetection. Ĉi tiu API estis desegnita por faciligi la konkludan procezon.
rezulto
Ni rigardu la rezultojn.
konkludo
Konklude, la ilarkesto de MMDetection superas lastatempe liberigitajn kodbazojn kiel SimpleDet, Detectron kaj Maskrcnn-referenco. Kun granda modelkolekto,
MMDetection nun estas pintnivela teknologio. MMDetection superas ĉiujn aliajn kodbazojn laŭ efikeco kaj efikeco.
Unu el la plej belaj aferoj pri MMdetection estas, ke vi nun povas simple montri alian agordan dosieron, elŝuti malsaman kontrolpunkton kaj ruli la saman kodon se vi volas ŝanĝi la modelojn.
Mi konsilas rigardi ilian instrukcioj se vi renkontas problemojn kun iu el la etapoj aŭ volas efektivigi kelkajn el ili alimaniere.
Lasi Respondon