Cuprins[Ascunde][Spectacol]
Una dintre cele mai simple, dar cele mai interesante idei din învățarea profundă este detectarea obiectelor. Ideea fundamentală este de a împărți fiecare articol în clase succesive care reprezintă trăsături comparabile și apoi de a desena o casetă în jurul lui.
Aceste caracteristici distinctive pot fi la fel de simple ca forma sau culoarea, ceea ce ajută la capacitatea noastră de a le clasifica.
Aplicatiile de Detectarea obiectelor sunt utilizate pe scară largă în științe medicale, conducere autonomă, apărare și armată, administrație publică și multe alte domenii, datorită îmbunătățirilor substanțiale în vederea computerizată și procesarea imaginilor.
Aici avem MMDetection, un fantastic set de instrumente open-source de detectare a obiectelor construit pe Pytorch. În acest articol, vom examina în detaliu MMDetection, vom discuta cu el, vom discuta despre caracteristicile sale și multe altele.
Ce este MMDetection?
MMDetection Toolbox a fost creat ca bază de cod Python special pentru problemele care implică identificarea obiectelor și segmentarea instanțelor.
Este folosită implementarea PyTorch și este creată într-o manieră modulară. Pentru recunoașterea obiectelor și segmentarea instanțelor, o gamă largă de modele eficiente a fost compilată într-o varietate de metodologii.
Permite inferențe eficiente și antrenament rapid. Pe de altă parte, setul de instrumente include greutăți pentru peste 200 de rețele pre-antrenate, ceea ce o face o soluție rapidă în domeniul identificării obiectelor.
Cu capacitatea de a adapta tehnicile actuale sau de a crea un detector nou folosind modulele disponibile, MMDetection funcționează ca un punct de referință.
Caracteristica cheie a cutiei de instrumente este includerea sa de piese simple, modulare, dintr-un mod normal detectarea obiectelor cadru care poate fi folosit pentru a crea conducte unice sau modele unice.
Capacitățile de analiză comparativă ale acestui set de instrumente simplifică construirea unui nou cadru de detector pe deasupra unui cadru existent și compararea performanței acestuia.
DESCRIERE
- Cadrele de detectare populare și moderne, cum ar fi Faster RCNN, Mask RCNN, RetinaNet etc., sunt susținute direct de setul de instrumente.
- Utilizarea a peste 360 de modele pre-antrenate pentru reglaj fin (sau antrenament din nou).
- Pentru seturi de date de viziune binecunoscute, inclusiv COCO, Cityscapes, LVIS și PASCAL VOC.
- Pe GPU, toate operațiunile fundamentale bbox și mask sunt executate. Alte baze de cod, cum ar fi Detectron2, maskrcnn-benchmark și SimpleDet, pot fi antrenate la o rată mai rapidă decât sau la egalitate cu aceasta.
- Cercetătorii defalcă detectarea obiectelor cadru în mai multe module, care pot fi apoi combinate pentru a crea un sistem unic de detectare a obiectelor.
Arhitectura MMDetection
MMDetection specifică un design generic care poate fi aplicat oricărui model, deoarece este o cutie de instrumente cu o varietate de modele pre-construite, fiecare dintre ele având propria arhitectură. Următoarele componente alcătuiesc această arhitectură generală:
- Șira spinării: Backbone, cum ar fi un ResNet-50 fără stratul final complet conectat, este componenta care convertește o imagine în hărți de caracteristici.
- Gât: Gâtul este segmentul care leagă coloana vertebrală de capete. Pe hărțile de caracteristici brute ale coloanei vertebrale, efectuează anumite ajustări sau reconfigurari. Feature Pyramid Network este o ilustrație (FPN).
- Cap Dens (AnchorHead/AnchorFreeHead): este componenta care operează pe zone dense ale hărților de caracteristici, cum ar fi AnchorHead și AnchorFreeHead, cum ar fi RPNHead, RetinaHead și FCOSHead.
- RoIExtractor: Cu utilizarea operatorilor asemănători RoIPooling, este secțiunea care extrage caracteristicile RoIwise dintr-o singură sau dintr-o colecție de hărți de caracteristici. Eșantionul SingleRoIExtractor extrage caracteristicile RoI din nivelul de potrivire al piramidelor de caracteristici.
- RoIHead (BBoxHead/MaskHead): Este porțiunea sistemului care utilizează caracteristicile RoI ca intrare și generează predicții specifice sarcinii bazate pe RoI, cum ar fi clasificarea/regresia cu caseta de delimitare și predicția de mască.
Construcția detectoarelor cu o singură treaptă și în două trepte este ilustrată folosind conceptele menționate mai sus. Ne putem dezvolta propriile proceduri pur și simplu construind câteva piese noi și combinând unele existente.
Lista modelelor incluse în MMDetection
MMDetection oferă baze de cod de top pentru mai multe modele binecunoscute și module orientate spre sarcini. Modelele care au fost realizate anterior și metodele adaptabile care pot fi utilizate cu setul de instrumente MMDetection sunt enumerate mai jos. Lista continuă să crească pe măsură ce se adaugă mai multe modele și metode.
- R-CNN rapid
- R-CNN mai rapid
- Mască R-CNN
- RetinaNet
- DCN
- DCNv2
- Cascada R-CNN
- M2Det
- GHM
- ScratchDet
- R-CNN dublu
- Grila R-CNN
- FSAF
- Balanta R-CNN
- GCNet
- HRNet
- Masca de scor R-CNN
- FCOS
- SSD
- R-FCN
- Antrenament mixt de precizie
- Standardizarea greutății
- Cascada de sarcini hibride
- Ancorare ghidată
- Atenție generalizată
Construirea modelului de detectare a obiectelor folosind MMDetection
În acest tutorial, vom fi notebook-ul Google Colab, deoarece este ușor de setat și utilizat.
Instalare
Pentru a instala tot ce avem nevoie, vom instala mai întâi bibliotecile necesare și vom clona proiectul MMdetection GitHub.
Se importă înv
Mediul pentru proiectul nostru va fi acum importat din depozit.
Import de biblioteci și MMdetection
Vom importa acum bibliotecile necesare, împreună cu MMdetection, desigur.
Descărcați punctele de control pre-antrenate
Punctele de control ale modelului pre-antrenate de la MMdetection ar trebui acum să fie descărcate pentru ajustări și inferențe ulterioare.
Model de clădire
Acum vom construi modelul și vom aplica punctele de control la setul de date.
Deducerea detectorului
Acum că modelul a fost construit și încărcat corespunzător, să verificăm cât de excelent este. Utilizăm detectorul de inferență API de nivel înalt al MMDetection. Acest API a fost conceput pentru a facilita procesul de inferență.
Rezultat
Să ne uităm la rezultate.
Concluzie
În concluzie, setul de instrumente MMDetection depășește bazele de cod lansate recent, cum ar fi SimpleDet, Detectron și Maskrcnn-benchmark. Cu o colecție mare de modele,
MMDetection este acum o tehnologie de ultimă generație. MMDetection depășește toate celelalte baze de cod în ceea ce privește eficiența și performanța.
Unul dintre cele mai frumoase lucruri despre MMdetection este că acum puteți doar să indicați un alt fișier de configurare, să descărcați un alt punct de control și să rulați același cod dacă doriți să schimbați modelele.
Sfatuiesc sa te uiti la ei instrucțiuni dacă întâmpinați probleme cu oricare dintre etape sau doriți să efectuați unele dintre ele diferit.
Lasă un comentariu