Table di cuntinutu[Piattà][Mostra]
Una di l'idee più simplici ma più intriganti in l'apprendimentu prufondu hè a rilevazione di l'ogetti. L'idea fundamentale hè di dividisce ogni articulu in classi successive chì rapprisentanu tratti paragunabili è poi disegnà una casella intornu.
Queste caratteristiche distintive ponu esse simplicità cum'è forma o culore, chì aiuta à a nostra capacità di categurizà.
L'applicazioni di Rilevamentu d'ughjettu sò largamente impiegati in scienze mediche, guida autonoma, difesa è militare, amministrazione publica, è parechji altri campi grazia à i migliuramentu sustanziali in Visione Informatica è Trattamentu di l'Image.
Quì avemu MMDetection, un fantastico set di strumenti di rilevazione di oggetti open-source custruitu nantu à Pytorch. In questu articulu, esamineremu MMDetection in detail, andemu in manu, discutemu di e so caratteristiche, è assai di più.
Chì ghjè Rilevazione MMD?
lu Rilevazione MMD Toolbox hè stata creata cum'è una basa di codice Python specificamente per i prublemi chì implicanu l'identificazione di l'ughjettu è a segmentazione di l'istanza.
L'implementazione PyTorch hè aduprata, è hè creata in modu modulare. Per a ricunniscenza di l'ughjettu è a segmentazione di l'istanze, una larga gamma di mudelli efficaci hè stata cumpilata in una varietà di metodulugia.
Permette inferenza efficace è furmazione rapida. Per d 'altra banda, a casella di l'uttellu include pesi per più di 200 reti pre-furmati, facendu una correzione rapida in u campu di identificazione di l'ughjettu.
Cù a capacità di adattà e tecniche attuali o di creà un novu detector utilizendu i moduli dispunibili, MMDetection funziona cum'è un benchmark.
A funzione chjave di a casella di l'uttellu hè a so inclusione di parti simplici è modulari da un normale rilevazione d'ogetti quadru chì pò esse usatu per creà pipelines unichi o mudelli unichi.
E capacità di benchmarking di stu toolkit facenu simplice di custruisce un novu framework di detector in cima à un framework esistente è paragunà u so rendiment.
Features
- I quadri di rilevazione populari è muderni, cum'è Faster RCNN, Mask RCNN, RetinaNet, etc., sò direttamente supportati da u toolkit.
- Utilizazione di 360+ mudelli pre-addestrati per a sintonizazione fine (o furmazione di novu).
- Per i datasets di visione cunnisciuti cumpresi COCO, Cityscapes, LVIS è PASCAL VOC.
- Nant'à i GPU, tutte e operazioni fundamentali di bbox è maschera sò eseguite. L'altri codebases, cum'è Detectron2, maskrcnn-benchmark, è SimpleDet, ponu esse furmatu à un ritmu più veloce o à parità cù questu.
- I ricercatori sfondanu u rilevazione d'ogetti quadru in parechji moduli, chì ponu esse cumminati per creà un sistema unicu di rilevazione di l'ughjettu.
Architettura di MMDetection
MMDetection specifica un disignu genericu chì pò esse appiicatu à qualsiasi mudellu postu chì hè una cassetta d'uttellu cù una varietà di mudelli pre-custruiti, ognunu hà a so propria architettura. I seguenti cumpunenti custituiscenu sta architettura generale:
- Backbone: Backbone, cum'è un ResNet-50 senza a capa finale cumplettamente cunnessa, hè u cumpunente chì cunverte una maghjina in mape di funziunalità.
- Neck: U collu hè u segmentu chì cunnetta a spina à i capi. Nant'à e carte di caratteristiche prima di a spina dorsale, faci certi aghjustamenti o ricunfigurazioni. Feature Pyramid Network hè una illustrazione (FPN).
- Capu densu (AnchorHead/AnchorFreeHead): Hè u cumpunente chì opera nantu à zoni densi di carte di caratteristiche, cum'è AnchorHead è AnchorFreeHead, cum'è RPNHead, RetinaHead è FCOSHead.
- RoIExtractor: Cù l'usu di l'operatori simili à RoIPooling, hè a sezione chì tira e funzioni RoIwise da una sola o una cullizzioni di mape di funziunalità. L'esempiu di SingleRoIExtractor estrae e caratteristiche RoI da u livellu currispundente di e piramidi di caratteristiche.
- RoIHead (BBoxHead/MaskHead): Hè a parte di u sistema chì usa e caratteristiche RoI cum'è input è genera predizioni specifiche per u compitu basatu in RoI, cum'è a classificazione / regressione di scatula di delimitazione è a prediczione di maschera.
A custruzzione di detectori di una sola è di dui stadi hè illustrata cù i cuncetti sopra citati. Pudemu sviluppà i nostri prucedure simpliciamente custruendu uni pochi di pezzi freschi è cumminendu alcuni esistenti.
Lista di mudelli inclusi in MMDetection
MMDetection furnisce codebase di prima qualità per parechji mudelli famosi è moduli orientati à u travagliu. I mudelli chì sò stati fatti prima è i metudi adattabili chì ponu esse utilizati cù u toolbox MMDetection sò elencati quì sottu. A lista cuntinueghja à cresce cum'è più mudelli è metudi sò aghjuntu.
- R-CNN veloce
- R-CNN più veloce
- Maschera R-CNN
- RetinaNet
- DCN
- DCNv2
- Cascade R-CNN
- M2 Det
- GHM
- ScratchDet
- R-CNN a doppia testa
- Griglia R-CNN
- FSAF
- Libra R-CNN
- GCNet
- HRNet
- Mask Scoring R-CNN
- FCOS
- SSD
- R-FCN
- Formazione di precisione mista
- Standardizazione di pesu
- Cascata di Task Hybrid
- Ancoraggio guidato
- Attenzione generalizata
Custruì un mudellu di rilevazione di l'ughjettu cù MMDetection
In questu tutoriale, seremu u cuaderno di Google collab perchè hè faciule da stallà è aduprà.
stallanu
Per installà tuttu ciò chì avemu bisognu, prima stallate e librerie necessarie è clone u prughjettu MMdetection GitHub.
Importazione di l'env
L'ambiente per u nostru prughjettu serà avà impurtatu da u repository.
Importazione di librerie è MMdetection
Avemu avà impurtà e biblioteche richieste, cù u MMdetection di sicuru.
Scaricate i punti di cuntrollu pre-addestrati
I punti di cuntrollu di mudelli pre-addestrati da MMdetection devenu avà esse scaricati per più aghjustamenti è inferenza.
Modellu di custruzzione
Custruiremu avà u mudellu è applicà i punti di cuntrollu à u dataset.
Inferisce u detector
Avà chì u mudellu hè statu custruitu bè è carricu, andemu à verificà quantu hè eccellente. Utilizemu u detector di inferenza API d'altu livellu di MMDetection. Questa API hè stata cuncepita per fà u prucessu di inferenza più faciule.
Result
Fighjemu un ochju à i risultati.
cunchiusioni
In cunclusione, a casella di strumenti MMDetection supera i codici di basa di codice liberati recentemente cum'è SimpleDet, Detectron è Maskrcnn-benchmark. Cù una grande cullizzioni di mudelli,
MMDetection hè avà tecnulugia di punta. MMDetection supera tutte l'altri codebases in termini di efficienza è prestazione.
Una di e cose più belle di MMdetection hè chì pudete avà solu indicà un schedariu di cunfigurazione diversu, scaricate un puntu di cuntrollu diversu è eseguite u listessu codice se vulete cambià i mudelli.
I cunsigliu di guardà i so abituali s'è vo curriri in prublemi cù una di e tappe o vulete rializà alcune di elli in modu diversu.
Lascia un Audiolibro