Kutia e veglave MMdetection për zbulimin e objekteve

Përmbajtje[Fshih][Shfaqje]

Çfarë është MMDection?
karakteristika
Arkitektura MMDetection
Lista e modeleve të përfshira në MMDetection
Ndërtimi i modelit të zbulimit të objekteve duke përdorur MMDetection +-
Përfundim

Një nga idetë më të thjeshta por më intriguese në mësimin e thellë është zbulimi i objekteve. Ideja themelore është të ndahet çdo artikull në klasa të njëpasnjëshme që përfaqësojnë tipare të krahasueshme dhe më pas të vizatohet një kuti rreth tij.

Këto karakteristika dalluese mund të jenë aq të thjeshta sa forma ose ngjyra, gjë që ndihmon në aftësinë tonë për t'i kategorizuar ato.

Aplikimet e Zbulimi i objekteve janë përdorur gjerësisht në shkencat mjekësore, ngarje autonome, mbrojtje dhe ushtri, administratë publike dhe shumë fusha të tjera falë përmirësimeve thelbësore në Vizionin Kompjuterik dhe Përpunimin e Imazheve.

Këtu kemi MMDetection, një grup mjetesh fantastike për zbulimin e objekteve me burim të hapur të ndërtuar në Pytorch. Në këtë artikull, ne do të shqyrtojmë në detaje MMDetection, do të vazhdojmë me të, do të diskutojmë veçoritë e tij dhe shumë më tepër.

Çfarë është Zbulimi MMD?

La Zbulimi MMD kutia e veglave u krijua si një bazë kodesh Python posaçërisht për problemet që përfshijnë identifikimin e objekteve dhe segmentimin e shembullit.

Përdoret zbatimi PyTorch dhe është krijuar në mënyrë modulare. Për njohjen e objekteve dhe segmentimin e shembullit, një gamë e gjerë modelesh efektive është përpiluar në një sërë metodologjish.

Zbulimi MMD

Ai lejon një përfundim efektiv dhe trajnim të shpejtë. Nga ana tjetër, kutia e veglave përfshin pesha për mbi 200 rrjete të trajnuara paraprakisht, duke e bërë atë një rregullim të shpejtë në fushën e identifikimit të objektit.

Me aftësinë për të përshtatur teknikat aktuale ose për të krijuar një detektor të ri duke përdorur modulet e disponueshme, MMDetection funksionon si pikë referimi.

Karakteristika kryesore e kutisë së veglave është përfshirja e pjesëve të drejtpërdrejta, modulare nga ato normale zbulimi i objektit kornizë që mund të përdoret për të krijuar tubacione unike ose modele unike.

Aftësitë e krahasimit të kësaj pakete veglash e bëjnë të thjeshtë ndërtimin e një kornize të re detektori në krye të një kornize ekzistuese dhe krahasimin e performancës së tij.

karakteristika

Kornizat e njohura dhe moderne të zbulimit, të tilla si RCNN i shpejtë, RCNN i maskuar, RetinaNet, etj., mbështeten drejtpërdrejt nga paketa e veglave.
Përdorimi i 360+ modeleve të trajnuar paraprakisht për rregullim të imët (ose trajnim të ri).
Për grupe të dhënash të njohura të vizionit, duke përfshirë COCO, Cityscapes, LVIS dhe PASCAL VOC.
Në GPU, të gjitha operacionet themelore të bbox dhe maskë ekzekutohen. Bazat e tjera të kodeve, si Detectron2, maskrcnn-benchmark dhe SimpleDet, mund të trajnohen me një ritëm më të shpejtë se ose në të njëjtin nivel me këtë.
Studiuesit zbërthejnë zbulimi i objektit kornizë në disa module, të cilat më pas mund të kombinohen për të krijuar një sistem unik të zbulimit të objekteve.

Arkitektura MMDetection

MMDetection specifikon një dizajn të përgjithshëm që mund të aplikohet për çdo model pasi është një kuti veglash me një shumëllojshmëri modelesh të para-ndërtuara, secila prej të cilave ka arkitekturën e vet. Komponentët e mëposhtëm përbëjnë këtë arkitekturë të përgjithshme:

Shtylla kurrizore: Backbone, si një ResNet-50 pa shtresën përfundimtare të lidhur plotësisht, është komponenti që konverton një imazh në harta të veçorive.
qafë: Qafa është segmenti që lidh shtyllën kurrizore me kokat. Në hartat e veçorive të papërpunuara të shtyllës kurrizore, ai bën disa rregullime ose rikonfigurime. Rrjeti i Piramidës së Veçorisë është një ilustrim (FPN).
Kokë e dendur (AnchorHead/AnchorFreeHead): Është komponenti që operon në zona të dendura të hartave të veçorive, si AnchorHead dhe AnchorFreeHead, si RPNHead, RetinaHead dhe FCOSHead.
RoIExtractor: Me përdorimin e operatorëve të ngjashëm me RoIPooling, është seksioni që tërheq veçoritë RoIwise nga një e vetme ose një koleksion i hartave të veçorive. Mostra e SingleRoIExtractor nxjerr veçoritë RoI nga niveli përkatës i piramidave të veçorive.
Kryeshefi (BBoxHead/MaskHead): Është pjesa e sistemit që përdor karakteristikat RoI si hyrje dhe gjeneron parashikime specifike të detyrave të bazuara në RoI, të tilla si klasifikimi/regresioni i kutisë kufitare dhe parashikimi i maskës.

Ndërtimi i detektorëve me një dhe dy faza është ilustruar duke përdorur konceptet e lartpërmendura. Ne mund të zhvillojmë procedurat tona thjesht duke ndërtuar disa pjesë të freskëta dhe duke kombinuar disa ato ekzistuese.

Lista e modeleve të përfshira në MMDetection

MMDetection ofron baza kodesh të nivelit më të lartë për disa modele të njohura dhe module të orientuara nga detyra. Modelet që janë bërë më parë dhe metodat e adaptueshme që mund të përdoren me kutinë e veglave MMDetection janë renditur më poshtë. Lista vazhdon të rritet ndërsa shtohen më shumë modele dhe metoda.

R-CNN i shpejtë
R-CNN më i shpejtë
Maska R-CNN
RetinaNet
DCN
DCNv2
Kaskada R-CNN
M2Det
GHM
ScratchDet
R-CNN me dy koka
Rrjeti R-CNN
FSAF
Libra R-CNN
GCNet
HRNet
Rezultati i maskës R-CNN
FCOS
SSD
R-FCN
Trajnim me precizion të përzier
Standardizimi i peshës
Kaskada e detyrave hibride
Ankorimi i drejtuar
Vëmendje e Përgjithshme

Ndërtimi i modelit të zbulimit të objekteve duke përdorur MMDetection

Në këtë tutorial, ne do të jemi fletorja e Google collab sepse është e lehtë për t'u vendosur dhe përdorur.

Instalim

Për të instaluar gjithçka që na nevojitet, fillimisht do të instalojmë bibliotekat e nevojshme dhe do të klonojmë projektin MMdetection GitHub.

instalimet

Env importuese

Mjedisi për projektin tonë tani do të importohet nga depoja.

Importimi i Env 1

Importimi i bibliotekave dhe zbulimi i MM

Tani do të importojmë bibliotekat e kërkuara, së bashku me zbulimin MM natyrisht.

Importimi i Bibliotekave dhe Zbulimi i MM

Shkarkoni pikat e kontrollit të trajnuar paraprakisht

Pikat e kontrollit të modeleve të trajnuara paraprakisht nga MMdetection tani duhet të shkarkohen për rregullime dhe përfundime të mëtejshme.

Shkarkoni pika kontrolli të paratrajnuara

Modeli i ndërtesës

Tani do të ndërtojmë modelin dhe do të aplikojmë pikat e kontrollit në grupin e të dhënave.

Modeli i ndërtimit

Konkludoni detektorin

Tani që modeli është ndërtuar dhe ngarkuar siç duhet, le të kontrollojmë se sa i shkëlqyer është. Ne përdorim detektorin e konkluzionit të nivelit të lartë të API të MMDetection. Ky API u krijua për të bërë më të lehtë procesin e konkluzionit.

Konkluzioni Detektor

Rezultat

Le të hedhim një vështrim në rezultatet.

Kodi i rezultateve

Rezultati Img

Përfundim

Si përfundim, kutia e veglave MMDetection tejkalon bazat e kodeve të lëshuara së fundmi si SimpleDet, Detectron dhe Maskrcnn-benchmark. Me një koleksion të madh modelesh,

MMDection tani është teknologji më e fundit. MMDetection tejkalon të gjitha bazat e tjera të kodeve për sa i përket efikasitetit dhe performancës.

Një nga gjërat më të bukura në lidhje me MMdetection është se tani thjesht mund të tregoni një skedar tjetër konfigurimi, të shkarkoni një pikë kontrolli tjetër dhe të ekzekutoni të njëjtin kod nëse dëshironi të ndryshoni modelet.

Unë ju këshilloj të shikoni ato udhëzime nëse hasni probleme me ndonjë nga fazat ose dëshironi t'i kryeni disa prej tyre ndryshe.

Kutia e veglave MMdetection për zbulimin e objekteve

Çfarë është Zbulimi MMD?

karakteristika

Arkitektura MMDetection

Lista e modeleve të përfshira në MMDetection