Гарчиг[Нуух][Үзүүлэх]
Гүнзгий суралцах хамгийн энгийн хэрнээ хамгийн сонирхолтой санаануудын нэг бол объект илрүүлэх явдал юм. Үндсэн санаа нь зүйл бүрийг харьцуулж болохуйц шинж чанаруудыг харуулсан дараалсан ангиудад хувааж, дараа нь түүнийг тойруулан хайрцаг зурах явдал юм.
Эдгээр ялгах шинж чанарууд нь хэлбэр эсвэл өнгө шиг энгийн байж болох бөгөөд энэ нь тэдгээрийг ангилах чадварыг бидэнд тусалдаг.
-ийн програмууд Объект илрүүлэлт Компьютерийн хараа, дүрс боловсруулалтыг сайжруулсны ачаар анагаах ухаан, бие даасан жолоодлого, батлан хамгаалах, цэрэг, төрийн удирдлага болон бусад олон салбарт өргөнөөр ажиллаж байна.
Энд бид MMDetection, Pytorch дээр бүтээгдсэн нээлттэй эхийн объект илрүүлэх гайхалтай хэрэгсэлтэй. Энэ нийтлэлд бид MMDetection-ийг нарийвчлан судалж, практик дээр ажиллах, түүний онцлог шинж чанарууд болон бусад олон зүйлийг хэлэлцэх болно.
Гэж юу вэ MMDtection?
The MMDtection Toolbox нь объектыг таних болон жишээний сегментчилэлтэй холбоотой асуудлуудад тусгайлан зориулж Python кодын сан болгон бүтээгдсэн.
PyTorch хэрэгжилтийг ашигладаг бөгөөд энэ нь модульчлагдсан загвараар бүтээгдсэн. Объектыг таних, сегментчилэн ангилахын тулд олон төрлийн үр дүнтэй загваруудыг янз бүрийн арга зүйд нэгтгэсэн.
Энэ нь үр дүнтэй дүгнэлт хийх, хурдан сургах боломжийг олгодог. Нөгөөтэйгүүр, багажны хайрцагт урьдчилан бэлтгэгдсэн 200 гаруй сүлжээний жинг багтаасан бөгөөд энэ нь объектыг таних талбарт хурдан засах боломжийг олгодог.
Одоогийн техникийг тохируулах эсвэл боломжтой модулиудыг ашиглан шинэ детектор үүсгэх чадвартай MMDetection нь жишиг болж ажилладаг.
Хэрэгслийн хайрцагны гол онцлог нь ердийнхөөс энгийн, модульчлагдсан хэсгүүдийг багтаасан явдал юм объект илрүүлэх өвөрмөц дамжуулах хоолой эсвэл өвөрмөц загварыг бий болгоход ашиглаж болох хүрээ.
Энэхүү хэрэгслийн жишиг үнэлгээний боломжууд нь одоо байгаа хүрээн дээр шинэ детекторын хүрээг бий болгож, түүний гүйцэтгэлийг харьцуулахад хялбар болгодог.
онцлог
- Faster RCNN, Mask RCNN, RetinaNet гэх мэт түгээмэл бөгөөд орчин үеийн илрүүлэх хүрээг хэрэгсэл нь шууд дэмждэг.
- Урьдчилан бэлтгэгдсэн 360+ загваруудыг нарийн тааруулах (эсвэл дахин сургах) ашиглах.
- COCO, Cityscapes, LVIS, PASCAL VOC зэрэг алдартай харааны мэдээллийн багцад зориулагдсан.
- GPU дээр бүх үндсэн bbox болон маск үйлдлүүд хийгддэг. Detectron2, maskrcnn-benchmark, SimpleDet зэрэг бусад кодын баазыг үүнтэй харьцуулахад илүү хурдан сургах боломжтой.
- Судлаачид задалдаг объект илрүүлэх хүрээг хэд хэдэн модулид нэгтгэж, дараа нь объект илрүүлэх өвөрмөц системийг бий болгож болно.
MMDetection архитектур
MMDetection нь загвар бүр өөрийн гэсэн архитектуртай, урьдчилан бэлтгэсэн олон төрлийн загвар бүхий багажийн хайрцаг тул ямар ч загварт хэрэглэж болох ерөнхий загварыг тодорхойлдог. Дараах бүрэлдэхүүн хэсгүүд нь энэхүү ерөнхий архитектурыг бүрдүүлдэг.
- тулгуур: Сүүлчийн бүрэн холбогдсон давхаргагүй ResNet-50 гэх мэт нуруу нь зургийг газрын зураг болгон хувиргадаг бүрэлдэхүүн хэсэг юм.
- хүзүүндээ: Хүзүү нь нурууг толгойтой холбодог хэсэг юм. Сээр нурууны түүхий онцлог газрын зураг дээр энэ нь тодорхой тохируулга эсвэл дахин тохируулга хийдэг. Онцлог пирамид сүлжээ нь нэг жишээ юм (FPN).
- Өтгөн толгой (AnchorHead/AnchorFreeHead): Энэ нь RPNHead, RetinaHead, FCOHead зэрэг AnchorHead, AnchorFreeHead зэрэг онцлог газрын зургийн нягт хэсгүүдэд ажилладаг бүрэлдэхүүн хэсэг юм.
- RoIEExtractor: RoIPooling-тэй төстэй операторуудыг ашигласнаар энэ нь RoIwise-ийн функцуудыг нэг буюу олон тооны функцүүдийн газрын зургийн цуглуулгаас татаж авдаг хэсэг юм. SingleRoIExtractor дээж нь онцлог пирамидуудын тохирох түвшингээс RoI онцлогуудыг гаргаж авдаг.
- RoIHead (BBoxHead/MaskHead): Энэ нь ROI шинж чанарыг оролт болгон ашигладаг системийн хэсэг бөгөөд хязгаарлах хайрцагны ангилал/регресс, маск таамаглах зэрэг RoI-д суурилсан даалгаварт тусгайлсан таамаглалыг үүсгэдэг.
Нэг үе шаттай ба хоёр үе шаттай детекторын бүтцийг дээр дурдсан ойлголтуудыг ашиглан дүрсэлсэн болно. Бид хэд хэдэн шинэ хэсгүүдийг барьж, одоо байгаа заримыг нь нэгтгэх замаар өөрсдийн процедурыг боловсруулж чадна.
MMDetection-д багтсан загваруудын жагсаалт
MMDetection нь хэд хэдэн алдартай загварууд болон даалгаварт чиглэсэн модулиудын шилдэг кодын баазаар хангадаг. Өмнө нь хийсэн загварууд болон MMDetection хэрэгслийн хайрцагт ашиглаж болох дасан зохицох аргуудыг доор жагсаав. Илүү олон загвар, аргууд нэмэгдэхийн хэрээр жагсаалт өссөөр байна.
- Хурдан R-CNN
- Илүү хурдан R-CNN
- Маск R-CNN
- RetinaNet
- DCN
- DCNv2
- Каскад R-CNN
- M2Det
- GHM
- ScratchDet
- Хоёр толгойтой R-CNN
- R-CNN сүлжээ
- FSAF
- Libra R-CNN
- GCNet
- HRNet
- Маскийн оноо R-CNN
- FCOS
- SSD
- R-FCN
- Холимог нарийвчлалын сургалт
- Жингийн стандартчилал
- Hybrid Task Cascade
- Хөтөчтэй бэхэлгээ
- Ерөнхий анхаарал
MMDetection ашиглан объект илрүүлэх загварыг бий болгох
Энэ зааварт бид Google-ийн хамтын дэвтэр байх болно, учир нь үүнийг тохируулах, ашиглахад хялбар.
суурилуулах ажил
Бидэнд хэрэгтэй бүх зүйлийг суулгахын тулд эхлээд шаардлагатай номын сангуудыг суулгаж, MMdetection GitHub төслийг клонд хийнэ.
Env импортлож байна
Манай төслийн орчинг одоо агуулахаас импортлох болно.
Номын сангууд болон MMdetection импортлох
Бид одоо шаардлагатай номын сангуудыг MMdetection-ийн хамт импортлох болно.
Урьдчилан бэлтгэгдсэн хяналтын цэгүүдийг татаж авах
MMdetection-ээс урьдчилан бэлтгэгдсэн загварын хяналтын цэгүүдийг одоо татаж аваад цаашдын тохируулга, дүгнэлт гаргах хэрэгтэй.
Барилгын загвар
Одоо бид загварыг бүтээж, мэдээллийн багцад хяналтын цэгүүдийг ашиглана.
Илрүүлэгчийн дүгнэлт
Загварыг зөв барьж, ачаалсны дараа энэ нь хэр сайн болохыг шалгацгаая. Бид MMDetection-ийн өндөр түвшний API дүгнэлт илрүүлэгчийг ашигладаг. Энэхүү API нь дүгнэлт хийх үйл явцыг хөнгөвчлөх зорилгоор бүтээгдсэн.
үр дүн
Үр дүнг нь харцгаая.
Дүгнэлт
Дүгнэж хэлэхэд, MMDetection хэрэгслийн хайрцаг нь SimpleDet, Detectron, Maskrcnn-benchmark гэх мэт саяхан гаргасан кодын баазуудаас илүү сайн ажилладаг. Том загварын цуглуулгатай,
MMDetection нь одоо хамгийн сүүлийн үеийн технологи юм. MMDetection нь үр ашиг, гүйцэтгэлийн хувьд бусад бүх кодын баазыг давж гардаг.
MMdetection-ийн хамгийн сайхан зүйлсийн нэг нь та одоо өөр тохиргооны файл руу зааж, өөр хяналтын цэгийг татаж аваад загвараа өөрчлөхийг хүсвэл ижил кодыг ажиллуулж болно.
Би тэднийг харахыг зөвлөж байна зааварчилгаа Хэрэв та аль нэг үе шаттай холбоотой асуудалтай тулгарвал эсвэл заримыг нь өөрөөр хийхийг хүсч байвал.
хариу үлдээх