Tartalomjegyzék[Elrejt][Előadás]
A mélytanulás egyik legegyszerűbb, de legérdekesebb ötlete a tárgyészlelés. Az alapötlet az, hogy minden elemet egymás után következő osztályokra osztunk, amelyek összehasonlítható tulajdonságokat képviselnek, majd körberajzolunk egy dobozt.
Ezek a megkülönböztető jellemzők lehetnek olyan egyszerűek, mint a forma vagy a szín, ami segíti a kategorizálásukat.
Az alkalmazások Objektumfelismerés széles körben alkalmazzák az orvostudomány, az autonóm vezetés, a védelem és a katonaság, a közigazgatás és sok más területen a számítógépes látás és képfeldolgozás jelentős fejlesztéseinek köszönhetően.
Itt található az MMDetection, egy fantasztikus nyílt forráskódú objektumészlelési eszközkészlet, amely Pytorchra épül. Ebben a cikkben részletesen megvizsgáljuk az MMDtection funkciót, gyakorlatiasan foglalkozunk vele, megvitatjuk a funkcióit és még sok mást.
Mi MMDdetektálás?
A MMDdetektálás Az eszköztár Python kódbázisként készült, kifejezetten az objektumok azonosításával és a példányszegmentációval kapcsolatos problémákra.
A PyTorch implementációt használják, és modulárisan hozzák létre. Az objektumfelismeréshez és a példányszegmentációhoz hatékony modellek széles skáláját állították össze különféle módszertanokká.
Hatékony következtetést és gyors képzést tesz lehetővé. Másrészt az eszköztár több mint 200 előre betanított hálózathoz tartalmaz súlyokat, így gyors javítást jelent az objektum azonosítás területén.
A jelenlegi technikák adaptálhatóságával vagy egy új detektor létrehozásával a rendelkezésre álló modulok felhasználásával az MMDection benchmarkként működik.
Az eszköztár fő jellemzője, hogy egyszerű, moduláris alkatrészeket tartalmaz a normálból tárgy észlelése keretrendszer, amellyel egyedi csővezetékek vagy egyedi modellek hozhatók létre.
Az eszközkészlet benchmarking képességei egyszerűvé teszik egy új érzékelő keretrendszer felépítését egy meglévő keretrendszerre, és összehasonlítják a teljesítményét.
Jellemzők
- Az eszközkészlet közvetlenül támogatja a népszerű és modern észlelési keretrendszereket, mint például a Faster RCNN, a Mask RCNN, a RetinaNet stb.
- 360+ előre betanított modell használata a finomhangoláshoz (vagy az újraképzéshez).
- Jól ismert látási adatkészletekhez, beleértve a COCO, Cityscapes, LVIS és PASCAL VOC.
- A GPU-kon az összes alapvető bbox és maszk művelet végrehajtásra kerül. Más kódbázisok, mint például a Detectron2, a maskrcnn-benchmark és a SimpleDet, gyorsabban betaníthatók, mint ez a kód.
- A kutatók lebontják a tárgy észlelése keretrendszer több modulra bontható, amelyek kombinálhatók egyedi objektumészlelő rendszer létrehozásához.
MMDection Architecture
Az MMDetection olyan általános kialakítást határoz meg, amely bármely modellre alkalmazható, mivel ez egy eszköztár számos előre elkészített modellel, amelyek mindegyikének saját architektúrája van. A következő összetevők alkotják ezt az általános architektúrát:
- Hátgerinc: A gerinchálózat, például a ResNet-50 az utolsó teljesen csatlakoztatott réteg nélkül, az az összetevő, amely a képet jellemző térképekké alakítja.
- Nyak: A nyak az a szegmens, amely összeköti a gerincet a fejekkel. A gerinchálózat nyers jellemzőtérképein bizonyos beállításokat vagy újrakonfigurálásokat végez. Feature Pyramid Network egy illusztráció (FPN).
- DenseHead (AnchorHead/AnchorFreeHead): Ez az a komponens, amely a jellemzőtérképek sűrű területein működik, mint például az AnchorHead és az AnchorFreeHead, mint például az RPNHead, a RetinaHead és az FCOSHead.
- RoIEextractor: RoIPooling-szerű operátorok használatával ez az a szakasz, amely a RoIwise jellemzőit egyetlen vagy jellemzőtérkép-gyűjteményből vonja ki. A SingleRoIExtractor minta a jellemző piramisok megfelelő szintjéről vonja ki a RoI jellemzőket.
- RoIHead (BBoxHead/MaskHead): A rendszernek ez az a része, amely a megtérülési jellemzőket használja bemenetként, és RoI-alapú feladatspecifikus előrejelzéseket hoz létre, például határolódoboz-osztályozást/regressziót és maszk-előrejelzést.
Az egyfokozatú és kétfokozatú detektorok felépítését a fent említett koncepciók segítségével szemléltetjük. Kidolgozhatjuk saját eljárásainkat egyszerűen néhány új alkatrész elkészítésével és néhány meglévő egyesítésével.
Az MMDectionben szereplő modellek listája
Az MMDetection csúcsminőségű kódbázisokat biztosít számos jól ismert modellhez és feladatorientált modulhoz. Az alábbiakban felsoroljuk a korábban elkészített modelleket és az MMDection eszköztárral használható adaptálható módszereket. A lista folyamatosan bővül, ahogy egyre több modell és módszer bővül.
- Gyors R-CNN
- Gyorsabb R-CNN
- Maszk R-CNN
- RetinaNet
- DCN
- DCNv2
- Cascade R-CNN
- M2Det
- GHM
- ScratchDet
- Kétfejű R-CNN
- R-CNN rács
- FSAF
- Libra R-CNN
- GCNet
- HRNet
- Maszk pontozása R-CNN
- FCOS
- SSD
- R-FCN
- Vegyes precíziós képzés
- Súly szabványosítás
- Hybrid Task Cascade
- Irányított horgonyzás
- Általános figyelem
Objektumészlelési modell építése MMDetection segítségével
Ebben az oktatóanyagban mi leszünk a Google kollab jegyzetfüzete, mert könnyen beállítható és használható.
Telepítés
Minden szükséges telepítéshez először telepítjük a szükséges könyvtárakat, és klónozzuk az MMdetection GitHub projektet.
Környezet importálása
A projektünk környezete most importálásra kerül a tárolóból.
Könyvtárak importálása és MMdetection
Most importáljuk a szükséges könyvtárakat, természetesen az MMdetection-el együtt.
Töltse le az előre betanított ellenőrzőpontokat
Az MMdetection előre betanított modellellenőrző pontjait most le kell tölteni további beállításhoz és következtetésekhez.
Épületmodell
Most megszerkesztjük a modellt, és az ellenőrző pontokat alkalmazzuk az adatkészletre.
Következtetés a detektorra
Most, hogy a modell megfelelően felépített és betöltött, nézzük meg, mennyire kiváló. Az MMDetection magas szintű API következtetési detektorát használjuk. Ezt az API-t úgy tervezték, hogy megkönnyítse a következtetési folyamatot.
Eredmény
Nézzük az eredményeket.
Következtetés
Összefoglalva, az MMDetection eszköztár felülmúlja az olyan nemrégiben kiadott kódbázisokat, mint a SimpleDet, a Detectron és a Maskrcnn-benchmark. Hatalmas modellkollekcióval,
Az MMDtection ma már a legmodernebb technológia. Az MMDetection minden más kódbázist felülmúl a hatékonyság és a teljesítmény tekintetében.
Az MMdetection egyik legszebb tulajdonsága, hogy most már csak egy másik konfigurációs fájlra mutathat, letölthet egy másik ellenőrzőpontot, és ugyanazt a kódot futtathatja, ha módosítani szeretné a modelleket.
Azt tanácsolom, nézd meg őket utasítás ha problémákba ütközik valamelyik szakaszban, vagy néhányat másként kíván végrehajtani.
Hagy egy Válaszol