Zestaw narzędzi MMDetection do wykrywania obiektów

Spis treści[Ukryć][Pokazać]

Co to jest wykrywanie MM?
Korzyści
Architektura MMDetection
Lista modeli zawartych w MMDetection
Model wykrywania obiektów budowlanych za pomocą MMDetection +-
Wnioski

Jednym z najprostszych, ale najbardziej intrygujących pomysłów w głębokim uczeniu jest wykrywanie obiektów. Podstawową ideą jest podzielenie każdego przedmiotu na kolejne klasy, które reprezentują porównywalne cechy, a następnie narysowanie wokół niego ramki.

Te wyróżniające cechy mogą być tak proste, jak forma lub kolor, co pomaga nam w ich kategoryzacji.

Zastosowania Wykrywanie obiektów są szeroko stosowane w naukach medycznych, autonomicznej jeździe, obronności i wojsku, administracji publicznej i wielu innych dziedzinach dzięki znacznym ulepszeniom w zakresie widzenia komputerowego i przetwarzania obrazu.

Tutaj mamy MMDetection, fantastyczny zestaw narzędzi do wykrywania obiektów o otwartym kodzie źródłowym zbudowany na Pytorch. W tym artykule szczegółowo omówimy MMDetection, zapoznamy się z nim, omówimy jego funkcje i wiele więcej.

Co to jest Wykrywanie MMD?

Połączenia Wykrywanie MMD toolbox został stworzony jako baza kodu Pythona specjalnie dla problemów związanych z identyfikacją obiektów i segmentacją instancji.

Wykorzystywana jest implementacja PyTorch, która jest tworzona w sposób modułowy. W celu rozpoznawania obiektów i segmentacji instancji szeroka gama skutecznych modeli została skompilowana w różne metodologie.

Wykrywanie MMD

Pozwala na efektywne wnioskowanie i szybki trening. Z drugiej strony zestaw narzędzi zawiera wagi dla ponad 200 wstępnie przeszkolonych sieci, dzięki czemu jest to szybkie rozwiązanie w dziedzinie identyfikacji obiektów.

Dzięki możliwości dostosowania obecnych technik lub stworzenia nowego detektora przy użyciu dostępnych modułów, MMDetection funkcjonuje jako wzorzec.

Kluczową cechą zestawu narzędzi jest włączenie prostych, modułowych części z normalnych wykrywanie obiektów ramy, które można wykorzystać do tworzenia unikalnych potoków lub unikalnych modeli.

Możliwości analizy porównawczej tego zestawu narzędzi ułatwiają zbudowanie nowej struktury detektora na bazie istniejącej struktury i porównanie jej wydajności.

Korzyści

Popularne i nowoczesne platformy wykrywania, takie jak Faster RCNN, Mask RCNN, RetinaNet itp., są bezpośrednio obsługiwane przez zestaw narzędzi.
Korzystanie z wytrenowanych modeli 360+ w celu dostrojenia (lub treningu od nowa).
Dla dobrze znanych zestawów danych wizyjnych, w tym COCO, Cityscapes, LVIS i PASCAL VOC.
Na procesorach graficznych wykonywane są wszystkie podstawowe operacje bbox i mask. Inne bazy kodu, takie jak Detectron2, maskrcnn-benchmark i SimpleDet, mogą być trenowane szybciej lub na równi z tym.
Badacze rozkładają wykrywanie obiektów Framework na kilka modułów, które następnie można łączyć w celu stworzenia unikalnego systemu wykrywania obiektów.

Architektura MMDetection

MMDetection określa ogólny projekt, który można zastosować do dowolnego modelu, ponieważ jest to zestaw narzędzi z różnymi gotowymi modelami, z których każdy ma własną architekturę. Na tę ogólną architekturę składają się następujące składniki:

Kręgosłup: Szkielet, taki jak ResNet-50 bez końcowej, w pełni połączonej warstwy, to komponent, który konwertuje obraz na mapy cech.
Szyja: Szyja to odcinek łączący kręgosłup z głową. Na surowych mapach funkcji szkieletu dokonuje pewnych korekt lub rekonfiguracji. Jedną z ilustracji (FPN) jest sieć piramid funkcji.
Gęsta Głowa (AnchorHead/AnchorFreeHead): Jest to komponent, który działa na gęstych obszarach map obiektów, takich jak AnchorHead i AnchorFreeHead, takich jak RPNHead, RetinaHead i FCOSHead.
RoIEExtractor: Przy użyciu operatorów podobnych do RoIPooling, jest to sekcja, która pobiera funkcje RoIwise z pojedynczej lub zbioru map funkcji. Próbka SingleRoIExtractor wyodrębnia cechy RoI z odpowiedniego poziomu piramid cech.
RoIHead (BBoxHead/MaskHead): Jest to część systemu, która wykorzystuje charakterystyki ROI jako dane wejściowe i generuje oparte na ROI prognozy specyficzne dla zadania, takie jak klasyfikacja/regresja ramek ograniczających i przewidywanie masek.

Konstrukcję detektorów jedno- i dwustopniowych zilustrowano za pomocą powyższych koncepcji. Możemy opracować własne procedury, po prostu konstruując kilka świeżych części i łącząc kilka istniejących.

Lista modeli zawartych w MMDetection

MMDetection zapewnia najwyższej klasy bazy kodów dla kilku dobrze znanych modeli i modułów zorientowanych na zadania. Modele, które zostały wcześniej wykonane i metody, które można dostosować, które można wykorzystać z zestawem narzędzi MMDetection, są wymienione poniżej. Lista stale rośnie wraz z dodawaniem kolejnych modeli i metod.

Szybki R-CNN
Szybszy R-CNN
Maska R-CNN
RetinaNet
DCN
DCNv2
Kaskada R-CNN
M2 Det
Ghm
Szczegóły zarysowania
Dwugłowicowy R-CNN
Siatka R-CNN
FSAF
Waga R-CNN
GCNet
HRNet
Ocena maski R-CNN
FCOS
SSD
R-FCN
Mieszane szkolenie precyzyjne
Standaryzacja wagi
Hybrydowa kaskada zadań
Prowadzone kotwiczenie
Uogólniona uwaga

Model wykrywania obiektów budowlanych za pomocą MMDetection

W tym samouczku będziemy notatnikiem Google collab, ponieważ jest łatwy w konfiguracji i obsłudze.

Instalacja

Aby zainstalować wszystko, czego potrzebujemy, najpierw zainstalujemy niezbędne biblioteki i sklonujemy projekt MMdetection GitHub.

Instalacje

Importowanie środowiska

Środowisko naszego projektu zostanie teraz zaimportowane z repozytorium.

Importowanie koperty 1

Importowanie bibliotek i MMdetection

Zaimportujemy teraz wymagane biblioteki, oczywiście wraz z MMdetection.

Importowanie bibliotek i MMdetection

Pobierz przeszkolone punkty kontrolne

Wstępnie wytrenowane punkty kontrolne modelu z MMdetection należy teraz pobrać w celu dalszego dostosowania i wnioskowania.

Pobierz przeszkolone punkty kontrolne

Model budynku

Skonstruujemy teraz model i zastosujemy punkty kontrolne do zbioru danych.

Model budynku

Wnioskowanie detektora

Teraz, gdy model został poprawnie skonstruowany i załadowany, sprawdźmy, jak jest doskonały. Wykorzystujemy wysokopoziomowy detektor wnioskowania API MMDetection. Ten interfejs API został zaprojektowany, aby ułatwić proces wnioskowania.

Wnioskowanie Detektor

Wynik

Przyjrzyjmy się wynikom.

Kod wyników

Obraz wyniku

Wnioski

Podsumowując, zestaw narzędzi MMDetection przewyższa ostatnio wydane bazy kodów, takie jak SimpleDet, Detectron i Maskrcnn-benchmark. Dzięki dużej kolekcji modeli,

MMDetection jest obecnie najnowocześniejszą technologią. MMDetection przewyższa wszystkie inne bazy kodu pod względem wydajności i wydajności.

Jedną z najmilszych rzeczy w MMdetection jest to, że możesz teraz po prostu wskazać inny plik konfiguracyjny, pobrać inny punkt kontrolny i uruchomić ten sam kod, jeśli chcesz zmienić modele.

Radzę spojrzeć na ich instrukcje jeśli napotkasz problemy na którymś z etapów lub chcesz przeprowadzić niektóre z nich w inny sposób.

Zestaw narzędzi MMDetection do wykrywania obiektów

Co to jest Wykrywanie MMD?

Korzyści

Architektura MMDetection

Lista modeli zawartych w MMDetection