Spis treści[Ukryć][Pokazać]
Jednym z najprostszych, ale najbardziej intrygujących pomysłów w głębokim uczeniu jest wykrywanie obiektów. Podstawową ideą jest podzielenie każdego przedmiotu na kolejne klasy, które reprezentują porównywalne cechy, a następnie narysowanie wokół niego ramki.
Te wyróżniające cechy mogą być tak proste, jak forma lub kolor, co pomaga nam w ich kategoryzacji.
Zastosowania Wykrywanie obiektów są szeroko stosowane w naukach medycznych, autonomicznej jeździe, obronności i wojsku, administracji publicznej i wielu innych dziedzinach dzięki znacznym ulepszeniom w zakresie widzenia komputerowego i przetwarzania obrazu.
Tutaj mamy MMDetection, fantastyczny zestaw narzędzi do wykrywania obiektów o otwartym kodzie źródłowym zbudowany na Pytorch. W tym artykule szczegółowo omówimy MMDetection, zapoznamy się z nim, omówimy jego funkcje i wiele więcej.
Co to jest Wykrywanie MMD?
Połączenia Wykrywanie MMD toolbox został stworzony jako baza kodu Pythona specjalnie dla problemów związanych z identyfikacją obiektów i segmentacją instancji.
Wykorzystywana jest implementacja PyTorch, która jest tworzona w sposób modułowy. W celu rozpoznawania obiektów i segmentacji instancji szeroka gama skutecznych modeli została skompilowana w różne metodologie.
Pozwala na efektywne wnioskowanie i szybki trening. Z drugiej strony zestaw narzędzi zawiera wagi dla ponad 200 wstępnie przeszkolonych sieci, dzięki czemu jest to szybkie rozwiązanie w dziedzinie identyfikacji obiektów.
Dzięki możliwości dostosowania obecnych technik lub stworzenia nowego detektora przy użyciu dostępnych modułów, MMDetection funkcjonuje jako wzorzec.
Kluczową cechą zestawu narzędzi jest włączenie prostych, modułowych części z normalnych wykrywanie obiektów ramy, które można wykorzystać do tworzenia unikalnych potoków lub unikalnych modeli.
Możliwości analizy porównawczej tego zestawu narzędzi ułatwiają zbudowanie nowej struktury detektora na bazie istniejącej struktury i porównanie jej wydajności.
Korzyści
- Popularne i nowoczesne platformy wykrywania, takie jak Faster RCNN, Mask RCNN, RetinaNet itp., są bezpośrednio obsługiwane przez zestaw narzędzi.
- Korzystanie z wytrenowanych modeli 360+ w celu dostrojenia (lub treningu od nowa).
- Dla dobrze znanych zestawów danych wizyjnych, w tym COCO, Cityscapes, LVIS i PASCAL VOC.
- Na procesorach graficznych wykonywane są wszystkie podstawowe operacje bbox i mask. Inne bazy kodu, takie jak Detectron2, maskrcnn-benchmark i SimpleDet, mogą być trenowane szybciej lub na równi z tym.
- Badacze rozkładają wykrywanie obiektów Framework na kilka modułów, które następnie można łączyć w celu stworzenia unikalnego systemu wykrywania obiektów.
Architektura MMDetection
MMDetection określa ogólny projekt, który można zastosować do dowolnego modelu, ponieważ jest to zestaw narzędzi z różnymi gotowymi modelami, z których każdy ma własną architekturę. Na tę ogólną architekturę składają się następujące składniki:
- Kręgosłup: Szkielet, taki jak ResNet-50 bez końcowej, w pełni połączonej warstwy, to komponent, który konwertuje obraz na mapy cech.
- Szyja: Szyja to odcinek łączący kręgosłup z głową. Na surowych mapach funkcji szkieletu dokonuje pewnych korekt lub rekonfiguracji. Jedną z ilustracji (FPN) jest sieć piramid funkcji.
- Gęsta Głowa (AnchorHead/AnchorFreeHead): Jest to komponent, który działa na gęstych obszarach map obiektów, takich jak AnchorHead i AnchorFreeHead, takich jak RPNHead, RetinaHead i FCOSHead.
- RoIEExtractor: Przy użyciu operatorów podobnych do RoIPooling, jest to sekcja, która pobiera funkcje RoIwise z pojedynczej lub zbioru map funkcji. Próbka SingleRoIExtractor wyodrębnia cechy RoI z odpowiedniego poziomu piramid cech.
- RoIHead (BBoxHead/MaskHead): Jest to część systemu, która wykorzystuje charakterystyki ROI jako dane wejściowe i generuje oparte na ROI prognozy specyficzne dla zadania, takie jak klasyfikacja/regresja ramek ograniczających i przewidywanie masek.
Konstrukcję detektorów jedno- i dwustopniowych zilustrowano za pomocą powyższych koncepcji. Możemy opracować własne procedury, po prostu konstruując kilka świeżych części i łącząc kilka istniejących.
Lista modeli zawartych w MMDetection
MMDetection zapewnia najwyższej klasy bazy kodów dla kilku dobrze znanych modeli i modułów zorientowanych na zadania. Modele, które zostały wcześniej wykonane i metody, które można dostosować, które można wykorzystać z zestawem narzędzi MMDetection, są wymienione poniżej. Lista stale rośnie wraz z dodawaniem kolejnych modeli i metod.
- Szybki R-CNN
- Szybszy R-CNN
- Maska R-CNN
- RetinaNet
- DCN
- DCNv2
- Kaskada R-CNN
- M2 Det
- Ghm
- Szczegóły zarysowania
- Dwugłowicowy R-CNN
- Siatka R-CNN
- FSAF
- Waga R-CNN
- GCNet
- HRNet
- Ocena maski R-CNN
- FCOS
- SSD
- R-FCN
- Mieszane szkolenie precyzyjne
- Standaryzacja wagi
- Hybrydowa kaskada zadań
- Prowadzone kotwiczenie
- Uogólniona uwaga
Model wykrywania obiektów budowlanych za pomocą MMDetection
W tym samouczku będziemy notatnikiem Google collab, ponieważ jest łatwy w konfiguracji i obsłudze.
Instalacja
Aby zainstalować wszystko, czego potrzebujemy, najpierw zainstalujemy niezbędne biblioteki i sklonujemy projekt MMdetection GitHub.
Importowanie środowiska
Środowisko naszego projektu zostanie teraz zaimportowane z repozytorium.
Importowanie bibliotek i MMdetection
Zaimportujemy teraz wymagane biblioteki, oczywiście wraz z MMdetection.
Pobierz przeszkolone punkty kontrolne
Wstępnie wytrenowane punkty kontrolne modelu z MMdetection należy teraz pobrać w celu dalszego dostosowania i wnioskowania.
Model budynku
Skonstruujemy teraz model i zastosujemy punkty kontrolne do zbioru danych.
Wnioskowanie detektora
Teraz, gdy model został poprawnie skonstruowany i załadowany, sprawdźmy, jak jest doskonały. Wykorzystujemy wysokopoziomowy detektor wnioskowania API MMDetection. Ten interfejs API został zaprojektowany, aby ułatwić proces wnioskowania.
Wynik
Przyjrzyjmy się wynikom.
Wnioski
Podsumowując, zestaw narzędzi MMDetection przewyższa ostatnio wydane bazy kodów, takie jak SimpleDet, Detectron i Maskrcnn-benchmark. Dzięki dużej kolekcji modeli,
MMDetection jest obecnie najnowocześniejszą technologią. MMDetection przewyższa wszystkie inne bazy kodu pod względem wydajności i wydajności.
Jedną z najmilszych rzeczy w MMdetection jest to, że możesz teraz po prostu wskazać inny plik konfiguracyjny, pobrać inny punkt kontrolny i uruchomić ten sam kod, jeśli chcesz zmienić modele.
Radzę spojrzeć na ich instrukcje jeśli napotkasz problemy na którymś z etapów lub chcesz przeprowadzić niektóre z nich w inny sposób.
Dodaj komentarz