深度學習中最簡單但最有趣的想法之一是對象檢測。 基本思想是將每個項目分成代表可比較特徵的連續類,然後在其周圍畫一個框。
這些區別特徵可以像形式或顏色一樣簡單,這有助於我們對它們進行分類。
的應用 物體檢測 由於計算機視覺和圖像處理方面的重大改進,它被廣泛應用於醫學科學、自動駕駛、國防和軍事、公共管理和許多其他領域。
在這裡,我們有 MMDetection,這是一個基於 Pytorch 構建的出色的開源對象檢測工具集。 在本文中,我們將詳細研究 MMDetection,親身體驗它,討論它的特性等等。
什麼是 MM檢測?
MM檢測 toolbox 是作為 Python 代碼庫創建的,專門用於解決涉及對象識別和實例分割的問題。
使用 PyTorch 實現,並以模塊化方式創建。 對於對象識別和實例分割,廣泛的有效模型已被編譯成各種方法。
它允許有效的推理和快速的訓練。 另一方面,該工具箱包含超過 200 個預訓練網絡的權重,使其成為對象識別領域的快速修復。
MMDetection 具有適應當前技術或使用可用模塊創建新檢測器的能力,可作為基準。
該工具箱的主要特點是它包含了來自普通工具箱的簡單、模塊化部件。 目標檢測 可用於創建獨特管道或獨特模型的框架。
該工具包的基準測試功能使在現有框架之上構建新的檢測器框架並比較其性能變得簡單。
功能
- 該工具包直接支持流行和現代的檢測框架,例如 Faster RCNN、Mask RCNN、RetinaNet 等。
- 使用 360 多個預訓練模型進行微調(或重新訓練)。
- 適用於著名的視覺數據集,包括 COCO、Cityscapes、LVIS 和 PASCAL VOC。
- 在 GPU 上,執行所有基本的 bbox 和掩碼操作。 其他代碼庫,例如 Detectron2、maskrcnn-benchmark 和 SimpleDet,可以以比這個更快的速度進行訓練。
- 研究人員分解了 目標檢測 框架分為幾個模塊,然後可以組合起來創建一個獨特的對象檢測系統。
MMDetection 架構
MMDetection 指定了一個可以應用於任何模型的通用設計,因為它是一個包含各種預構建模型的工具箱,每個模型都有自己的架構。 以下組件構成了這個整體架構:
- 骨幹:Backbone,例如沒有最終全連接層的 ResNet-50,是將圖像轉換為特徵圖的組件。
- 頸部:頸部是連接脊椎和頭部的部分。 在主幹的原始特徵圖上,它會進行某些調整或重新配置。 特徵金字塔網絡就是一個例子(FPN)。
- 密頭 (AnchorHead/AnchorFreeHead):是對特徵圖密集區域進行操作的組件,如AnchorHead和AnchorFreeHead,如RPNHead、RetinaHead、FCOSHead。
- RoI提取器:使用類似 RoIPooling 的運算符,它是從單個或一組特徵映射中提取 RoIwise 特徵的部分。 SingleRoIExtractor 示例從特徵金字塔的匹配級別中提取 RoI 特徵。
- 滾頭 (BBoxHead/MaskHead):它是系統的一部分,它使用 RoI 特徵作為輸入並生成基於 RoI 的任務特定預測,例如邊界框分類/回歸和掩碼預測。
使用上述概念說明了單級和兩級檢測器的構造。 我們可以簡單地通過構建一些新的部分並結合一些現有的部分來開發我們自己的程序。
MMDetection 中包含的模型列表
MMDetection 為多個知名模型和麵向任務的模塊提供一流的代碼庫。 下面列出了以前製作的模型和可與 MMDetection 工具箱一起使用的適應性方法。 隨著更多模型和方法的添加,該列表不斷增長。
- 快速 R-CNN
- 更快的R-CNN
- 面具R-CNN
- 視網膜網
- DCN
- DCNv2
- 級聯 R-CNN
- M2檢測
- 全球健康管理中心
- 划痕檢測
- 雙頭 R-CNN
- 網格 R-CNN
- FSAF
- 天秤座 R-CNN
- GC網絡
- 人力資源網
- 面膜評分R-CNN
- 飛行控制系統
- SSD
- R-FCN
- 混合精度訓練
- 體重標準化
- 混合任務級聯
- 引導錨定
- 廣義注意力
使用 MMDetection 構建對象檢測模型
在本教程中,我們將成為 Google 協作筆記本,因為它易於設置和使用。
安裝過程
要安裝我們需要的一切,我們將首先安裝必要的庫並克隆 MMdetection GitHub 項目。
導入環境
我們項目的環境現在將從存儲庫中導入。
導入庫和 MMdetection
我們現在將導入所需的庫,當然還有 MMdetection。
下載預訓練的檢查點
現在應該下載來自 MMdetection 的預訓練模型檢查點,以進行進一步的調整和推理。
建築模型
我們現在將構建模型並將檢查點應用於數據集。
推斷檢測器
現在模型已經正確構建和加載,讓我們來看看它有多出色。 我們利用 MMDetection 的高級 API 推理檢測器。 此 API 旨在簡化推理過程。
結果
讓我們來看看結果。
結論
總之,MMDetection 工具箱的性能優於最近發布的代碼庫,如 SimpleDet、Detectron 和 Maskrcnn-benchmark。 擁有龐大的模型收藏,
MMDetection 現在是最先進的技術。 MMDetection 在效率和性能方面優於所有其他代碼庫。
MMdetection 最好的一點是,您現在只需指向不同的配置文件,下載不同的檢查點,並在您希望更改模型時運行相同的代碼。
我建議看看他們的 指示 如果您在任何階段遇到問題或希望以不同的方式執行其中一些階段。
發表評論