Índice analítico[Ocultar][Mostrar]
Unha das ideas máis simples pero máis intrigantes na aprendizaxe profunda é a detección de obxectos. A idea fundamental é dividir cada elemento en clases sucesivas que representen trazos comparables e despois debuxar un cadro ao seu redor.
Estas características distintivas poden ser tan simples como a forma ou a cor, o que axuda á nosa capacidade de categorizarlas.
As aplicacións de Detección de obxectos son amplamente empregados nas ciencias médicas, condución autónoma, defensa e militares, administración pública e moitos outros campos grazas a melloras substanciais na visión por ordenador e procesamento de imaxes.
Aquí temos MMDetection, un fantástico conxunto de ferramentas de detección de obxectos de código aberto construído en Pytorch. Neste artigo, examinaremos MMDetection en detalle, practicaremos con ela, discutiremos as súas características e moito máis.
O que é Detección MMD?
o Detección MMD Toolbox creouse como unha base de código Python específicamente para problemas relacionados coa identificación de obxectos e a segmentación de instancias.
Utilízase a implementación de PyTorch e créase de forma modular. Para o recoñecemento de obxectos e a segmentación de instancias, recompilouse unha ampla gama de modelos eficaces nunha variedade de metodoloxías.
Permite unha inferencia eficaz e un adestramento rápido. Por outra banda, a caixa de ferramentas inclúe pesos para máis de 200 redes adestradas previamente, polo que é unha solución rápida no campo de identificación de obxectos.
Coa capacidade de adaptar as técnicas actuais ou crear un novo detector utilizando os módulos dispoñibles, MMDetection funciona como un punto de referencia.
A característica principal da caixa de ferramentas é a súa inclusión de pezas simples e modulares dun normal detección de obxectos marco que se pode usar para crear canalizacións ou modelos únicos.
As capacidades de benchmarking deste conxunto de ferramentas fan que sexa sinxelo construír un novo cadro de detector enriba dun cadro existente e comparar o seu rendemento.
características
- Os marcos de detección populares e modernos, como Faster RCNN, Mask RCNN, RetinaNet, etc., son compatibles directamente co kit de ferramentas.
- Uso de máis de 360 modelos preadestrados para axustar (ou adestrar de novo).
- Para conxuntos de datos de visión coñecidos, incluíndo COCO, Cityscapes, LVIS e PASCAL VOC.
- Nas GPU, execútanse todas as operacións fundamentais de bbox e máscara. Outras bases de código, como Detectron2, maskrcnn-benchmark e SimpleDet, pódense adestrar a un ritmo máis rápido que este ou á par.
- Os investigadores descompoñen o detección de obxectos marco en varios módulos, que se poden combinar para crear un sistema único de detección de obxectos.
Arquitectura de MMDetection
MMDetection especifica un deseño xenérico que se pode aplicar a calquera modelo xa que é unha caixa de ferramentas cunha variedade de modelos preconstruídos, cada un dos cales ten a súa propia arquitectura. Os seguintes compoñentes compoñen esta arquitectura xeral:
- espiña dorsal: Backbone, como un ResNet-50 sen a capa final totalmente conectada, é o compoñente que converte unha imaxe en mapas de características.
- pescozo: O pescozo é o segmento que une a columna vertebral coas cabezas. Nos mapas de funcións en bruto da columna vertebral, fai certos axustes ou reconfiguracións. Feature Pyramid Network é unha ilustración (FPN).
- Cabeza Densa (AnchorHead/AnchorFreeHead): é o compoñente que opera en áreas densas de mapas de características, como AnchorHead e AnchorFreeHead, como RPNHead, RetinaHead e FCOSHead.
- RoIEextractor: Co uso de operadores tipo RoIPooling, é a sección que extrae as funcións de RoIwise dun único mapa de características ou dunha colección de mapas. A mostra SingleRoIExtractor extrae características de RoI do nivel de coincidencia das pirámides de características.
- RoIHead (BBoxHead/MaskHead): é a parte do sistema que usa as características de RoI como entrada e xera predicións específicas de tarefas baseadas no RoI, como a clasificación/regresión de caixa delimitadora e a predición de máscara.
A construción de detectores dunha e dúas etapas ilústrase utilizando os conceptos mencionados anteriormente. Podemos desenvolver os nosos propios procedementos simplemente construíndo algunhas pezas novas e combinando algunhas xa existentes.
Lista de modelos incluídos en MMDetection
MMDetection ofrece bases de código de primeira liña para varios modelos coñecidos e módulos orientados a tarefas. Os modelos que se elaboraron anteriormente e os métodos adaptables que se poden utilizar coa caixa de ferramentas MMDetection están listados a continuación. A lista segue crecendo a medida que se engaden máis modelos e métodos.
- R-CNN rápido
- R-CNN máis rápido
- Máscara R-CNN
- RetinaNet
- DCN
- DCNv2
- Cascada R-CNN
- M2Det
- GHM
- ScratchDet
- R-CNN de dobre cabeza
- Grid R-CNN
- FSAF
- Libra R-CNN
- GCNet
- HRNet
- Máscara de puntuación R-CNN
- FCOS
- SSD
- R-FCN
- Adestramento mixto de precisión
- Estandarización de peso
- Cascada de tarefas híbridas
- Fondeo guiado
- Atención Xeneralizada
Construír un modelo de detección de obxectos usando MMDetection
Neste tutorial, seremos o caderno de colaboración de Google porque é fácil de configurar e usar.
instalación
Para instalar todo o que necesitamos, primeiro instalaremos as bibliotecas necesarias e clonaremos o proxecto MMdetection GitHub.
Importando env
O ambiente para o noso proxecto agora importarase do repositorio.
Importación de bibliotecas e MMdetection
Agora importaremos as bibliotecas necesarias, xunto co MMdetection, por suposto.
Descarga os puntos de control adestrados previamente
Os puntos de control do modelo preadestrados de MMdetection agora deberían descargarse para axustes e inferencias posteriores.
Modelo de edificio
Agora construímos o modelo e aplicaremos os puntos de control ao conxunto de datos.
Inferencia do detector
Agora que o modelo foi construído e cargado correctamente, imos comprobar o excelente que é. Utilizamos o detector de inferencia API de alto nivel de MMDetection. Esta API foi deseñada para facilitar o proceso de inferencia.
Resultado
Vexamos os resultados.
Conclusión
En conclusión, a caixa de ferramentas MMDetection supera as bases de código publicadas recentemente como SimpleDet, Detectron e Maskrcnn-benchmark. Cunha gran colección de modelos,
MMDetection é agora tecnoloxía de última xeración. MMDetection supera a todas as outras bases de código en termos de eficiencia e rendemento.
Unha das cousas máis bonitas de MMdetection é que agora podes apuntar a un ficheiro de configuración diferente, descargar un punto de control diferente e executar o mesmo código se queres cambiar os modelos.
Aconsello mirarlles instrucións se tes problemas nalgunha das etapas ou desexas realizar algunha delas de forma diferente.
Deixe unha resposta