Daftar Isi[Bersembunyi][Menunjukkan]
Salah satu ide paling sederhana namun paling menarik dalam pembelajaran mendalam adalah deteksi objek. Ide dasarnya adalah untuk membagi setiap item ke dalam kelas-kelas berurutan yang mewakili sifat-sifat yang sebanding dan kemudian menggambar sebuah kotak di sekitarnya.
Karakteristik yang membedakan ini bisa sesederhana bentuk atau warna, yang membantu kemampuan kita untuk mengkategorikannya.
Aplikasi dari Deteksi Objek secara luas digunakan dalam ilmu kedokteran, mengemudi otonom, pertahanan dan militer, administrasi publik, dan banyak bidang lainnya berkat peningkatan substansial dalam Visi Komputer dan Pemrosesan Gambar.
Di sini kita memiliki MMDetection, perangkat deteksi objek sumber terbuka yang fantastis yang dibangun di atas Pytorch. Dalam artikel ini, kita akan memeriksa MMDetection secara mendetail, membahasnya secara langsung, membahas fitur-fiturnya, dan banyak lagi.
Apa itu Deteksi MMD?
Grafik Deteksi MMD toolbox dibuat sebagai basis kode Python khusus untuk masalah yang melibatkan identifikasi objek dan segmentasi instance.
Implementasi PyTorch digunakan, dan dibuat secara modular. Untuk pengenalan objek dan segmentasi instan, berbagai model efektif telah dikompilasi ke dalam berbagai metodologi.
Ini memungkinkan inferensi yang efektif dan pelatihan cepat. Di sisi lain, kotak alat mencakup bobot untuk lebih dari 200 jaringan pra-terlatih, menjadikannya perbaikan cepat di bidang identifikasi objek.
Dengan kemampuan untuk mengadaptasi teknik saat ini atau membuat detektor baru menggunakan modul yang tersedia, MMDetection berfungsi sebagai benchmark.
Fitur utama toolbox adalah penyertaan komponen modular langsung dari normal deteksi objek framework yang dapat digunakan untuk membuat pipeline unik atau model unik.
Kemampuan tolok ukur dari toolkit ini memudahkan untuk membangun kerangka kerja detektor baru di atas kerangka kerja yang ada dan membandingkan kinerjanya.
Fitur
- Kerangka kerja deteksi populer dan modern, seperti Faster RCNN, Mask RCNN, RetinaNet, dll., didukung langsung oleh toolkit ini.
- Penggunaan 360+ model terlatih untuk fine-tuning (atau pelatihan baru).
- Untuk kumpulan data visi terkenal termasuk COCO, Cityscapes, LVIS, dan PASCAL VOC.
- Pada GPU, semua operasi dasar bbox dan mask dijalankan. Basis kode lain, seperti Detectron2, maskrcnn-benchmark, dan SimpleDet, dapat dilatih dengan kecepatan yang lebih cepat daripada atau setara dengan yang ini.
- Peneliti memecah deteksi objek framework menjadi beberapa modul, yang kemudian dapat digabungkan untuk membuat sistem deteksi objek yang unik.
Arsitektur MMDeteksi
MMDetection menentukan desain generik yang dapat diterapkan ke model apa pun karena ini adalah kotak peralatan dengan berbagai model pra-bangun, yang masing-masing memiliki arsitekturnya sendiri. Komponen berikut membentuk arsitektur keseluruhan ini:
- Tulang punggung: Backbone, seperti ResNet-50 tanpa lapisan akhir yang sepenuhnya terhubung, adalah komponen yang mengubah gambar menjadi peta fitur.
- Leher: Leher adalah ruas yang menghubungkan tulang punggung dengan kepala. Pada peta fitur mentah tulang punggung, ia melakukan penyesuaian atau konfigurasi ulang tertentu. Fitur Pyramid Network adalah salah satu ilustrasi (FPN).
- PadatKepala (AnchorHead/AnchorFreeHead): Ini adalah komponen yang beroperasi di area padat peta fitur, seperti AnchorHead dan AnchorFreeHead, seperti RPNHead, RetinaHead, dan FCOSHead.
- Ekstraktor RoI: Dengan menggunakan operator mirip RoIPooling, bagian inilah yang menarik fitur RoIwise dari satu atau kumpulan peta fitur. Sampel SingleRoIExtractor mengekstrak fitur RoI dari tingkat piramida fitur yang cocok.
- Kepala RoI (BBoxHead/MaskHead): Ini adalah bagian dari sistem yang menggunakan karakteristik RoI sebagai input dan menghasilkan prediksi spesifik tugas berbasis RoI, seperti klasifikasi/regresi kotak pembatas dan prediksi mask.
Konstruksi detektor satu tahap dan dua tahap diilustrasikan menggunakan konsep yang disebutkan di atas. Kita dapat mengembangkan prosedur kita sendiri hanya dengan membuat beberapa bagian baru dan menggabungkan beberapa bagian yang sudah ada.
Daftar model yang termasuk dalam MMDetection
MMDetection menyediakan basis kode terbaik untuk beberapa model terkenal dan modul berorientasi tugas. Model yang sebelumnya telah dibuat dan metode yang dapat disesuaikan yang dapat digunakan dengan kotak alat MMDetection tercantum di bawah ini. Daftar ini terus bertambah seiring bertambahnya model dan metode.
- R-CNN cepat
- Lebih cepat R-CNN
- Topeng R-CNN
- RetinaNet
- DCN
- DCNv2
- Kaskade R-CNN
- M2Det
- GHM
- GoresDet
- R-CNN Dua Kepala
- Kisi R-CNN
- FSAF
- Libra R-CNN
- GCNet
- HRNet
- Masker Scoring R-CNN
- FCOS
- SSD
- R-FCN
- Pelatihan Presisi Campuran
- Standarisasi Berat
- Kaskade Tugas Hibrida
- Penahan Terpandu
- Perhatian Umum
Membangun model deteksi objek menggunakan MMDetection
Dalam tutorial ini, kita akan menjadi notebook Google collab karena mudah diatur dan digunakan.
Instalasi
Untuk menginstal semua yang kita butuhkan, pertama-tama kita akan menginstal perpustakaan yang diperlukan dan mengkloning proyek MMdetection GitHub.
Mengimpor lingkungan
Lingkungan untuk proyek kami sekarang akan diimpor dari repositori.
Mengimpor perpustakaan dan deteksi MM
Kami sekarang akan mengimpor perpustakaan yang diperlukan, bersama dengan deteksi MM tentu saja.
Unduh pos pemeriksaan yang telah dilatih sebelumnya
Pos pemeriksaan model yang telah dilatih sebelumnya dari MMdetection sekarang harus diunduh untuk penyesuaian dan inferensi lebih lanjut.
Model bangunan
Kami sekarang akan membangun model dan menerapkan pos pemeriksaan ke dataset.
Inferensi detektor
Sekarang model telah dibangun dan dimuat dengan benar, mari kita periksa seberapa bagusnya model itu. Kami menggunakan detektor inferensi API tingkat tinggi MMDetection. API ini dirancang untuk mempermudah proses inferensi.
Hasil
Mari kita lihat hasilnya.
Kesimpulan
Kesimpulannya, toolbox MMDetection mengungguli basis kode yang baru-baru ini dirilis seperti SimpleDet, Detectron, dan Maskrcnn-benchmark. Dengan koleksi model yang banyak,
MMDetection sekarang merupakan teknologi tercanggih. MMDetection mengungguli semua basis kode lainnya dalam hal efisiensi dan kinerja.
Salah satu hal terbaik tentang MMdetection adalah Anda sekarang dapat mengarahkan ke file konfigurasi yang berbeda, mengunduh pos pemeriksaan yang berbeda, dan menjalankan kode yang sama jika Anda ingin mengubah model.
Saya menyarankan untuk melihat mereka instruksi jika Anda mengalami masalah dengan salah satu tahapan atau ingin melakukan beberapa di antaranya secara berbeda.
Tinggalkan Balasan