Pambuka kanggo YOLO: Deteksi Obyek Wektu Nyata

Bab lan Paragraf[Singidaken][Tampilake]

Dadi, apa YOLO?
YOLO kerja
Variasi sing beda saka YOLO+-
watesan YOLO
Miwiti nggunakake YOLOv5
kesimpulan

Deteksi obyek minangka jinis kategorisasi gambar ing ngendi jaringan saraf antisipasi item ing gambar lan nggambar kothak sing ana ing saubengé. Ndeteksi lan lokalisasi barang ing gambar sing cocog karo prasetel kelas kasebut diarani deteksi obyek.

Deteksi obyek (uga dikenal minangka pangenalan obyek) minangka subdomain sing penting banget saka Computer Vision amarga tugas kaya deteksi, identifikasi, lan lokalisasi nemokake aplikasi sing wiyar ing konteks donya nyata.

Pendekatan YOLO bisa mbantu sampeyan nindakake tugas kasebut. Ing esai iki, kita bakal nliti luwih rinci babagan YOLO, kalebu apa iku, cara kerjane, variasi sing beda, lan liya-liyane.

Dadi, apa YOLO?

YOLO minangka cara kanggo identifikasi lan pangenalan obyek wektu nyata ing foto. Iki minangka akronim kanggo Sampeyan Mung Deleng Sepisan. Redmond et al. ngusulake pendekatan kasebut ing makalah sing pisanan diterbitake ing 2015 ing Konferensi IEEE / CVF babagan Visi Komputer lan Pangenalan Pola (CVPR).

OpenCV People's Choice Award diwenehake marang kertas kasebut. Ora kaya metode identifikasi obyek sadurunge, sing nggawe klasifikasi maneh kanggo deteksi, YOLO ngusulake panggunaan end-to-end. jaringan saraf sing prédhiksi kothak wates lan kemungkinan kelas bebarengan.

YOLO ngasilake asil paling canggih kanthi njupuk pendekatan dhasar anyar kanggo pangenalan obyek, kanthi gampang ngluwihi cara deteksi obyek nyata-wektu sadurunge.

YOLO kerja

Cara YOLO mbagi gambar dadi kothak N, saben sektor dimensi SxS ukuran padha. Saben kothak N iki tanggung jawab kanggo ndeteksi lan nemokake obyek sing ana.

Arsitektur YOLO

Kisi-kisi iki, ing siji, ramalan kothak wates B koordinat relatif kanggo koordinat sel, uga jeneng item lan kemungkinan obyek sing ana ing sel. Amarga akeh sel sing prédhiksi item sing padha karo prediksi kothak wates sing beda-beda, teknik iki nyuda komputasi amarga deteksi lan pangenalan ditangani dening sel saka gambar kasebut.

Nanging, ngasilake akeh prediksi duplikat. Kanggo ngatasi masalah iki, YOLO nggunakake Non-Maximal Suppression. YOLO nyuda kabeh kothak wates kanthi skor probabilitas sing luwih murah ing Non-Maximal Suppression.

YOLO nindakake iki kanthi mriksa skor kemungkinan sing ana gandhengane karo saben pilihan lan milih sing duwe skor paling dhuwur. Kothak wates karo Persimpangan paling gedhe liwat Union karo kothak watesan kemungkinan dhuwur saiki banjur ditindhes.

YOLO Kerja

Proses iki diterusake nganti kothak wates rampung.

Variasi sing beda saka YOLO

Kita bakal ndeleng sawetara versi YOLO sing paling umum. Ayo dadi miwiti.

1. YOLOv1

Versi YOLO awal diumumake ing 2015 ing publikasi "Sampeyan Mung Deleng Sepisan: Deteksi Obyek Wektu Nyata” dening Joseph Redmon, Santosh Divvala, Ross Girshick, lan Ali Farhadi.

Amarga kacepetan, akurasi, lan kemampuan sinau, YOLO kanthi cepet ndominasi area identifikasi obyek lan dadi algoritma sing paling akeh digunakake. Tinimbang ngatasi deteksi obyek minangka masalah klasifikasi, penulis nyedhaki minangka masalah regresi karo kothak wates sing dipisahake sacara geografis lan kemungkinan kelas sing gegandhengan, sing ditanggulangi kanthi nggunakake siji. jaringan saraf.

YOLOv1

YOLOv1 ngolah foto kanthi 45 frame per detik ing wektu nyata, dene varian sing luwih cilik, Fast YOLO, diproses kanthi 155 frame per detik lan isih entuk kaping pindho peta detektor wektu nyata liyane.

2. YOLOv2

Setaun sabanjure, ing 2016, Joseph Redmon lan Ali Farhadi ngeculake YOLOv2 (uga dikenal minangka YOLO9000) ing koran "YOLO9000: Luwih apik, luwih cepet, luwih kuwat. "

Kapasitas model kanggo ramalan malah 9000 kategori item beda nalika isih mlaku ing wektu nyata entuk sebutan 9000. Ora mung versi model anyar iki bebarengan dilatih ing deteksi obyek lan klasifikasi datasets, nanging uga entuk Darknet-19 minangka baseline anyar. model.

YOLOv2

Amarga YOLOv2 uga sukses gedhe lan cepet dadi model pangenalan obyek sing paling canggih, insinyur liyane wiwit nyoba algoritma kasebut lan ngasilake versi YOLO sing unik. Sawetara bakal dibahas ing macem-macem titik ing koran.

3. YOLOv3

Ing kertas"YOLOv3: Peningkatan Tambahan, "Joseph Redmon lan Ali Farhadi nerbitake versi anyar saka algoritma ing 2018. Iki dibangun ing arsitektur Darknet-53. Klasifikasi logistik independen ngganti mekanisme aktivasi softmax ing YOLOv3.

Rugi binar cross-entropy digunakake sajrone latihan. Darknet-19 ditingkatake lan dijenengi Darknet-53, sing saiki duwe 53 lapisan convolutional. Kajaba iku, ramalan kasebut ditindakake kanthi telung skala sing beda-beda, sing mbantu YOLOv3 nambah akurasi kanggo prédhiksi barang-barang cilik.

YOLOv3

YOLOv3 minangka versi YOLO pungkasan Joseph Redmon, amarga dheweke milih ora ngupayakake perbaikan YOLO luwih lanjut (utawa malah ing area visi komputer) supaya karyane ora kena pengaruh ing jagad iki. Saiki umume digunakake minangka titik wiwitan kanggo mbangun arsitektur deteksi obyek sing unik.

4. Yolov4

Alexey Bochkovskiy, Chien-Yao Wang, lan Hong-Yuan Mark Liao diterbitake "YOLOv4: Kacepetan lan Akurasi Optimal Deteksi Obyek"ing April 2020, yaiku pengulangan kaping papat saka algoritma YOLO.

Sambungan Sisa Bobot, Sambungan Cross-Stage-Partial, normalisasi mini-batch lintas, latihan mungsuh dhewe, aktivasi mish, blok drop, lan mundhut CIoU kabeh dikenalake minangka bagéan saka arsitektur SPDarknet53.

YOLOv4

YOLOv4 minangka turunan saka kulawarga YOLO, nanging dikembangake dening ilmuwan sing kapisah (dudu Joseph Redmon lan Ali Farhadi). tulang punggung SPDarknet53, pooling piramida spasial, PANet path-agregasi minangka gulu, lan sirah YOLOv3 nggawe arsitektur sawijining.

Akibaté, yen dibandhingake karo induke, YOLOv3, YOLOv4 entuk 10% Presisi Rata-rata sing luwih dhuwur lan 12% Bingkai Per Detik sing luwih apik.

5. YOLOv5

YOLOv5 minangka proyek open-source sing kalebu macem-macem model identifikasi obyek lan algoritma adhedhasar model YOLO sing wis dilatih ing dataset COCO.

YOLOv5 minangka koleksi model identifikasi obyek kanthi skala senyawa dilatih ing dataset COCO, kanthi kapabilitas gampang kanggo TTA, perakitan model, pangembangan hyperparameter, lan ekspor menyang ONNX, CoreML, lan TFLite. Amarga YOLOv5 ora ngetrapake utawa ngembangake pendekatan sing unik, makalah resmi ora bisa dirilis. Iku mung extension PyTorch YOLOv3.

Variasi YOLOv5

Ultranytics nggunakake skenario iki kanggo ngumumake versi "YOLO anyar" miturut sponsor. Amarga ana uga limang model sing wis dilatih sing bisa diakses, homepage YOLOv5 cukup prasaja lan disusun lan ditulis kanthi profesional, kanthi sawetara pelajaran lan saran babagan latihan lan nggunakake model YOLOv5.

YOLOv5 Kacepetan

watesan YOLO

Sanajan YOLO katon minangka teknik paling apik kanggo ngrampungake Deteksi obyek masalah, wis sawetara drawbacks. Amarga saben kothak mung bisa ngenali siji item, YOLO angel ndeteksi lan misahake barang-barang cilik ing gambar sing kedadeyan ing klompok. Bab-bab cilik ing grombolan, kayata grombolan semut, angel diidentifikasi lan ditemokake dening YOLO.

Yen dibandhingake karo metode identifikasi obyek sing luwih alon kaya Fast RCNN, YOLO uga ditondoi kanthi akurasi sing kurang.

Miwiti nggunakake YOLOv5

Yen sampeyan kasengsem ing ndeleng YOLOv5 ing tumindak, mriksa metu ing resmi GitHub lan YOLOv5 ing PyTorch.

kesimpulan

Versi awal YOLOv5 cepet banget, performa, lan gampang digunakake. Nalika YOLOv5 ora nambah arsitektur model anyar kanggo kulawarga YOLO, iku menehi latihan PyTorch anyar lan framework penyebaran sing nambah negara seni kanggo detektor obyek.

Salajengipun, YOLOv5 arang banget pangguna-loropaken lan "metu saka kothak" siap digunakake ing obyek bespoke.

Pambuka kanggo YOLO: Deteksi Obyek Wektu Nyata

Dadi, apa YOLO?

YOLO kerja