Obyektin aşkarlanması, neyron şəbəkənin təsvirdəki elementləri təxmin etdiyi və onların ətrafında məhdudlaşdırıcı qutular çəkdiyi təsvirin təsnifat növüdür. Əvvəlcədən təyin edilmiş siniflər dəstinə uyğun olan təsvirdə əşyaların aşkarlanması və lokallaşdırılması obyekt aşkarlama adlanır.
Obyektin aşkarlanması (həmçinin obyektin tanınması kimi tanınır) Computer Vision-ın xüsusilə əhəmiyyətli alt domenidir, çünki aşkarlama, identifikasiya və lokallaşdırma kimi vəzifələr real dünya kontekstlərində geniş tətbiq tapır.
YOLO yanaşması sizə bu vəzifələri yerinə yetirməyə kömək edə bilər. Bu essedə biz YOLO-ya daha yaxından nəzər salacağıq, o cümlədən onun nə olduğu, necə işlədiyi, müxtəlif variasiyaları və s.
Beləliklə, YOLO nədir?
YOLO fotoşəkillərdə real vaxtda obyektin identifikasiyası və tanınması üçün bir üsuldur. Bu, "Yalnız bir dəfə baxırsınız" ifadəsinin qısaldılmasıdır. Redmond və başqaları. yanaşmanı ilkin olaraq 2015-ci ildə IEEE/CVF Kompüter Görünüşü və Nümunələrin Tanınması Konfransında (CVPR) dərc edilmiş məqaləsində təklif etmişdir.
OpenCV Xalq Seçimi Mükafatı qəzetə verildi. Klassifikatorları aşkar etmək üçün təyin edən əvvəlki obyekt identifikasiyası üsullarından fərqli olaraq, YOLO uçdan-uca istifadə etməyi təklif edir. neyron şəbəkə Bu, eyni vaxtda məhdudlaşdırıcı qutuları və sinif ehtimallarını proqnozlaşdırır.
YOLO obyektin tanınmasına əsaslı şəkildə yeni yanaşma ilə, əvvəlki real vaxt obyekti aşkarlama üsullarını asanlıqla üstələməklə ən müasir nəticələr verir.
YOLO işləyir
YOLO metodu şəkli hər biri bərabər ölçülü SxS ölçülü sektora malik N torlara bölür. Bu N torların hər biri tərkibində olan obyektin aşkarlanması və yerləşdirilməsi üçün cavabdehdir.
Bu torlar, öz növbəsində, xana koordinatlarına nisbətən B məhdudlaşdırıcı qutu koordinatlarını, həmçinin elementin adını və xanada mövcud olma ehtimalını proqnozlaşdırır. Müxtəlif həddi olan qutu proqnozları ilə eyni elementi proqnozlaşdıran çoxlu hüceyrələrə görə, bu texnika hesablamanı əhəmiyyətli dərəcədə azaldır, çünki həm aşkarlama, həm də tanınma şəkildəki hüceyrələr tərəfindən idarə olunur.
Bununla belə, çoxlu dublikat proqnozlar verir. Bu problemi həll etmək üçün YOLO Qeyri-Maksimal Supressiyadan istifadə edir. YOLO Qeyri-Maksimal Bastırmada daha aşağı ehtimal xalları ilə bütün məhdudlaşdırıcı qutuları sıxışdırır.
YOLO bunu hər bir variantla əlaqəli ehtimal xallarını araşdıraraq və ən yüksək xal toplayanı seçməklə edir. Cari yüksək ehtimallı məhdudlaşdırıcı qutu ilə Birlik üzərində ən böyük kəsişmə ilə məhdudlaşdırıcı qutular daha sonra sıxışdırılır.
Bu proses bağlayıcı qutular tamamlanana qədər davam etdirilir.
YOLO-nun müxtəlif varyasyonları
Biz ən çox yayılmış YOLO versiyalarından bəzilərinə baxacağıq. Gəlin başlayaq.
1. YOLOv1
İlkin YOLO versiyası 2015-ci ildə nəşrdə elan edildi "Siz yalnız bir dəfə baxırsınız: vahid, real vaxtda obyektin aşkarlanması” Joseph Redmon, Santosh Divvala, Ross Girshick və Əli Fərhadi tərəfindən.
Sürətinə, dəqiqliyinə və öyrənmə qabiliyyətinə görə YOLO tez bir zamanda obyektin identifikasiyası sahəsində üstünlük təşkil etdi və ən çox istifadə edilən alqoritmə çevrildi. Müəlliflər obyektin aşkarlanmasına təsnifat məsələsi kimi müraciət etməkdənsə, ona coğrafi cəhətdən ayrılmış sərhəd qutuları və əlaqəli sinif ehtimalları ilə reqressiya problemi kimi yanaşdılar və bu problemi tək bir problemlə həll etdilər. neyron şəbəkə.
YOLOv1 real vaxt rejimində saniyədə 45 kadr sürətlə fotoşəkilləri emal etdi, daha kiçik bir variant olan Fast YOLO isə saniyədə 155 kadr sürətlə emal etdi və yenə də digər real vaxt detektorlarından ikiqat mAP əldə etdi.
2. YOLOv2
Bir il sonra, 2016-cı ildə, Cozef Redmon və Əli Fərhadi YOLOv2 (həmçinin YOLO9000 kimi tanınır) adlı qəzetdə yayımladılar.YOLO9000: Daha yaxşı, daha sürətli, daha güclü".
Modelin hələ də real vaxt rejimində işləyərkən hətta 9000 fərqli element kateqoriyasını proqnozlaşdırmaq qabiliyyəti ona 9000 adını qazandırdı. Yeni model versiyası eyni vaxtda obyektlərin aşkarlanması və təsnifat məlumat dəstləri üzrə öyrədilmədi, həm də yeni baza kimi Darknet-19-u əldə etdi. model.
YOLOv2 də böyük uğur qazandığından və tez bir zamanda növbəti ən müasir obyekt tanıma modelinə çevrildiyindən, digər mühəndislər alqoritmlə təcrübə aparmağa və öz unikal YOLO versiyalarını istehsal etməyə başladılar. Onlardan bəziləri məqalənin müxtəlif yerlərində müzakirə olunacaq.
3. YOLOv3
Qəzetdə “YOLOv3: Artan Təkmilləşdirmə,” Cozef Redmon və Əli Fərhadi 2018-ci ildə alqoritmin yeni versiyasını dərc ediblər. O, Darknet-53 arxitekturasında qurulub. Müstəqil logistik təsnifatçılar YOLOv3-də softmax aktivləşdirmə mexanizmini əvəz etdi.
Təlim zamanı ikili çarpaz entropiya itkisindən istifadə edilmişdir. Darknet-19 təkmilləşdi və indi 53 bükülmə təbəqəsi olan Darknet-53 adlandırıldı. Bundan əlavə, proqnozlar üç fərqli miqyasda aparıldı ki, bu da YOLOv3-ə xırda şeyləri proqnozlaşdırmaqda dəqiqliyini artırmağa kömək etdi.
YOLOv3 Cozef Redmonun son YOLO versiyası idi, çünki o, işinin dünyaya zərərli təsir göstərməməsi üçün hər hansı əlavə YOLO təkmilləşdirmələri (və ya hətta kompüterin görmə sahəsində) üzərində işləməməyi seçdi. İndi daha çox unikal obyekt aşkarlama arxitekturalarının qurulması üçün başlanğıc nöqtəsi kimi istifadə olunur.
4. Yolov4
Alexey Bochkovskiy, Chien-Yao Wang və Hong-Yuan Mark Liao "YOLOv4: Obyektin aşkarlanmasının optimal sürəti və dəqiqliyi” 2020-ci ilin aprelində YOLO alqoritminin dördüncü iterasiyası idi.
Çəkili Qalıq Əlaqələr, Mərhələlərarası Qismən Əlaqələr, çarpaz mini-toplu normallaşdırma, öz-özünə qarşıdurma təlimi, səhv aktivləşdirmə, düşmə bloku və CIoU itkisi hamısı SPDarknet53 arxitekturasının bir hissəsi kimi təqdim edildi.
YOLOv4 YOLO ailəsinin nəslindəndir, lakin o, ayrı-ayrı alimlər (Cozef Redmon və Əli Fərhadi deyil) tərəfindən hazırlanmışdır. SPDarknet53 onurğa sütunu, məkan piramidasının birləşdirilməsi, boyun kimi PANet yol-aqreqasiyası və YOLOv3 başlığı onun arxitekturasını təşkil edir.
Nəticədə, YOLOv3 ilə müqayisədə YOLOv4 10% daha yüksək Orta Dəqiqliyə və 12% daha yaxşı Saniyədə Kadrlar göstəricilərinə nail olur.
5. YOLOv5
YOLV5 COCO verilənlər bazasında əvvəlcədən təlim keçmiş YOLO modelinə əsaslanan bir sıra obyekt identifikasiyası modelləri və alqoritmlərini özündə birləşdirən açıq mənbəli layihədir.
YOLOv5 mürəkkəb miqyaslı obyekt identifikasiyası modellərinin toplusudur TTA, modellərin yığılması, hiperparametrlərin işlənməsi və ONNX, CoreML və TFLite-ə ixrac üçün asan imkanlarla COCO verilənlər bazasında təlim keçmişdir. YOLOv5 heç bir unikal yanaşma tətbiq etmədiyi və ya inkişaf etdirmədiyi üçün rəsmi sənəd buraxıla bilmədi. Bu, sadəcə olaraq YOLOv3-ün PyTorch uzantısıdır.
Ultranytics sponsorluğu altında "yeni YOLO" versiyasını ictimailəşdirmək üçün bu ssenaridən istifadə etdi. Əvvəlcədən hazırlanmış beş model də əlçatan olduğundan, YOLOv5 ana səhifəsi YOLOv5 modellərinin təlimi və istifadəsi ilə bağlı bir sıra dərslər və təkliflərlə kifayət qədər sadə və peşəkar şəkildə strukturlaşdırılmış və yazılmışdır.
YOLO məhdudiyyətləri
Baxmayaraq ki, YOLO həll etmək üçün ən böyük texnika kimi görünür obyekt aşkarlanması problemlər, onun bir sıra çatışmazlıqları var. Hər bir şəbəkə yalnız bir elementi müəyyən edə bildiyi üçün YOLO qruplar halında baş verən şəkillərdəki kiçik şeyləri aşkar etmək və ayırmaqda çətinlik çəkir. Qarışqa sürüsü kimi sürülərdəki xırda şeyləri YOLO üçün müəyyən etmək və tapmaq çətindir.
Sürətli RCNN kimi əhəmiyyətli dərəcədə yavaş olan obyekt identifikasiyası üsulları ilə müqayisədə YOLO eyni zamanda daha az dəqiqliklə xarakterizə olunur.
YOLOv5 istifadə etməyə başlayın
Əgər YOLOv5-in fəaliyyətdə olduğunu görmək istəyirsinizsə, baxın rəsmi GitHub və PyTorch-da YOLOv5.
Nəticə
YOLOv5-in ilkin versiyası son dərəcə sürətli, performanslı və istifadəsi sadədir. YOLOv5 YOLO ailəsinə heç bir yeni model arxitekturasını əlavə etməsə də, obyekt detektorları üçün ən müasir vəziyyəti yaxşılaşdıran yeni PyTorch təlim və yerləşdirmə çərçivəsini təmin edir.
Bundan əlavə, YOLOv5 son dərəcə istifadəçi dostudur və sifarişli obyektlərdə istifadəyə hazır "qutudan çıxır".
Cavab yaz