YOLO جو تعارف: حقيقي وقت اعتراض جي سڃاڻپ

مواد جي جدول[لڪ][ڏسو]

پوء، YOLO ڇا آهي؟
يولو ڪم ڪري رهيو آهي
YOLO جي مختلف تبديليون+-
YOLO حدون
استعمال ڪرڻ شروع ڪريو YOLOv5
ٿڪل

اعتراض جو پتو لڳائڻ تصوير جي درجه بندي جو هڪ قسم آهي جنهن ۾ هڪ نيورل نيٽ ورڪ هڪ تصوير ۾ شيون پيش ڪري ٿو ۽ انهن جي چوڌاري بائونڊنگ باڪس ٺاهي ٿو. ھڪڙي تصوير ۾ شين کي ڳولڻ ۽ مقامي ڪرڻ جيڪا ڪلاس جي اڳئين سيٽ سان مطابقت رکي ٿي اعتراض جي ڳولا جي طور تي حوالو ڏنو ويو آھي.

آبجیکٹ جي سڃاڻپ (جنهن کي اعتراض جي سڃاڻپ جي نالي سان پڻ سڃاتو وڃي ٿو) خاص طور تي ڪمپيوٽر ويزن جو هڪ اهم ذيلي ڊومين آهي ڇاڪاڻ ته ڪم جهڙوڪ ڳولڻ، سڃاڻپ، ۽ لوڪلائيزيشن حقيقي دنيا جي حوالي سان وسيع ايپليڪيشن ڳوليندا آهن.

YOLO طريقه ڪار توهان کي انهن ڪمن ۾ مدد ڪري سگهي ٿي. هن مضمون ۾، اسان يولو تي ويجھو نظر وجهنداسين، جنهن ۾ اهو ڇا آهي، اهو ڪيئن ڪم ڪري ٿو، مختلف تبديليون، ۽ وڌيڪ.

پوء، YOLO ڇا آهي؟

YOLO هڪ طريقو آهي حقيقي وقت اعتراض جي سڃاڻپ ۽ تصويرن ۾ سڃاڻپ لاءِ. اهو هڪ مخفف آهي توهان لاءِ صرف هڪ ڀيرو ڏسو. Redmond et al. تجويز ڪيل طريقي کي هڪ مقالي ۾ پيش ڪيو جيڪو شروعاتي طور تي 2015 ۾ IEEE/CVF ڪانفرنس آن ڪمپيوٽر ويزن ۽ پيٽرن ريڪگنيشن (CVPR) ۾ شايع ڪيو ويو.

پيپر کي OpenCV People's Choice Award ڏنو ويو. اڳئين اعتراض جي سڃاڻپ جي طريقن جي برعڪس، جيڪي درجه بندي ڪرڻ وارن کي ٻيهر استعمال ڪرڻ جي ڳولا ڪن ٿا، YOLO تجويز ڪري ٿو استعمال جي آخر کان آخر تائين نظرياتي نيٽورڪ جيڪو هڪ ئي وقت بائونڊنگ باڪس ۽ ڪلاس جي امڪانن جي اڳڪٿي ڪري ٿو.

YOLO جديد ترين نتيجا پيدا ڪري ٿو بنيادي طور تي نئين طريقي سان اعتراض جي سڃاڻپ لاءِ، آسانيءَ سان اڳئين حقيقي وقت اعتراض جي ڳولا جي طريقن کي ختم ڪندي.

يولو ڪم ڪري رهيو آهي

YOLO طريقو تصوير کي N grids ۾ ورهائي ٿو، هر هڪ برابر سائز جي SxS طول و عرض واري شعبي سان. انهن مان هر هڪ N گرڊ ان شئي کي ڳولڻ ۽ ڳولڻ جو انچارج آهي جنهن ۾ شامل آهي.

يولو آرڪيٽيڪچر

اهي گرڊ، موڙ ۾، اڳڪٿي ڪن ٿا B بائونڊنگ باڪس سيل ڪوآرڊينيٽس سان لاڳاپو رکي ٿو، انهي سان گڏ شئي جو نالو ۽ امڪان جو سيل ۾ موجود هجڻ جو. ڪيترن ئي سيلز جي ڪري مختلف بائونڊنگ باڪس جي اڳڪٿين سان هڪ ئي شيءِ جي اڳڪٿي ڪري ٿي، هي ٽيڪنڪ ڪافي حساب سان گھٽائي ٿي ڇاڪاڻ ته ٻنهي جي سڃاڻپ ۽ سڃاڻپ تصوير مان سيلز ذريعي سنڀالي ويندي آهي.

بهرحال، اهو تمام گهڻو نقل پيش ڪري ٿو. هن مسئلي کي حل ڪرڻ لاء، YOLO غير وڌ کان وڌ دٻاء کي ملازمت ڪري ٿو. YOLO سڀني بائونڊنگ باڪس کي دٻائي ٿو گھٽ امڪاني اسڪور سان غير وڌ کان وڌ دٻاءُ ۾.

YOLO اهو هر اختيار سان ڳنڍيل امڪاني اسڪور کي جانچڻ ۽ اعليٰ اسڪور سان هڪ کي چونڊڻ سان ڪري ٿو. موجوده اعلي امڪاني بائونڊنگ باڪس سان يونين مٿان سڀ کان وڏي چونڪ سان گڏ بائونڊنگ باڪس پوءِ دٻجي ويندا آهن.

يولو ڪم ڪندڙ

اهو عمل جاري آهي جيستائين بائونڊنگ باڪس مڪمل ٿي وڃن.

YOLO جي مختلف تبديليون

اسان ڏسنداسين ڪجھ عام YOLO ورجن. اچو ته شروع ڪريون.

1. يوولو 1

شروعاتي YOLO ورجن جو اعلان 2015 ۾ اشاعت ۾ ڪيو ويو "توهان صرف هڪ ڀيرو ڏسو: متحد، حقيقي وقت اعتراض جي ڳولاجوزف ريڊمون، سنتوش ديوالا، راس گرشڪ، ۽ علي فرهادي طرفان.

ان جي رفتار، درستگي، ۽ سکيا جي صلاحيت جي ڪري، YOLO جلدي آبجیکٹ جي سڃاڻپ جي علائقي تي غلبہ حاصل ڪيو ۽ سڀ کان وڌيڪ استعمال ٿيل الگورتھم بڻجي ويو. اعتراض جي سڃاڻپ کي درجي بندي جي مسئلي جي طور تي خطاب ڪرڻ بدران، ليکڪن ان کي رجعت جي مسئلي جي طور تي جغرافيائي طور تي الڳ ٿيل بائونڊنگ باڪس ۽ لاڳاپيل طبقي امڪانن سان رابطو ڪيو، جنهن کي انهن هڪ واحد استعمال ڪندي حل ڪيو. نظرياتي نيٽورڪ.

يوولو 1

YOLOv1 ريئل ٽائيم ۾ 45 فريم في سيڪنڊ تي فوٽوز کي پروسيس ڪيو، جڏهن ته هڪ ننڍڙو ويرينٽ، فاسٽ يولو، 155 فريم في سيڪنڊ تي پروسيس ڪيو ويو ۽ اڃا تائين ٻين حقيقي وقت جي ڊيڪٽرن جي ڀيٽ ۾ ٻيڻو ايم اي پي حاصل ڪيو.

2. يوولو 2

هڪ سال بعد، 2016 ۾، جوزف ريڊمون ۽ علي فرهادي اخبار ۾ YOLOv2 (پڻ YOLO9000 طور سڃاتو وڃي ٿو) جاري ڪيو.YOLO9000: بهتر، تيز، مضبوط. "

ماڊل جي 9000 ڌار ڌار شين جي ڪيٽيگريز جي اڳڪٿي ڪرڻ جي صلاحيت اڃا تائين حقيقي وقت ۾ هلندي ان کي نامزدگي 9000 حاصل ڪئي. نه رڳو نئين ماڊل ورزن کي هڪ ئي وقت آبجیکٹ ڳولڻ ۽ درجه بندي ڊيٽا سيٽن تي تربيت ڏني وئي، پر ان کي ڊارڪ نيٽ-19 پڻ نئين بيس لائين طور مليو. ماڊل

يوولو 2

ڇاڪاڻ ته YOLOv2 پڻ هڪ وڏي ڪاميابي هئي ۽ جلدي طور تي ايندڙ جديد ترين شئي جي سڃاڻپ جو نمونو بڻجي ويو، ٻين انجنيئرن الگورتھم سان تجربا ڪرڻ شروع ڪيا ۽ پنهنجو، منفرد YOLO ورزن تيار ڪيو. انهن مان ڪجهه مضمونن ۾ مختلف نقطن تي بحث ڪيو ويندو.

3. يوولو 3

اخبار ۾ ”YOLOv3: هڪ واڌارو سڌارو”جوزف ريڊمون ۽ علي فرهادي 2018 ۾ الگورتھم جو نئون ورزن شايع ڪيو. اھو ڊارڪ نيٽ-53 آرڪيٽيڪچر تي ٺاھيو ويو. آزاد لاجسٽڪ طبقي کي تبديل ڪيو ويو softmax چالو ميڪانيزم YOLOv3 ۾.

ٽريننگ دوران بائنري پار-انٽروپي نقصان استعمال ڪيو ويو. Darknet-19 کي وڌايو ويو ۽ ان جو نالو تبديل ڪري Darknet-53 رکيو ويو، جنھن ۾ ھاڻي 53 ٺھيل پرت آھن. ان کان سواءِ، اڳڪٿيون ٽن مختلف اسڪيلن تي ڪيون ويون، جن YOLOv3 کي ننڍين شين جي اڳڪٿي ڪرڻ ۾ ان جي درستگي کي وڌائڻ ۾ مدد ڪئي.

يوولو 3

YOLOv3 جوزف ريڊمون جو آخري YOLO ورزن هو، ڇاڪاڻ ته هن پنهنجي ڪم جي دنيا تي نقصانڪار اثر کان بچڻ لاءِ ڪنهن به وڌيڪ YOLO بهتري (يا ڪمپيوٽر جي ويزن واري علائقي ۾ به) تي ڪم نه ڪرڻ جو انتخاب ڪيو. اهو هاڻي اڪثر ڪري هڪ شروعاتي نقطي طور استعمال ڪيو ويندو آهي منفرد اعتراض جي سڃاڻپ آرڪيٽيڪچر جي تعمير لاء.

4. يولوف4

Alexey Bochkovskiy، Chien-Yao Wang، ۽ Hong-Yuan Mark Liao شايع ٿيل "YOLOv4: بهترين رفتار ۽ اعتراض جي چڪاس جي درستگي”اپريل 2020 ۾، جيڪو YOLO الگورتھم جو چوٿون ورجاءُ هو.

Weighted Residual Connections, Cross-Stage-Partial Connections, Cross Mini-batch normalization, self-adversarial training, mish activation, drop block, and CIoU نقصان سڀ SPDarknet53 فن تعمير جي حصي طور متعارف ڪرايا ويا.

يوولو 4

YOLOv4 YOLO خاندان جو هڪ اولاد آهي، جڏهن ته، اهو الڳ سائنسدانن (نه جوزف ريڊمون ۽ علي فرهادي) پاران ترقي ڪئي وئي آهي. SPDarknet53 ريبون، spatial pyramid pooling، PANet path-agregation as neck، ۽ YOLOv3 هيڊ ان جي اڏاوت ٺاهي ٿو.

نتيجي طور، جڏھن ان جي والدين جي مقابلي ۾، YOLOv3، YOLOv4 حاصل ڪري ٿو 10٪ اعلي اوسط درستي ۽ 12٪ بهتر فريم في سيڪنڊ ميٽرڪس.

5. يوولو 5

يوولو 5 هڪ اوپن سورس پروجيڪٽ آهي جنهن ۾ YOLO ماڊل جي بنياد تي اعتراض جي سڃاڻپ جا ماڊل ۽ الگورٿمز شامل آهن جن کي COCO ڊيٽا سيٽ تي اڳي تربيت ڏني وئي آهي.

YOLOv5 مرڪب-اسڪيل اعتراض جي سڃاڻپ ماڊلز جو هڪ مجموعو آهي COCO ڊيٽا سيٽ تي تربيت ڏني وئي، TTA، ماڊل اسيمبلي، هائپرپيراميٽر ڊولپمينٽ، ۽ ONNX، CoreML، ۽ TFLite لاءِ آسان صلاحيتن سان. ڇاڪاڻ ته YOLOv5 ڪنهن به منفرد طريقي تي عمل يا ترقي نٿو ڪري، رسمي پيپر جاري نه ٿي سگهيو. اهو صرف YOLOv3 جي PyTorch جي واڌ آهي.

YOLOv5 تبديليون

الٽرانائيٽڪس هن منظرنامي کي استعمال ڪرڻ لاءِ استعمال ڪيو ”نئين يولو“ ورزن کي ان جي اسپانسر شپ تحت. ڇاڪاڻ ته اتي پڻ پنج اڳ-تربيت ٿيل ماڊل دستياب آهن، YOLOv5 هوم صفحو بلڪل سڌو ۽ پيشه ورانه ترتيب ۽ لکيل آهي، جنهن ۾ YOLOv5 ماڊلز جي تربيت ۽ استعمال بابت ڪيترائي سبق ۽ تجويزون آهن.

YOLOv5 اسپيڊ

YOLO حدون

جيتوڻيڪ YOLO حل ڪرڻ لاء سڀ کان وڏو ٽيڪنڪ نظر اچي ٿو اعتراض جي ڳولا مسئلا، ان ۾ ڪيتريون ئي خاميون آهن. ڇاڪاڻ ته هر گرڊ صرف هڪ شيءِ جي سڃاڻپ ڪري سگهي ٿو، YOLO کي ڏکيائين کي ڳولڻ ۽ الڳ ڪرڻ ۾ مشڪل آهي ننڍين شين کي تصويرن ۾ جيڪي گروپن ۾ ٿين ٿيون. ننڍيون ننڍيون شيون، جھڙوڪ ڪيٽين جو جھنڊو، YOLO لاءِ سڃاڻڻ ۽ ڳولڻ مشڪل آھي.

جڏهن ته تيز رفتار RCNN وانگر خاص طور تي سست اعتراض جي سڃاڻپ جي طريقن جي مقابلي ۾، YOLO پڻ گهٽ درستگي سان منسوب ڪيو ويو آهي.

استعمال ڪرڻ شروع ڪريو YOLOv5

جيڪڏھن توھان ڏسڻ ۾ دلچسپي رکو ٿا YOLOv5 عمل ۾، چيڪ ڪريو سرڪاري GitHub ۽ PyTorch ۾ YOLOv5.

ٿڪل

YOLOv5 جو شروعاتي نسخو انتهائي تيز، ڪارڪردگيءَ وارو، ۽ استعمال ڪرڻ آسان آهي. جڏهن ته YOLOv5 YOLO خاندان ۾ ڪنهن به نئين ماڊل آرڪيٽيڪچر کي شامل نٿو ڪري، اهو هڪ نئون PyTorch ٽريننگ ۽ ڊيپلائيمينٽ فريم ورڪ مهيا ڪري ٿو جيڪو آبجیکٹ ڊيڪٽرز لاءِ آرٽ جي حالت کي بهتر بڻائي ٿو.

ان کان علاوه، YOLOv5 انتهائي صارف دوست آهي ۽ "باڪس کان ٻاهر" اچي ٿو تيار ڪيل شين تي استعمال ڪرڻ لاءِ.

YOLO جو تعارف: حقيقي وقت اعتراض جي چڪاس

پوء، YOLO ڇا آهي؟

يولو ڪم ڪري رهيو آهي