Deteksyon objè se yon kalite kategorizasyon imaj kote yon rezo neral antisipe atik nan yon imaj epi trase bwat limit alantou yo. Detekte ak lokalize bagay sa yo nan yon imaj ki konfòm ak yon seri klas prereglaj refere yo kòm deteksyon objè.
Deteksyon objè (ke yo rele tou rekonesans objè) se yon sou-domèn patikilyèman enpòtan nan Vizyon Odinatè paske travay tankou deteksyon, idantifikasyon, ak lokalizasyon jwenn gwo aplikasyon nan kontèks mond reyèl la.
Apwòch YOLO ka ede w fè travay sa yo. Nan redaksyon sa a, nou pral pran yon gade pi pre sou YOLO, ki gen ladan sa li ye, ki jan li fonksyone, diferan varyasyon, ak plis ankò.
Se konsa, ki sa ki YOLO?
YOLO se yon metòd pou idantifikasyon ak rekonesans objè an tan reyèl nan foto yo. Li se yon akwonim pou You Only Look Once. Redmond et al. te pwopoze apwòch la nan yon papye ki te okòmansman pibliye an 2015 nan Konferans IEEE/CVF sou vizyon òdinatè ak rekonesans modèl (CVPR).
OpenCV People's Choice Award te bay papye a. Kontrèman ak metòd idantifikasyon objè anvan yo, ki repurpose klasifikatè pou fè deteksyon, YOLO pwopoze itilizasyon yon fen-a-fen. nè rezo ki predi bwat limit ak pwobabilite klas yo ansanm.
YOLO pwodui rezilta modèn yo lè li pran yon nouvo apwòch fondamantal pou rekonesans objè, fasil depase metòd deteksyon objè an tan reyèl anvan yo.
YOLO ap travay
Metòd YOLO divize foto a an N grilles, yo chak ak yon sektè dimansyon SxS egal-gwosè. Chak nan N grilles sa yo responsab pou detekte ak lokalize objè li genyen an.
Kadriyaj sa yo, nan vire, prevwa kowòdone bwat limit B yo parapò ak kowòdone selil yo, osi byen ke non atik la ak chans pou objè a prezan nan selil la. Akòz anpil selil ki prevwa menm atik la ak divès kalite prediksyon bwat limit, teknik sa a konsiderableman diminye kalkil paske tou de deteksyon ak rekonesans yo okipe pa selil ki soti nan foto a.
Sepandan, li pwodui anpil prediksyon kopi. Pou adrese pwoblèm sa a, YOLO anplwaye Sipresyon ki pa maksimòm. YOLO siprime tout bwat limit ki gen pi ba nòt pwobabilite nan Sipresyon ki pa maksimòm.
YOLO fè sa nan egzamine nòt pwobabilite ki lye ak chak opsyon epi chwazi youn nan nòt ki pi wo a. Lè sa a, yo elimine bwat delimitasyon ki gen pi gwo Entèseksyon sou Inyon ak bwat limit pwobabilite aktyèl la.
Pwosesis sa a kontinye jiskaske bwat limit yo fini.
Diferan varyasyon nan YOLO
Nou pral gade kèk nan vèsyon YOLO ki pi komen yo. An n kòmanse.
1. YOLOv1
Yo te anonse premye vèsyon YOLO an 2015 nan piblikasyon "Ou gade sèlman yon fwa: Inifye, an tan reyèl Deteksyon objè” pa Joseph Redmon, Santosh Divvala, Ross Girshick, ak Ali Farhadi.
Akòz vitès li yo, presizyon, ak kapasite aprantisaj, YOLO byen vit domine zòn nan nan idantifikasyon objè epi li te vin algorithm ki pi lajman itilize. Olye ke yo adrese deteksyon objè kòm yon pwoblèm klasifikasyon, otè yo te apwoche li kòm yon pwoblèm regresyon ak bwat limit jewografik separe ak pwobabilite klas ki asosye yo, ke yo rezoud lè l sèvi avèk yon sèl. nè rezo.
YOLOv1 trete foto nan 45 ankadreman pou chak segonn an tan reyèl, tandiske yon variant ki pi piti, Fast YOLO, trete nan 155 ankadreman pou chak segonn epi li toujou jwenn doub kat la nan lòt detektè an tan reyèl.
2. YOLOv2
Yon ane pita, nan 2016, Joseph Redmon ak Ali Farhadi te pibliye YOLOv2 (yo rele tou YOLO9000) nan papye a "YOLO9000: Pi bon, pi vit, pi fò".
Kapasite modèl la pou prevwa menm 9000 kategori atik distenk pandan li toujou ap kouri an tan reyèl te fè li deziyasyon 9000. Non sèlman nouvo vèsyon modèl la te resevwa fòmasyon an menm tan sou deteksyon objè ak gwoup done klasifikasyon, men li te resevwa tou Darknet-19 kòm nouvo debaz la. modèl.
Paske YOLOv2 te tou yon gwo siksè epi li te vin byen vit pwochen modèl rekonesans objè eta-of-atizay la, lòt enjenyè yo te kòmanse fè eksperyans ak algorithm la ak pwodwi pwòp, inik vèsyon YOLO yo. Kèk nan yo pral diskite nan plizyè pwen nan papye a.
3. YOLOv3
Nan papye a "YOLOv3: Yon Amelyorasyon Enkreman,” Joseph Redmon ak Ali Farhadi pibliye yon nouvo vèsyon algorithm nan 2018. Li te bati sou achitekti Darknet-53 la. Klasifikasyon lojistik endepandan ranplase mekanis deklanchman softmax nan YOLOv3.
Pèt binè kwa-entropi a te itilize pandan fòmasyon. Darknet-19 te amelyore epi chanje non Darknet-53, ki kounye a gen 53 kouch konvolusyonèl. Anplis de sa, prediksyon yo te fè sou twa echèl diferan, ki te ede YOLOv3 amelyore presizyon li nan predi ti bagay.
YOLOv3 te vèsyon final YOLO Joseph Redmon a, paske li te chwazi pa travay sou okenn lòt amelyorasyon YOLO (oswa menm nan zòn nan vizyon òdinatè) nan lòd pou evite travay li gen yon enfliyans prejidis sou mond lan. Kounye a li se sitou itilize kòm yon pwen depa pou konstwi achitekti inik objè-deteksyon.
4. Yolov4
Alexey Bochkovskiy, Chien-Yao Wang, ak Hong-Yuan Mark Liao pibliye "YOLOv4: Optimal vitès ak presizyon nan deteksyon objè” an avril 2020, ki te katriyèm iterasyon algorithm YOLO la.
Koneksyon rès pondéré, Koneksyon kwa-etap-pasyèl, nòmalizasyon kwa mini-pakèt, fòmasyon oto-adversarial, deklanchman mish, blòk gout, ak pèt CIoU yo tout te prezante kòm yon pati nan achitekti SPDarknet53 la.
YOLOv4 se yon desandan fanmi YOLO, sepandan, li te devlope pa syantis separe (pa Joseph Redmon ak Ali Farhadi). SPDarknet53 zo rèl do, espasyal piramid pisin, PANet chemen-agregasyon kòm kou, ak tèt YOLOv3 fè achitekti li yo.
Kòm yon konsekans, lè yo konpare ak paran li yo, YOLOv3, YOLOv4 reyalize 10% pi wo Precision Mwayèn ak 12% pi bon ankadreman pou chak segonn.
5. YOLOv5
YOLOv5 se yon pwojè sous louvri ki gen ladann yon seri de modèl idantifikasyon objè ak algoritm ki baze sou modèl YOLO ki te antrene davans sou seri done COCO.
YOLOv5 se yon koleksyon modèl idantifikasyon objè konpoze-echèl fòme sou done COCO a, ak kapasite fasil pou TTA, asanble modèl, devlopman hyperparameter, ak ekspòtasyon nan ONNX, CoreML, ak TFLite. Paske YOLOv5 pa aplike oswa devlope nenpòt apwòch inik, papye fòmèl la pa t 'kapab lage. Se tou senpleman ekstansyon PyTorch YOLOv3 a.
Ultranytics te sèvi ak senaryo sa a pou pibliye "nouvo YOLO" vèsyon an anba parennaj li. Paske gen senk modèl pre-antrènman aksesib tou, paj dakèy YOLOv5 la byen senp epi li estriktire ak ekri pwofesyonèl, ak yon kantite leson ak sijesyon sou fòmasyon ak itilizasyon modèl YOLOv5 yo.
YOLO limit
Malgre ke YOLO parèt pi gwo teknik pou rezoud deteksyon objè pwoblèm, li gen yon kantite dezavantaj. Paske chak kadriyaj ka idantifye sèlman yon atik, YOLO gen difikilte pou detekte ak separe ti bagay nan foto ki fèt an gwoup. Ti bagay ki nan bann, tankou yon foumi, yo difisil pou YOLO idantifye ak lokalize.
Lè yo konpare ak metòd idantifikasyon objè siyifikativman pi dousman tankou Fast RCNN, YOLO se menm jan an karakterize pa pi piti presizyon.
Kòmanse itilize YOLOv5
Si w enterese wè yon YOLOv5 an aksyon, tcheke deyò ofisyèl GitHub ak YOLOv5 nan PyTorch.
konklizyon
Vèsyon inisyal YOLOv5 a trè rapid, pèfòmans, ak senp pou itilize. Pandan ke YOLOv5 pa ajoute okenn nouvo achitekti modèl nan fanmi YOLO, li bay yon nouvo fòmasyon PyTorch ak kad deplwaman ki amelyore eta nan atizay la pou detektè objè.
Anplis de sa, YOLOv5 trè fasil pou itilize epi li soti "soti nan bwat la" pare pou itilize sou objè ki fèt sou mezi.
Kite yon Reply