Vedîtina tiştan celebek kategorîzekirina wêneyê ye ku tê de torgilokek neuralî hêmanên di wêneyekê de pêşbîn dike û qutiyên sînor li dora wan xêz dike. Tesbîtkirin û cîbicîkirina tiştên di wêneyekî de ku li gorî komek çînên pêşwextkirî ye, wekî tespîtkirina tiştan tê binav kirin.
Tespîtkirina objeyê (ku wekî nasîna objektê jî tê zanîn) bi taybetî binavûdengek girîng a Vîzyona Computerê ye ji ber ku peywirên mîna vedîtin, nasandin û herêmîkirin di çarçoveyek cîhana rastîn de serîlêdana berfireh peyda dikin.
Nêzîkatiya YOLO dikare ji we re bibe alîkar ku hûn van karan bikin. Di vê gotarê de, em ê ji nêz ve li YOLO mêze bikin, di nav de ew çi ye, çawa dixebite, guhertoyên cihêreng, û hêj bêtir.
Ji ber vê yekê, YOLO çi ye?
YOLO rêbazek e ji bo tespîtkirin û naskirina tiştan di wêneyan de di dema rast de. Ew kurtenivîsek e ji bo Hûn Tenê Carekê Dinihêrin. Redmond et al. di kaxezek de ku di destpêkê de di 2015-an de li Konferansa IEEE/CVF li ser Vîzyona Computer û Naskirina Nimûnê (CVPR) hate weşandin, nêzîkatî pêşniyar kir.
Xelata Hilbijartina Gel a OpenCV ji rojnameyê re hat dayîn. Berevajî rêbazên berê yên nasîna tiştan, ku ji nû ve dabeşkeran ji bo tespîtkirinê vedihewîne, YOLO karanîna dawiya-bi-dawî pêşniyar dike. torê neural ku qutiyên sînorkirî û îhtîmalên pola bi hevdemî pêşbînî dike.
YOLO encamên herî nûjen çêdike bi rêgezek bingehîn a nû ji bo naskirina tiştan, bi hêsanî ji rêgezên berê yên vedîtina tiştan di dema rast de derbas dibe.
YOLO dixebitin
Rêbaza YOLO wêneyê li N torgilokan dabeş dike, her yek bi sektorek mezinahiya SxS-ê ya wekhev. Her yek ji van N şebekeyan ji bo vedîtin û bi cih kirina tişta ku tê de ye berpirsiyar e.
Ev şebek, di encamê de, koordînatên qutiya sînorkirî ya B-yê li gorî koordînatên şaneyê, û her weha nav û îhtîmala hebûna tiştê di şaneyê de pêşbîn dikin. Ji ber ku gelek şaneyên ku heman tişt bi pêşbîniyên qutiya sînor ên cihêreng texmîn dikin, ev teknîk bi giranî hesabkirinê kêm dike ji ber ku hem vedîtin û hem jî naskirin ji hêla hucreyên ji wêneyê ve têne rêve kirin.
Lêbelê, ew gelek pêşbîniyên dubare çêdike. Ji bo çareserkirina vê pirsgirêkê, YOLO Suppression Ne-Maximal bi kar tîne. YOLO di Tepeserkirina Ne-Maksîmal de hemî qutiyên sînorî yên bi îhtîmala kêmtir ditepisîne.
YOLO vê yekê bi vekolîna hejmarên îhtîmalê yên ku bi her vebijarkê ve girêdayî ne û bijartina ya ku puana herî bilind hildibijêre dike. Dûv re qutiyên sînor ên ku di ser Yekîtiyê de herî mezin di nav hev de ye bi qutiya sînorkirî ya bi îhtimaleke mezin a heyî têne girtin.
Ev pêvajo heta ku qutiyên sînor temam bibin berdewam dike.
Guhertoyên cûda yên YOLO
Em ê li hin guhertoyên herî gelemperî yên YOLO binêrin. Werin em dest pê bikin.
1. YOLOv1
Guhertoya destpêkê ya YOLO di sala 2015-an de di weşanê de "Hûn Tenê Carekê Dinihêrin: Yekgirtî, Tespîtkirina Tiştên Rast-Time” ji hêla Joseph Redmon, Santosh Divvala, Ross Girshick, û Ali Ferhadi.
Ji ber leza xwe, rastbûn û jêhatîbûna xwe ya fêrbûnê, YOLO zû serdestiya qada nasnameya objektê kir û bû algorîtmaya ku herî zêde tê bikar anîn. Li şûna ku vedîtina tiştan wekî pirsgirêkek dabeşkirinê binirxînin, nivîskaran wê wekî pirsgirêkek paşvekêşanê ya bi qutiyên sînorkirî yên ji hêla erdnîgarî veqetandî û îhtîmalên çîna têkildar re, ku wan bi karanîna yekane çareser kirin nêzîk kirin. torê neural.
YOLOv1 wêneyan bi 45 çarçowe di çirkeyê de di wextê rast de hildiberîne, lê guhertoyek piçûktir, Fast YOLO, di 155 çarçove di çirkeyê de hildiweşîne û dîsa jî du qat mAP-ya detektorên din ên rast-demê werdigire.
2. YOLOv2
Salek şûnda, di sala 2016-an de, Joseph Redmon û Alî Ferhadî YOLOv2 (ku wekî YOLO9000 jî tê zanîn) di kaxezê de berdan ".YOLO9000: Baştir, Zûtir, Hêztir. "
Kapasîteya modelê ya ji bo pêşbînkirina 9000 kategoriyên cihêreng ên hêmanan dema ku hîn jî di wextê rast de xebitî, destnîşan kir 9000. Ne tenê guhertoya modela nû bi hevdemî li ser berhevokên danezan û dabeşkirina tiştan hate perwerde kirin, lê di heman demê de Darknet-19 jî wekî xeta bingehîn a nû wergirt. cins.
Ji ber ku YOLOv2 di heman demê de serkeftinek mezin bû û zû bû modela nû ya nasîna tiştan, endezyarên din dest bi ceribandina algorîtmê kirin û guhertoyên xwe yên yekta YOLO hilberînin. Hin ji wan dê di gelek xalên kaxezê de bêne nîqaş kirin.
3. YOLOv3
Di rojnameyê de "YOLOv3: Pêşveçûnek Zêdetir,” Joseph Redmon û Ali Ferhadi di sala 2018 de guhertoyek nû ya algorîtmayê weşandin. Ew li ser mîmariya Darknet-53 hate çêkirin. Klasifkerên lojîstîkî yên serbixwe mekanîzmaya çalakkirina softmax di YOLOv3 de cîh girtin.
Di dema perwerdehiyê de windabûna xaça-entropiya binary hate bikar anîn. Darknet-19 hate zêdekirin û navê Darknet-53 hate guherandin, ku niha 53 qatên konvolutional hene. Ji xeynî wê, pêşbîniyên li ser sê pîvanên cihêreng hatin kirin, ku alîkariya YOLOv3 kir ku rastbûna xwe di pêşbînkirina tiştên piçûk de zêde bike.
YOLOv3 guhertoya dawî ya YOLO ya Joseph Redmon bû, ji ber ku wî hilbijart ku li ser pêşkeftinên din ên YOLO (an jî di warê dîtina komputerê de) bixebite da ku nehêle ku xebata wî bandorek xirab li cîhanê neke. Naha ew bi piranî wekî xalek destpêkek ji bo avakirina mîmarîyên yekta-dîtkirina tiştan tê bikar anîn.
4. Yolov4
Alexey Bochkovskiy, Chien-Yao Wang, û Hong-Yuan Mark Liao weşandin "YOLOv4: Leza herî baş û rastbûna vedîtina tiştan” di Nîsana 2020-an de, ku dubarekirina çaremîn a algorîtmaya YOLO bû.
Girêdanên Bermayî yên Girandî, Têkiliyên Xaçer-Qonaxê-Beş, normalîzekirina mini-hevalê ya xaç, perwerdehiya xwe-dijberî, aktîvkirina miş, bloka avêtinê, û windabûna CIoU hemî wekî beşek ji mîmariya SPDarknet53 hatin destnîşan kirin.
YOLOv4 ji dûndana malbata YOLO ye, lêbelê, ew ji hêla zanyarên cihêreng (ne Joseph Redmon û Ali Ferhadi) ve hatî pêşve xistin. SPDarknet53 stûna piştê, hevgirtina pîramîda mekan, rê-hevkirina PANet wekî stû, û serê YOLOv3 mîmariya wê pêk tîne.
Wekî encamek, dema ku bi dêûbavê xwe re, YOLOv3, YOLOv4 digihîje 10% Rastiya Navînî û% 12 çêtir Metrîkên Çarçoveyên Per Duyemîn.
5. YOLOv5
YOLOv5 projeyek çavkaniyek vekirî ye ku di nav xwe de cûrbecûr model û algorîtmayên nasnameyê yên li ser bingeha modela YOLO-yê ku li ser daneya COCO-yê pêş-perwerde bûye, vedihewîne.
YOLOv5 berhevokek modelên nasîna tiştana hevedudanî ye li ser daneya COCO hatî perwerde kirin, bi kapasîteyên hêsan ên ji bo TTA, kombûna modelê, pêşkeftina hîperparametre, û hinardekirina ONNX, CoreML, û TFLite. Ji ber ku YOLOv5 ti nêzîkatiyên yekta pêk nayîne an pêşve nagire, kaxezek fermî nekariye were berdan. Ew tenê dirêjkirina PyTorch ya YOLOv3 ye.
Ultranytics vê senaryoyê bikar anî da ku guhertoya "YOLO-ya nû" di bin sponsoriya xwe de eşkere bike. Ji ber ku pênc modelên pêş-perwerdekirî jî hene ku têne gihîştin, rûpela malê ya YOLOv5 pir sade û bi profesyonelî hatî çêkirin û nivîsandin, digel çend ders û pêşniyarên li ser perwerdekirin û karanîna modelên YOLOv5.
sînorên YOLO
Her çend YOLO ji bo çareseriyê teknîka herî mezin xuya dike tespîtkirina objektê pirsgirêk hene, çend kêmasiyên wê hene. Ji ber ku her tûrek tenê dikare yek tiştan nas bike, YOLO di wêneyên ku di koman de çêdibin de di dîtin û veqetandina tiştên piçûk de dijwar e. Tiştên piçûk ên di nav koman de, mîna şelafek mêşan, ji YOLO re dijwar e ku meriv nas bike û bibîne.
Dema ku bi rêbazên nasîna tiştan bi girîngî hêdîtir ên mîna Fast RCNN re were berhev kirin, YOLO bi heman rengî ji hêla rastbûna kêmtir ve tête diyar kirin.
Dest bi karanîna YOLOv5 bikin
Heke hûn dixwazin YOLOv5 di çalakiyê de bibînin, lê binêrin fermî GitHub û YOLOv5 li PyTorch.
Xelasî
Guhertoya destpêkê ya YOLOv5 pir bilez, performansa û karanîna hêsan e. Digel ku YOLOv5 tu mîmariya modela nû li malbata YOLO zêde nake, ew çarçoveyek perwerdehî û bicîhkirina PyTorch ya nû peyda dike ku rewşa hunerê ji bo detektorên tiştan zêde dike.
Wekî din, YOLOv5 zehf bikarhêner-heval e û "ji qutîkê" amade ye ku li ser tiştên xwerû bikar bîne.
Leave a Reply