Мундариҷа[Пинҳон кардан][Намоиш]
Муайянкунии объект як намуди гурӯҳбандии тасвирҳо мебошад, ки дар он шабакаи нейронӣ ашёро дар тасвир пешбинӣ мекунад ва дар атрофи онҳо қуттиҳои маҳдудкунанда мекашад. Муайян кардан ва локализатсия кардани ашё дар тасвир, ки ба маҷмӯи қаблан муқарраршудаи синфҳо мувофиқат мекунад, ҳамчун муайянкунии объект номида мешавад.
Муайянкунии объект (инчунин бо номи шинохти объект маълум аст) як зердомени махсусан муҳими Computer Vision мебошад, зеро вазифаҳо ба монанди кашф, муайянкунӣ ва маҳаллисозӣ дар контекстҳои ҷаҳони воқеӣ татбиқи васеъ пайдо мекунанд.
Равиши YOLO метавонад ба шумо дар иҷрои ин вазифаҳо кӯмак расонад. Дар ин эссе, мо ба YOLO бодиққат назар хоҳем кард, аз ҷумла он чист, он чӣ гуна кор мекунад, вариантҳои гуногун ва ғайра.
Пас, YOLO чист?
YOLO як усули муайян ва шинохти объект дар аксҳо мебошад. Ин мухтасар барои Шумо танҳо як бор нигаред. Редмонд ва дигарон. ин равишро дар мақолае пешниҳод кард, ки бори аввал соли 2015 дар Конфронси IEEE/CVF оид ба биниши компютерӣ ва шинохти намуна (CVPR) нашр шуда буд.
Ҷоизаи интихоби мардум OpenCV ба коғаз дода шуд. Баръакси усулҳои қаблии муайянкунии объект, ки таснифкунакҳоро барои муайянкунӣ таъин кардаанд, YOLO истифодаи якхеларо пешниҳод мекунад. шабакаи нейралӣ ки дар як вақт қуттиҳои маҳдуд ва эҳтимолияти синфро пешгӯӣ мекунад.
YOLO бо назардошти равиши куллан нав ба шинохти объект, ба осонӣ аз усулҳои қаблии муайянкунии объект дар вақти воқеӣ бартарӣ дода, натиҷаҳои замонавӣ меорад.
YOLO кор мекунад
Усули YOLO тасвирро ба N торҳо тақсим мекунад, ки ҳар кадоми онҳо як бахши андозагирии SxS доранд. Ҳар яке аз ин N торҳо барои муайян кардан ва ҷойгир кардани объекти дорои он масъуланд.
Ин шабакаҳо, дар навбати худ, координатҳои қуттии маҳдудкунандаи B-ро нисбат ба координатҳои ячейка, инчунин номи объект ва эҳтимолияти мавҷудияти объект дар ячейка пешгӯӣ мекунанд. Аз сабаби он ки ҳуҷайраҳои сершумори як объектро бо пешгӯиҳои гуногуни қуттии маҳдуд пешгӯӣ мекунанд, ин техника ҳисобкуниро ба таври назаррас коҳиш медиҳад, зеро ҳам ошкор ва ҳам шинохти ҳуҷайраҳо аз тасвир идора карда мешаванд.
Бо вуҷуди ин, он бисёр пешгӯиҳои такрориро ба вуҷуд меорад. Барои ҳалли ин мушкилот, YOLO фишори ғайримаксималиро истифода мебарад. YOLO ҳама қуттиҳои маҳдудкунандаро бо холҳои эҳтимолии камтар дар фишори ғайримаксималӣ пахш мекунад.
YOLO ин корро тавассути тафтиши холҳои эҳтимолияти бо ҳар як вариант алоқаманд ва интихоби яке аз холҳои баландтарин анҷом медиҳад. Қуттиҳои маҳдудкунанда бо чорроҳаи калонтарини Иттиҳод бо қуттии маҳдудияти ҷории эҳтимолии баланд пас аз он пахш карда мешаванд.
Ин раванд то ба итмом расидани қуттиҳои маҳдудкунанда идома дода мешавад.
Вариантҳои гуногуни YOLO
Мо баъзе аз версияҳои маъмултарини YOLO-ро дида мебароем. Биёед оғоз кунем.
1. ЁЛОв1
Версияи ибтидоии YOLO дар соли 2015 дар нашрияи "Шумо танҳо як маротиба назар мекунед: Муттаҳид, ошкоркунии объект дар вақти воқеӣ” аз ҷониби Ҷозеф Редмон, Сантош Диввала, Росс Гиршик ва Алӣ Фарҳодӣ.
Аз сабаби суръат, дақиқӣ ва қобилияти омӯхтани худ, YOLO зуд дар соҳаи муайянкунии объект бартарӣ дошт ва ба алгоритми васеъ истифодашаванда табдил ёфт. Ба ҷои баррасии ошкоркунии объект ҳамчун масъалаи тасниф, муаллифон онро ҳамчун мушкилоти регрессия бо қуттиҳои ҷуғрофӣ ҷудошуда ва эҳтимолияти синфҳои алоқаманд, ки онҳо бо истифода аз як усули ягона ҳал карданд, баррасӣ карданд. шабакаи нейралӣ.
YOLOv1 аксҳоро бо суръати 45 кадр дар як сония дар вақти воқеӣ коркард мекард, дар ҳоле ки варианти хурдтари Fast YOLO бо суръати 155 кадр дар як сония коркард шуда, то ҳол аз дигар детекторҳои вақти воқеӣ дучанд зиёдтар mAP ба даст овард.
2. ЁЛОв2
Пас аз як сол, дар соли 2016, Ҷозеф Редмон ва Алӣ Фарҳодӣ YOLOv2 (инчунин бо номи YOLO9000 маъруф) дар коғази "YOLO9000: Беҳтар, тезтар, қавӣ. "
Иқтидори модел барои пешгӯӣ кардани ҳатто 9000 категорияи ҷудогона ҳангоми кор дар вақти воқеӣ ба он сазовори нишони 9000 гардид. На танҳо версияи нави модел ҳамзамон оид ба муайянкунии объектҳо ва маҷмӯаҳои таснифот омӯзонида шуд, балки он ҳамчунин Darknet-19-ро ҳамчун заминаи нав гирифт. модел.
Азбаски YOLOv2 низ муваффақияти бузурге буд ва зуд ба модели навбатии шинохти объектҳо табдил ёфт, муҳандисони дигар ба озмоиш бо алгоритм ва тавлиди версияҳои беназири YOLO шурӯъ карданд. Баъзеи онҳо дар бахшҳои мухталифи мақола баррасӣ хоҳанд шуд.
3. ЁЛОв3
Дар рӯзномаи "YOLOv3: Такмили афзоянда," Ҷозеф Редмон ва Алӣ Фарҳодӣ версияи нави алгоритмро дар соли 2018 нашр карданд. Он дар меъмории Darknet-53 сохта шудааст. Таснифи мустақили логистикӣ механизми фаъолсозии softmax дар YOLOv3-ро иваз карданд.
Ҳангоми омӯзиш талафоти бинарии кросс-энтропия истифода мешуд. Darknet-19 такмил дода шуд ва номи Darknet-53 шуд, ки ҳоло 53 қабати конволютсионӣ дорад. Ғайр аз ин, пешгӯиҳо дар се миқёси алоҳида иҷро карда шуданд, ки ба YOLOv3 барои баланд бардоштани дақиқии он дар пешгӯии чизҳои хурд кӯмак кард.
YOLOv3 нусхаи ниҳоии YOLO Ҷозеф Редмон буд, зеро ӯ ихтиёр кард, ки дар ягон такмили минбаъдаи YOLO (ё ҳатто дар соҳаи биниши компютер) кор накунад, то кори ӯ ба ҷаҳон таъсири бад расонад. Ҳоло он асосан ҳамчун нуқтаи ибтидоӣ барои сохтани меъмории беназири ошкоркунии объектҳо истифода мешавад.
4. Ёлов4
Алексей Бочковский, Чиен-Яо Ван ва Хонг-Юан Марк Ляо «YOLOv4: Суръат ва дақиқии оптималии кашфи объект” дар моҳи апрели соли 2020, ки такрори чоруми алгоритми YOLO буд.
Пайвастҳои боқимондаи вазншуда, Пайвастҳои байнимарҳила-қисман, нормализатсияи байниҳамдигарии мини-партия, омӯзиши худшиносӣ, фаъолсозии миш, блоки тарк ва талафоти CIoU ҳама ҳамчун як қисми меъмории SPDarknet53 ҷорӣ карда шуданд.
YOLOv4 насли оилаи YOLO аст, аммо онро олимони алоҳида (на Ҷозеф Редмон ва Алӣ Фарҳодӣ) таҳия кардаанд. Пойгоҳи SPDarknet53, муттаҳидсозии пирамидаҳои фазоӣ, агрегатсияи роҳи PANet ҳамчун гардан ва сари YOLOv3 меъмории онро ташкил медиҳанд.
Дар натиҷа, дар муқоиса бо волидайни худ, YOLOv3, YOLOv4 нишондиҳандаҳои дақиқи миёнаи 10% баландтар ва 12% беҳтар кадрҳо дар як сонияро ба даст меорад.
5. ЁЛОв5
ЁЛОв5 як лоиҳаи кушодаасос аст, ки як қатор моделҳо ва алгоритмҳои мушаххаскунии объектро дар бар мегирад, ки дар асоси модели YOLO, ки дар маҷмӯи маълумоти COCO пешакӣ омӯзонида шудааст.
YOLOv5 маҷмӯаи моделҳои мушаххаси объекти миқёси мураккаб аст дар маҷмӯи додаҳои COCO омӯзонида шудааст, ки дорои қобилиятҳои осон барои TTA, васлкунии моделҳо, таҳияи гиперпараметрҳо ва содирот ба ONNX, CoreML ва TFLite мебошад. Азбаски YOLOv5 ягон равишҳои беназирро татбиқ намекунад ё таҳия намекунад, ҳуҷҷати расмӣ нашр карда нашуд. Ин танҳо васеъшавии PyTorch YOLOv3 аст.
Ultranytics ин сенарияро барои таблиғи версияи "нави YOLO" таҳти сарпарастии он истифода бурд. Азбаски панҷ модели қаблан омӯзонидашуда дастрасанд, саҳифаи хонагии YOLOv5 хеле содда ва аз ҷиҳати касбӣ сохторӣ ва навишта шудааст, бо як қатор дарсҳо ва пешниҳодҳо оид ба омӯзиш ва истифодаи моделҳои YOLOv5.
Маҳдудиятҳои YOLO
Гарчанде ки YOLO бузургтарин техникаи ҳалли мушкилот ба назар мерасад ошкор кардани объект мушкилот дорад, як қатор камбудиҳо дорад. Азбаски ҳар як шабака метавонад танҳо як ҷузъро муайян кунад, YOLO дар ошкор ва ҷудо кардани чизҳои ночиз дар тасвирҳое, ки дар гурӯҳҳо пайдо мешаванд, душвор аст. Чизҳои хурд дар тӯдаҳо, ба монанди тӯдаи мӯрчагон, барои YOLO муайян кардан ва ҷойгир кардан душвор аст.
Ҳангоми муқоиса бо усулҳои мушаххаси объектҳои ба таври назаррас сусттар ба монанди Fast RCNN, YOLO низ бо дақиқии камтар тавсиф мешавад.
Истифодаи YOLOv5-ро оғоз кунед
Агар шумо ба дидани YOLOv5 дар амал шавқ дошта бошед, аз назар гузаронед GitHub расмии ва YOLOv5 дар PyTorch.
хулоса
Варианти ибтидоии YOLOv5 бениҳоят зуд, иҷрошаванда ва осон барои истифода аст. Гарчанде ки YOLOv5 ба оилаи YOLO ягон меъмории нави моделиро илова намекунад, он чаҳорчӯбаи нави омӯзиш ва густариши PyTorch-ро таъмин мекунад, ки сатҳи санъати детекторҳои объектро беҳтар мекунад.
Ғайр аз он, YOLOv5 барои корбар хеле осон аст ва "аз қуттӣ" барои истифода дар объектҳои фармоишӣ омода аст.
Дин ва мазҳаб