Объектти аныктоо – бул нейрондук тармак сүрөттөлүштүн объектилерин болжолдоп, алардын тегерегине чектеш кутучаларды тарткан сүрөттөрдү категориялоонун бир түрү. Алдын ала коюлган класстар топтомуна туура келген сүрөттөлүштөгү нерселерди аныктоо жана локалдаштыруу объектти аныктоо деп аталат.
Объектти аныктоо (объектти таануу катары да белгилүү) Computer Vision программасынын өзгөчө маанилүү субдомени болуп саналат, анткени аныктоо, идентификациялоо жана локалдаштыруу сыяктуу тапшырмалар реалдуу дүйнө контекстинде кеңири колдонулат.
YOLO ыкмасы бул тапшырмаларды аткарууга жардам берет. Бул эсседе биз YOLOну кененирээк карап чыгабыз, анын ичинде ал эмне, ал кантип иштейт, ар кандай вариациялар жана башкалар.
Ошентип, YOLO деген эмне?
YOLO реалдуу убакытта объектти идентификациялоо жана сүрөттөрдө таануу ыкмасы. Бул сен бир жолу карасаң деген сөздүн кыскартылган түрү. Редмонд жана башкалар. Бул ыкманы алгач 2015-жылы IEEE/CVF компьютердик көрүү жана калыптарды таануу (CVPR) конференциясында жарыяланган макалада сунуштаган.
OpenCV Элдик тандоо сыйлыгы гезитке берилди. Мурунку классификаторлорду аныктоо үчүн башкарган объектти идентификациялоо ыкмаларынан айырмаланып, YOLO акырына чейин колдонууну сунуштайт. нейрон тармак ал бир эле учурда чектеш кутучаларды жана класстык ыктымалдуулуктарды алдын ала айтат.
YOLO объектти таанууга принципиалдуу жаңы ыкманы колдонуу менен заманбап жыйынтыктарды чыгарат, бул реалдуу убакыт режиминде объектти аныктоонун мурунку ыкмаларынан оңой эле ашып кетет.
YOLO иштеп жатат
YOLO ыкмасы сүрөттү N торлорго бөлөт, алардын ар бири бирдей өлчөмдөгү SxS өлчөмдүү секторго ээ. Бул N торлордун ар бири өзүнө камтылган объектти аныктоо жана жайгаштыруу үчүн жооптуу.
Бул торчо, өз кезегинде, В чектөөчү кутучанын координаттарын уяча координаттарына, ошондой эле пункттун атын жана уячада болгон объекттин ыктымалдыгын болжолдойт. Көптөгөн клеткалар бир эле объектти ар кандай чектеген кутуча божомолдору менен алдын ала айткандыктан, бул ыкма эсептөөнү кыйла азайтат, анткени аныктоо да, таануу да сүрөттөгү уячалар тарабынан ишке ашырылат.
Бирок, ал көптөгөн кайталанган божомолдорду жаратат. Бул көйгөйдү чечүү үчүн YOLO максималдуу эмес басууну колдонот. YOLO максималдуу эмес басуудагы ыктымалдуулук упайларынын бардыгын чектеген кутуларды басат.
YOLO муну ар бир вариантка байланыштуу ыктымалдык упайларын карап чыгып, эң жогорку баллды тандоо менен жасайт. Андан кийин учурдагы жогорку ыктымалдык чектеш кутучасы менен Биримдиктин эң чоң кесилиши бар чектегич кутучалар басылган.
Бул процесс чектеш кутучалар аяктаганга чейин улантылат.
YOLOнун ар кандай варианттары
Биз эң кеңири таралган YOLO версияларынын айрымдарын карап чыгабыз. Баштайлы.
1. YOLOv1
Алгачкы YOLO версиясы 2015-жылы басылмада жарыяланган.Сиз бир гана жолу карайсыз: бирдиктүү, реалдуу убакытта объектти аныктооДжозеф Редмон, Сантош Диввала, Росс Гиршик жана Али Фархади.
Ылдамдыгы, тактыгы жана үйрөнүү жөндөмдүүлүгүнөн улам YOLO объектти идентификациялоо тармагында тез эле үстөмдүк кылып, эң кеңири колдонулган алгоритм болуп калды. Объектти аныктоону классификация маселеси катары кароонун ордуна, авторлор аны географиялык жактан бөлүнгөн чектеш кутучалары жана класстык ыктымалдыктары бар регрессия көйгөйү катары карашты, алар бир эле маселенин жардамы менен чечишти. нейрон тармак.
YOLOv1 реалдуу убакыт режиминде секундасына 45 кадр менен сүрөттөрдү иштеткен, ал эми кичирээк варианты Fast YOLO секундасына 155 кадрда иштетилген жана дагы эле башка реалдуу убакыттагы детекторлордон эки эсе көп mAP алган.
2. YOLOv2
Бир жылдан кийин, 2016-жылы, Жозеф Редмон жана Али Фархади YOLOv2ди (ошондой эле YOLO9000 деп аталат) гезитте чыгарышты.YOLO9000: Жакшыраак, тезирээк, күчтүүрөөк. «
Моделдин реалдуу убакыт режиминде дагы эле 9000 түрдүү категорияларды болжолдоо мүмкүнчүлүгү ага 9000 деген белгини берди. Жаңы моделдин версиясы бир эле учурда объектти аныктоо жана классификациялоо маалымат топтомдорун үйрөтүү менен чектелбестен, Darknet-19ду жаңы база катары да алды. модель.
YOLOv2 да чоң ийгиликке жетишкендиктен жана тез арада объектти таануунун кийинки заманбап модели болуп калгандыктан, башка инженерлер алгоритм менен эксперимент жүргүзүп, өздөрүнүн уникалдуу YOLO версияларын чыгара башташты. Алардын айрымдары гезиттин ар кайсы жерлеринде талкууланат.
3. YOLOv3
Кагазда "YOLOv3: Кошумча жакшыртуу,” Жозеф Редмон жана Али Фархади 2018-жылы алгоритмдин жаңы версиясын жарыялашкан. Ал Darknet-53 архитектурасында курулган. Көз карандысыз логистикалык классификаторлор YOLOv3деги softmax активдештирүү механизмин алмаштырды.
Бинардык кайчылаш энтропия жоготуулары машыгуу учурунда колдонулган. Darknet-19 өркүндөтүлүп, Darknet-53 деп аталды, азыр анын 53 конволюциялык катмары бар. Мындан тышкары, божомолдор үч түрдүү масштабда жасалды, бул YOLOv3ке майда нерселерди алдын ала айтууда анын тактыгын жогорулатууга жардам берди.
YOLOv3 Джозеф Редмондун акыркы YOLO версиясы болгон, анткени ал өзүнүн иши дүйнөгө терс таасирин тийгизбеш үчүн YOLOнун мындан аркы өркүндөтүүлөрүндө (же компьютердин көрүү чөйрөсүндө да) иштебей турган. Ал азыр көбүнчө объектти аныктоонун уникалдуу архитектураларын куруу үчүн баштапкы чекит катары колдонулат.
4. Жолов4
Алексей Бочковский, Чиен-Яо Ван жана Хонг-Юань Марк Ляо «YOLOv4: Объектти аныктоонун оптималдуу ылдамдыгы жана тактыгы” 2020-жылдын апрель айында, бул YOLO алгоритминин төртүнчү итерациясы болгон.
SPDarknet53 архитектурасынын бир бөлүгү катары салмакталган калдык байланыштар, кайчылаш этап-жарым-жартылай туташуулар, кайчылаш мини-партияны нормалдаштыруу, өзүн-өзү атаандаштыкка үйрөтүү, каталарды активдештирүү, түшүрүү блогу жана CIoU жоготуулары киргизилген.
YOLOv4 YOLO үй-бүлөсүнүн тукуму, бирок аны өзүнчө окумуштуулар (Джозеф Редмон жана Али Фархади эмес) иштеп чыгышкан. SPDarknet53 омурткасы, мейкиндик пирамидасынын биригиши, моюн катары PANet жол-агрегациясы жана YOLOv3 башы анын архитектурасын түзөт.
Натыйжада, анын ата-энеси, YOLOv3 менен салыштырганда, YOLOv4 орточо тактыкка 10% жана секундасына 12% жакшы кадр көрсөткүчүнө жетишет.
5. YOLOv5
YOLOv5 COCO маалымат топтомунда алдын ала үйрөтүлгөн YOLO моделине негизделген объектти идентификациялоонун бир катар моделдерин жана алгоритмдерин камтыган ачык булактуу долбоор.
YOLOv5 комплекстүү масштабдуу объектти идентификациялоо моделдеринин жыйындысы TTA, моделди чогултуу, гиперпараметрлерди иштеп чыгуу жана ONNX, CoreML жана TFLiteге экспорттоо үчүн жеңил мүмкүнчүлүктөрү бар COCO маалымат топтому боюнча үйрөтүлгөн. YOLOv5 эч кандай уникалдуу ыкмаларды ишке ашырбагандыктан же иштеп чыкпагандыктан, расмий кагазды чыгаруу мүмкүн эмес. Бул жөн гана YOLOv3тин PyTorch кеңейтүүсү.
Ultranytics бул сценарийди өзүнүн демөөрчүлүгү астында "жаңы YOLO" версиясын жарыялоо үчүн колдонду. Алдын ала даярдалган беш модель жеткиликтүү болгондуктан, YOLOv5 башкы бети YOLOv5 моделдерин окутуу жана колдонуу боюнча бир катар сабактарды жана сунуштарды камтыган абдан жөнөкөй жана кесипкөй структураланган жана жазылган.
YOLO чектөөлөр
YOLO чечүү үчүн эң чоң техника болуп көрүнсө да объектти аныктоо көйгөйлөр, анын бир катар кемчиликтери бар. Ар бир тор бир эле нерсени аныктай алгандыктан, YOLO топтордо пайда болгон сүрөттөрдөгү кичинекей нерселерди табуу жана бөлүү кыйынга турат. Кумурскалардын үйүрү сыяктуу үйүлгөн майда нерселерди YOLO үчүн аныктоо жана табуу кыйынга турат.
Fast RCNN сыяктуу бир кыйла жайыраак объектти идентификациялоо ыкмалары менен салыштырганда, YOLO дагы азыраак тактык менен мүнөздөлөт.
YOLOv5 колдоно баштаңыз
Эгер сиз YOLOv5 иштеп жатканын көргүңүз келсе, текшерип көрүңүз расмий GitHub жана PyTorch ичиндеги YOLOv5.
жыйынтыктоо
YOLOv5тин баштапкы версиясы өтө тез, натыйжалуу жана колдонууга жөнөкөй. YOLOv5 YOLO үй-бүлөсүнө эч кандай жаңы моделдик архитектураны кошпосо да, объект детекторлору үчүн искусствонун абалын жакшыртуучу жаңы PyTorch окутуу жана жайылтуу негизин камсыз кылат.
Мындан тышкары, YOLOv5 колдонуучуга абдан ыңгайлуу жана заказ кылынган объекттерде колдонууга даяр "кутудан" чыгат.
Таштап Жооп