Voorwerpopsporing is 'n tipe beeldkategorisering waarin 'n neurale netwerk items in 'n beeld verwag en omgrensende blokkies rondom hulle teken. Die opsporing en lokalisering van dinge in 'n beeld wat aan 'n voorafbepaalde stel klasse voldoen, word na verwys as objekbespeuring.
Voorwerpopsporing (ook bekend as objekherkenning) is 'n besonder belangrike subdomein van Rekenaarvisie omdat take soos opsporing, identifikasie en lokalisering wye toepassing vind in werklike kontekste.
Die YOLO-benadering kan jou help om hierdie take uit te voer. In hierdie opstel sal ons YOLO van naderby bekyk, insluitend wat dit is, hoe dit werk, verskillende variasies, en meer.
So, wat is YOLO?
YOLO is 'n metode vir intydse objekidentifikasie en -herkenning in foto's. Dit is 'n akroniem vir Jy kyk net een keer. Redmond et al. het die benadering voorgestel in 'n referaat wat aanvanklik in 2015 by die IEEE/CVF-konferensie oor rekenaarvisie en patroonherkenning (CVPR) gepubliseer is.
Die OpenCV People's Choice-toekenning is aan die koerant toegeken. Anders as vorige objek-identifikasiemetodes, wat klassifiseerders herdoel het om opsporing te doen, stel YOLO die gebruik van 'n end-tot-end voor neurale netwerk wat gelyktydig grenskasies en klaswaarskynlikhede voorspel.
YOLO lewer die nuutste resultate deur 'n fundamenteel nuwe benadering tot objekherkenning te volg, wat maklik beter presteer as vorige intydse objekopsporingsmetodes.
YOLO werk
Die YOLO metode verdeel die prentjie in N roosters, elk met 'n gelyke grootte SxS dimensionele sektor. Elkeen van hierdie N roosters is in beheer van die opsporing en opspoor van die voorwerp wat dit bevat.
Hierdie roosters voorspel op hul beurt B-begrenskaskoördinate relatief tot selkoördinate, sowel as die itemnaam en waarskynlikheid dat die voorwerp in die sel teenwoordig sal wees. As gevolg van baie selle wat dieselfde item voorspel met uiteenlopende begrenskasvoorspellings, verminder hierdie tegniek die berekening aansienlik omdat beide opsporing en herkenning deur selle vanaf die prent hanteer word.
Dit lewer egter baie duplikaatvoorspellings op. Om hierdie probleem aan te spreek, gebruik YOLO nie-maksimale onderdrukking. YOLO onderdruk alle grenskassies met laer waarskynlikheidtellings in nie-maksimale onderdrukking.
YOLO doen dit deur die waarskynlikheidtellings wat met elke opsie gekoppel is, te ondersoek en die een met die hoogste telling te kies. Die grenskassies met die grootste kruising oor Uniewording met die huidige hoëwaarskynlikheidsgrenskassie word dan onderdruk.
Hierdie proses word voortgesit totdat die grenskassies voltooi is.
Verskillende variasies van YOLO
Ons sal na sommige van die mees algemene YOLO-weergawes kyk. Laat ons begin.
1. YOLOv1
Die aanvanklike YOLO-weergawe is in 2015 aangekondig in die publikasie "Jy kyk net een keer: verenigde, intydse objekopsporing” deur Joseph Redmon, Santosh Divvala, Ross Girshick en Ali Farhadi.
As gevolg van sy spoed, akkuraatheid en leervermoë, het YOLO vinnig die gebied van objekidentifikasie oorheers en die mees gebruikte algoritme geword. Eerder as om objekbespeuring as 'n klassifikasiekwessie aan te spreek, het die skrywers dit benader as 'n regressieprobleem met geografies geskeide begrensingsblokke en gepaardgaande klaswaarskynlikhede, wat hulle opgelos het deur 'n enkele neurale netwerk.
Die YOLOv1 het intyds foto's teen 45 rame per sekonde verwerk, terwyl 'n kleiner variant, Fast YOLO, teen 155 rame per sekonde verwerk het en steeds dubbel die mAP van ander intydse detektors verkry het.
2. YOLOv2
'n Jaar later, in 2016, het Joseph Redmon en Ali Farhadi YOLOv2 (ook bekend as YOLO9000) in die koerant vrygestel "YOLO9000: Beter, Vinniger, Sterker. "
Die model se vermoë om selfs 9000 verskillende itemkategorieë te voorspel terwyl dit steeds intyds loop, het dit die benaming 9000 besorg. Nie net is die nuwe modelweergawe gelyktydig opgelei op objekbespeuring en klassifikasiedatastelle nie, maar dit het ook Darknet-19 as die nuwe basislyn gekry. model.
Omdat YOLOv2 ook 'n groot sukses was en vinnig die volgende moderne voorwerpherkenningsmodel geword het, het ander ingenieurs met die algoritme begin eksperimenteer en hul eie, unieke YOLO-weergawes vervaardig. Sommige van hulle sal op verskeie punte in die referaat bespreek word.
3. YOLOv3
In die koerant "YOLOv3: 'n Inkrementele verbetering,” Joseph Redmon en Ali Farhadi het 'n nuwe weergawe van die algoritme in 2018 gepubliseer. Dit is gebou op die Darknet-53-argitektuur. Onafhanklike logistieke klassifiseerders het die softmax-aktiveringsmeganisme in YOLOv3 vervang.
Die binêre kruisentropieverlies is tydens opleiding gebruik. Darknet-19 is verbeter en herdoop tot Darknet-53, wat nou 53 konvolusionele lae het. Afgesien daarvan, is die voorspellings op drie afsonderlike skale gedoen, wat YOLOv3 gehelp het om sy akkuraatheid in die voorspelling van klein dingetjies te verbeter.
YOLOv3 was Joseph Redmon se finale YOLO-weergawe, aangesien hy gekies het om nie aan enige verdere YOLO-verbeterings (of selfs in die rekenaarvisie-area) te werk nie om te verhoed dat sy werk 'n nadelige invloed op die wêreld het. Dit word nou meestal gebruik as 'n beginpunt vir die bou van unieke objek-opsporingsargitekture.
4. Yolov4
Alexey Bochkovskiy, Chien-Yao Wang en Hong-Yuan Mark Liao het "YOLOv4: Optimale spoed en akkuraatheid van voorwerpopsporing” in April 2020, wat die vierde herhaling van die YOLO-algoritme was.
Geweegde oorblywende verbindings, kruis-stadium-gedeeltelike verbindings, kruis mini-joernaal normalisering, self-teenstandige opleiding, mish aktivering, drop block, en CIoU verlies is almal bekendgestel as deel van die SPDarknet53 argitektuur.
YOLOv4 is 'n afstammeling van die YOLO-familie, maar dit is ontwikkel deur afsonderlike wetenskaplikes (nie Joseph Redmon en Ali Farhadi nie). SPDarknet53-ruggraat, ruimtelike piramide-poel, PANet-pad-aggregasie as nek, en YOLOv3-kop maak sy argitektuur uit.
As gevolg hiervan, in vergelyking met sy ouer, YOLOv3, behaal YOLOv4 10% hoër gemiddelde akkuraatheid en 12% beter rame per sekonde-metrieke.
5. YOLOv5
YOLOv5 is 'n oopbronprojek wat 'n reeks objekidentifikasiemodelle en algoritmes insluit gebaseer op die YOLO-model wat vooraf op die COCO-datastel opgelei is.
YOLOv5 is 'n versameling van saamgestelde-skaal objek identifikasie modelle opgelei op die COCO-datastel, met maklike vermoëns vir TTA, modelsamestelling, hiperparameterontwikkeling en uitvoer na ONNX, CoreML en TFLite. Omdat YOLOv5 geen unieke benaderings implementeer of ontwikkel nie, kon die formele vraestel nie vrygestel word nie. Dit is bloot YOLOv3 se PyTorch-uitbreiding.
Ultranytics het hierdie scenario gebruik om die "nuwe YOLO" weergawe onder sy borgskap bekend te maak. Omdat daar ook vyf vooraf-opgeleide modelle toeganklik is, is die YOLOv5-tuisblad redelik eenvoudig en professioneel gestruktureer en geskryf, met 'n aantal lesse en voorstelle oor opleiding en gebruik van die YOLOv5-modelle.
YOLO beperkings
Alhoewel YOLO blykbaar die beste tegniek vir oplossing is objekopsporing probleme, het dit 'n aantal nadele. Omdat elke rooster net een item kan identifiseer, sukkel YOLO om klein dingetjies in prente wat in groepe voorkom op te spoor en te skei. Klein goedjies in swerms, soos 'n swerm miere, is moeilik vir YOLO om te identifiseer en op te spoor.
In vergelyking met aansienlik stadiger objekidentifikasiemetodes soos Fast RCNN, word YOLO eweneens gekenmerk deur minder akkuraatheid.
Begin om YOLOv5 te gebruik
As jy belangstel om 'n YOLOv5 in aksie te sien, kyk na die amptelike GitHub en YOLOv5 in PyTorch.
Gevolgtrekking
YOLOv5 se aanvanklike weergawe is uiters vinnig, doeltreffend en maklik om te gebruik. Alhoewel YOLOv5 geen nuwe modelargitektuur by die YOLO-familie voeg nie, bied dit 'n nuwe PyTorch-opleidings- en -ontplooiingsraamwerk wat die toestand van die kuns vir voorwerpverklikkers verbeter.
Verder is YOLOv5 uiters gebruikersvriendelik en kom "uit die boks" gereed om te gebruik op pasgemaakte voorwerpe.
Lewer Kommentaar