Edukien aurkibidea[Ezkutatu][Erakutsi]
Objektuen detekzioa irudien kategorizazio mota bat da, non neurona-sare batek irudi bateko elementuak aurreikusten dituen eta horien inguruan muga-koadroak marrazten dituen. Aurrez ezarritako klase-multzo bati egokitzen zaion irudi batean gauzak detektatzea eta lokalizatzea objektuen detekzio deritzo.
Objektuen detekzioa (objektuen aitorpena izenez ere ezagutzen dena) Ordenagailuaren Ikusmenaren azpidomeinu bereziki esanguratsua da, detekzio, identifikazio eta lokalizazioa bezalako zereginek aplikazio zabala dutelako mundu errealeko testuinguruetan.
YOLO ikuspegiak zeregin horiek egiten lagun zaitzake. Saiakera honetan, YOLOri hurbilagotik begiratuko diogu, zer den, nola funtzionatzen duen, aldaera desberdinak eta abar barne.
Orduan, zer da YOLO?
YOLO argazkietan objektuak denbora errealean identifikatzeko eta ezagutzeko metodo bat da. You Only Look Once akronimoa da. Redmond et al. planteamendua proposatu zuen hasiera batean 2015ean argitaratu zen IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) konferentzian.
OpenCV People's Choice Award saria eman zioten paperari. Objektuak identifikatzeko aurreko metodoek ez bezala, sailkatzaileak detekziorako berrerabiltzen zituztenak, YOLOk muturreko bat erabiltzea proposatzen du. sare neural muga-koadroak eta klase probabilitateak aldi berean iragartzen dituena.
YOLOk punta-puntako emaitzak lortzen ditu objektuak ezagutzeko ikuspegi berri bat hartuz, denbora errealeko objektuak hautemateko aurreko metodoak erraz gaindituz.
YOLO lanean
YOLO metodoak argazkia N saretan banatzen du, bakoitza tamaina bereko SxS dimentsio-sektore batekin. N sare horietako bakoitza bere baitan duen objektua detektatu eta kokatzeaz arduratzen da.
Sare hauek, aldi berean, B muga-koadroaren koordenatuak aurreikusten dituzte gelaxken koordenatuekiko, baita elementuaren izena eta objektua gelaxkan egoteko probabilitatea ere. Zelula askok elementu bera iragartzen dutelako muga-koadro ezberdinen iragarpenekin, teknika honek konputazioa nabarmen murrizten du, detekzioa eta ezagupena irudiko zelulek kudeatzen dituztelako.
Hala ere, iragarpen bikoiztu asko sortzen ditu. Arazo honi aurre egiteko, YOLOk Ez-Maximal Suppression erabiltzen du. YOLO-k ezabatu ez maximoan probabilitate baxuagoko puntuazioak dituzten muga-koadro guztiak kentzen ditu.
YOLOk aukera bakoitzarekin lotutako probabilitate puntuazioak aztertuz eta puntuaziorik altuena duena hautatuz egiten du. Uneko probabilitate handiko muga-koadroarekin Batasunaren gaineko Elkargune handiena duten muga-koadroak kendu egiten dira.
Prozesu honek muga-koadroak osatu arte jarraitzen du.
YOLOren aldaera desberdinak
YOLOren bertsio ohikoenetako batzuk ikusiko ditugu. Has gaitezen.
1. YOLOv1
Hasierako YOLO bertsioa 2015ean iragarri zen argitalpenean "Begiratzen duzu behin bakarrik: objektuen detekzio bateratua eta denbora errealean” Joseph Redmon, Santosh Divvala, Ross Girshick eta Ali Farhadiren eskutik.
Bere abiadura, zehaztasuna eta ikasteko gaitasunagatik, YOLO azkar nagusitu zen objektuen identifikazioaren arloan eta algoritmorik erabiliena bihurtu zen. Objektuen detekzioa sailkapen-arazo gisa jorratu beharrean, egileek geografikoki bereizitako muga-koadroekin eta erlazionatutako klase-probabilitateekin erregresio-arazo gisa jorratu zuten, bakar bat erabiliz ebatzi zutena. sare neural.
YOLOv1-ek argazkiak segundoko 45 fotograman prozesatzen zituen denbora errealean, eta aldaera txikiagoak, Fast YOLOk, segundoko 155 fotograman prozesatzen zituen eta denbora errealeko beste detektagailuen mapa bikoitza lortu zuen.
2. YOLOv2
Urtebete geroago, 2016an, Joseph Redmon eta Ali Farhadik YOLOv2 (YOLO9000 izenez ere ezaguna) kaleratu zuten paperean "YOLO9000: Hobe, Azkarrago, Indartsuagoa".
Ereduak denbora errealean exekutatzen ari diren bitartean 9000 elementu-kategoria desberdin aurreikusteko duen ahalmenak 9000 izendapena lortu zuen. Ereduaren bertsio berria objektuak hautemateko eta sailkapeneko datu-multzoetan aldi berean trebatu ez ezik, Darknet-19 ere lortu zuen oinarri berri gisa. eredua.
YOLOv2-k ere arrakasta handia izan zuenez eta azkar punta-puntako objektuak ezagutzeko hurrengo eredua bihurtu zenez, beste ingeniari batzuk algoritmoarekin esperimentatzen hasi ziren eta beren YOLO bertsio bereziak ekoizten hasi ziren. Horietako batzuk dokumentuko hainbat puntutan eztabaidatuko dira.
3. YOLOv3
Paperean "YOLOv3: Hobekuntza gehigarria,” Joseph Redmonek eta Ali Farhadik algoritmoaren bertsio berri bat argitaratu zuten 2018an. Darknet-53 arkitekturan eraiki zen. Sailkatzaile logistiko independenteek softmax aktibazio mekanismoa ordezkatu zuten YOLOv3-n.
Entrenamendu garaian zehar-entropia-galera bitarra erabili zen. Darknet-19 hobetu zen eta Darknet-53 izena hartu zuen, orain 53 geruza konboluzional dituena. Horretaz gain, iragarpenak hiru eskala ezberdinetan egin ziren, eta horrek lagundu zion YOLOv3ri gauza txikiak iragartzeko zehaztasuna hobetzen.
YOLOv3 Joseph Redmon-en azken YOLO bertsioa izan zen, YOLOren hobekuntza gehiagorik ez lantzea erabaki zuelako (ezta ordenagailu bidezko ikusmenaren arloan ere) bere lanak munduan eragin kaltegarria izan ez zezan. Gaur egun, gehienbat objektuak detektatzeko arkitektura bereziak eraikitzeko abiapuntu gisa erabiltzen da.
4. Yolov4
Alexey Bochkovskiy, Chien-Yao Wang eta Hong-Yuan Mark Liaok argitaratu zuten "YOLOv4: Objektuak hautemateko abiadura eta zehaztasun optimoa” 2020ko apirilean, YOLO algoritmoaren laugarren iterazioa izan zen.
Hondar-konexio haztatuak, zehar-etapa-konexio partzialak, gurutze-multzoen normalizazioa, norberaren aurkako prestakuntza, mish aktibazioa, drop block eta CIoU galera SPDarknet53 arkitekturaren zati gisa sartu ziren.
YOLOv4 YOLO familiaren ondorengoa da, baina zientzialari bereiziek garatu zuten (ez Joseph Redmonek eta Ali Farhadik). SPDarknet53 bizkarrezurra, piramide espazialaren bilketa, PANet bide-agregazioa lepo gisa eta YOLOv3 buruak osatzen dute bere arkitektura.
Ondorioz, YOLOv3 gurasoarekin alderatuta, YOLOv4-k %10eko batez besteko zehaztasun handiagoa eta %12ko segundoko fotograma hobeak lortzen ditu.
5. YOLOv5
YOLOv5 COCO datu-multzoan aldez aurretik trebatu den YOLO ereduan oinarritutako objektuak identifikatzeko eredu eta algoritmo ugari biltzen dituen kode irekiko proiektu bat da.
YOLOv5 objektuen identifikazio-eredu konposatuen bilduma da COCO datu-multzoan trebatua, TTArako gaitasun errazekin, ereduen muntaia, hiperparametroen garapena eta ONNX, CoreML eta TFLite-ra esportatzeko. YOLOv5-ek ez baitu planteamendu berezirik ezartzen edo garatzen, ezin izan da paper formala kaleratu. YOLOv3-ren PyTorch luzapena besterik ez da.
Ultranytics-ek agertoki hau erabili zuen "YOLO berria" bertsioa ezagutzera emateko bere babespean. Aurrez prestatutako bost eredu ere eskuragarri daudenez, YOLOv5 hasierako orria nahiko erraza da eta profesionalki egituratuta eta idatzita dago, YOLOv5 ereduak prestatzeko eta erabiltzeko hainbat ikasgai eta iradokizunekin.
YOLO mugak
YOLO ebazteko teknikarik handiena dirudien arren objektuak hautematea arazoak, hainbat eragozpen ditu. Sare bakoitzak elementu bakarra identifika dezakeenez, YOLOk zailtasunak ditu taldeka agertzen diren irudietan gauza txikiak detektatzeko eta bereizteko. Zurrunbiloetan gauza txikiak, inurri multzo bat adibidez, zailak dira YOLOk identifikatzen eta lokalizatzen.
RCNN azkarra bezalako objektuak identifikatzeko metodo nabarmen motelagoak direnean, YOLOk zehaztasun txikiagoa du.
Hasi YOLOv5 erabiltzen
YOLOv5 bat martxan ikustea interesatzen bazaizu, begiratu GitHub ofiziala YOLOv5 PyTorch-en.
Ondorioa
YOLOv5-en hasierako bertsioa oso azkarra, eraginkorra eta erabiltzeko erraza da. YOLOv5-ek YOLO familian eredu-arkitektura berririk gehitzen ez duen arren, objektu-detektagailuen artearen egoera hobetzen duen PyTorch prestakuntza- eta hedapen-esparru berria eskaintzen du.
Gainera, YOLOv5 oso erabilerraza da eta "kutxatik kanpo" dator neurrira egindako objektuetan erabiltzeko prest.
Utzi erantzun bat