ఆబ్జెక్ట్ డిటెక్షన్ అనేది ఒక రకమైన ఇమేజ్ వర్గీకరణ, దీనిలో న్యూరల్ నెట్వర్క్ చిత్రంలో అంశాలను అంచనా వేస్తుంది మరియు వాటి చుట్టూ సరిహద్దు పెట్టెలను గీస్తుంది. ప్రీసెట్ క్లాస్ సెట్కు అనుగుణంగా ఉండే ఇమేజ్లోని విషయాలను గుర్తించడం మరియు స్థానికీకరించడం అనేది ఆబ్జెక్ట్ డిటెక్షన్గా సూచించబడుతుంది.
ఆబ్జెక్ట్ డిటెక్షన్ (ఆబ్జెక్ట్ రికగ్నిషన్ అని కూడా పిలుస్తారు) అనేది కంప్యూటర్ విజన్ యొక్క ప్రత్యేకించి ముఖ్యమైన సబ్డొమైన్, ఎందుకంటే గుర్తింపు, గుర్తింపు మరియు స్థానికీకరణ వంటి పనులు వాస్తవ-ప్రపంచ సందర్భాలలో విస్తృత అనువర్తనాన్ని కనుగొంటాయి.
YOLO విధానం ఈ పనులను చేయడంలో మీకు సహాయపడుతుంది. ఈ వ్యాసంలో, YOLO అంటే ఏమిటి, ఇది ఎలా పని చేస్తుంది, విభిన్న వైవిధ్యాలు మరియు మరిన్నింటితో సహా మేము దానిని నిశితంగా పరిశీలిస్తాము.
కాబట్టి, YOLO అంటే ఏమిటి?
YOLO అనేది ఫోటోగ్రాఫ్లలో నిజ-సమయ వస్తువు గుర్తింపు మరియు గుర్తింపు కోసం ఒక పద్ధతి. ఇది యు ఓన్లీ లుక్ వన్స్ అనే పదానికి సంక్షిప్త రూపం. రెడ్మండ్ మరియు ఇతరులు. కంప్యూటర్ విజన్ అండ్ ప్యాటర్న్ రికగ్నిషన్ (CVPR)పై IEEE/CVF కాన్ఫరెన్స్లో 2015లో మొదట ప్రచురించబడిన పేపర్లో ఈ విధానాన్ని ప్రతిపాదించారు.
పేపర్కి ఓపెన్సివి పీపుల్స్ ఛాయిస్ అవార్డు లభించింది. మునుపటి ఆబ్జెక్ట్ ఐడెంటిఫికేషన్ పద్ధతుల వలె కాకుండా, గుర్తించడానికి వర్గీకరణదారులను పునర్నిర్మించింది, YOLO ఎండ్-టు-ఎండ్ వినియోగాన్ని ప్రతిపాదించింది నాడీ నెట్వర్క్ ఇది సరిహద్దు పెట్టెలు మరియు తరగతి సంభావ్యతలను ఏకకాలంలో అంచనా వేస్తుంది.
YOLO ఆబ్జెక్ట్ రికగ్నిషన్కు ప్రాథమికంగా కొత్త విధానాన్ని తీసుకోవడం ద్వారా అత్యాధునిక ఫలితాలను అందిస్తుంది, మునుపటి నిజ-సమయ ఆబ్జెక్ట్ డిటెక్షన్ పద్ధతులను సులభంగా అధిగమించింది.
YOLO పని చేస్తోంది
YOLO పద్ధతి చిత్రాన్ని N గ్రిడ్లుగా విభజిస్తుంది, ప్రతి ఒక్కటి సమాన-పరిమాణ SxS డైమెన్షనల్ సెక్టార్తో ఉంటుంది. ఈ N గ్రిడ్లలో ప్రతి ఒక్కటి అది కలిగి ఉన్న వస్తువును గుర్తించడం మరియు గుర్తించడం బాధ్యత వహిస్తుంది.
ఈ గ్రిడ్లు, సెల్ కోఆర్డినేట్లకు సంబంధించి B బౌండింగ్ బాక్స్ కోఆర్డినేట్లను, అలాగే సెల్లో ఉన్న వస్తువు పేరు మరియు సంభావ్యతను అంచనా వేస్తాయి. వైవిధ్యమైన సరిహద్దు పెట్టె అంచనాలతో అనేక కణాలు ఒకే అంశాన్ని అంచనా వేయడం వలన, ఈ సాంకేతికత గణనను గణనీయంగా తగ్గిస్తుంది ఎందుకంటే గుర్తించడం మరియు గుర్తింపు రెండూ చిత్రం నుండి కణాల ద్వారా నిర్వహించబడతాయి.
అయినప్పటికీ, ఇది చాలా నకిలీ అంచనాలను ఉత్పత్తి చేస్తుంది. ఈ సమస్యను పరిష్కరించడానికి, YOLO నాన్-మాక్సిమల్ సప్రెషన్ని ఉపయోగిస్తుంది. YOLO నాన్-గరిష్ట సప్రెషన్లో తక్కువ సంభావ్యత స్కోర్లతో అన్ని బౌండింగ్ బాక్స్లను అణిచివేస్తుంది.
YOLO ప్రతి ఎంపికతో లింక్ చేయబడిన సంభావ్యత స్కోర్లను పరిశీలించడం ద్వారా మరియు అత్యధిక స్కోర్తో ఉన్నదాన్ని ఎంచుకోవడం ద్వారా దీన్ని చేస్తుంది. ప్రస్తుత అధిక సంభావ్యత బౌండింగ్ బాక్స్తో యూనియన్పై అతిపెద్ద ఖండనతో బౌండింగ్ బాక్స్లు అణచివేయబడతాయి.
సరిహద్దు పెట్టెలు పూర్తయ్యే వరకు ఈ ప్రక్రియ కొనసాగుతుంది.
YOLO యొక్క విభిన్న వైవిధ్యాలు
మేము అత్యంత సాధారణ YOLO సంస్కరణల్లో కొన్నింటిని పరిశీలిస్తాము. ప్రారంభిద్దాం.
1. YOLov1
ప్రారంభ YOLO వెర్షన్ 2015లో ప్రచురణలో ప్రకటించబడింది "మీరు ఒకసారి మాత్రమే చూడండి: ఏకీకృత, నిజ-సమయ ఆబ్జెక్ట్ డిటెక్షన్” జోసెఫ్ రెడ్మోన్, సంతోష్ దివ్వాల, రాస్ గిర్షిక్ మరియు అలీ ఫర్హాది.
దాని వేగం, ఖచ్చితత్వం మరియు అభ్యాస సామర్థ్యం కారణంగా, YOLO త్వరగా ఆబ్జెక్ట్ ఐడెంటిఫికేషన్ ప్రాంతంలో ఆధిపత్యం చెలాయించింది మరియు అత్యంత విస్తృతంగా ఉపయోగించే అల్గారిథమ్గా మారింది. ఆబ్జెక్ట్ డిటెక్షన్ని వర్గీకరణ సమస్యగా పరిగణించే బదులు, రచయితలు భౌగోళికంగా వేరు చేయబడిన బౌండింగ్ బాక్స్లు మరియు అనుబంధ తరగతి సంభావ్యతలతో రిగ్రెషన్ సమస్యగా దీనిని సంప్రదించారు, దానిని వారు ఒకే ఉపయోగించి పరిష్కరించారు. నాడీ నెట్వర్క్.
YOLOv1 నిజ సమయంలో సెకనుకు 45 ఫ్రేమ్ల చొప్పున ఫోటోలను ప్రాసెస్ చేసింది, అయితే చిన్న వేరియంట్, ఫాస్ట్ YOLO, సెకనుకు 155 ఫ్రేమ్ల వద్ద ప్రాసెస్ చేయబడింది మరియు ఇప్పటికీ ఇతర రియల్ టైమ్ డిటెక్టర్ల కంటే రెట్టింపు mAPని పొందింది.
2. YOLov2
ఒక సంవత్సరం తర్వాత, 2016లో, జోసెఫ్ రెడ్మోన్ మరియు అలీ ఫర్హాదీ పేపర్లో YOLOv2 (YOLO9000 అని కూడా పిలుస్తారు)ని విడుదల చేశారు.YOLO9000: మెరుగైన, వేగవంతమైన, బలమైన. "
రియల్ టైమ్లో నడుస్తున్నప్పుడు 9000 విభిన్న వస్తువుల వర్గాలను కూడా అంచనా వేయగల మోడల్ సామర్థ్యం దీనికి 9000 హోదాను సంపాదించిపెట్టింది. కొత్త మోడల్ వెర్షన్ ఏకకాలంలో ఆబ్జెక్ట్ డిటెక్షన్ మరియు క్లాసిఫికేషన్ డేటాసెట్లపై శిక్షణ పొందడమే కాకుండా, డార్క్నెట్-19ని కొత్త బేస్లైన్గా కూడా పొందింది. మోడల్.
YOLOv2 కూడా పెద్ద విజయాన్ని సాధించింది మరియు త్వరగా తదుపరి స్టేట్ ఆఫ్ ది ఆర్ట్ ఆబ్జెక్ట్ రికగ్నిషన్ మోడల్గా మారింది, ఇతర ఇంజనీర్లు అల్గారిథమ్తో ప్రయోగాలు చేయడం మరియు వారి స్వంత, ప్రత్యేకమైన YOLO వెర్షన్లను తయారు చేయడం ప్రారంభించారు. వాటిలో కొన్ని పేపర్లోని వివిధ పాయింట్లలో చర్చించబడతాయి.
3. YOLov3
పేపర్లో "YOLOv3: యాన్ ఇంక్రిమెంటల్ ఇంప్రూవ్మెంట్,” జోసెఫ్ రెడ్మోన్ మరియు అలీ ఫర్హాది 2018లో అల్గోరిథం యొక్క కొత్త వెర్షన్ను ప్రచురించారు. ఇది డార్క్నెట్-53 ఆర్కిటెక్చర్పై నిర్మించబడింది. YOLOv3లో సాఫ్ట్మాక్స్ యాక్టివేషన్ మెకానిజం స్థానంలో ఇండిపెండెంట్ లాజిస్టిక్ క్లాసిఫైయర్లు వచ్చాయి.
శిక్షణ సమయంలో బైనరీ క్రాస్-ఎంట్రోపీ నష్టం ఉపయోగించబడింది. డార్క్నెట్-19 మెరుగుపరచబడింది మరియు డార్క్నెట్-53గా పేరు మార్చబడింది, ఇది ఇప్పుడు 53 కన్వల్యూషనల్ లేయర్లను కలిగి ఉంది. అది పక్కన పెడితే, అంచనాలు మూడు విభిన్న ప్రమాణాలపై జరిగాయి, ఇది YOLOv3 చిన్న విషయాలను అంచనా వేయడంలో దాని ఖచ్చితత్వాన్ని మెరుగుపరచడంలో సహాయపడింది.
YOLOv3 అనేది జోసెఫ్ రెడ్మోన్ యొక్క చివరి YOLO వెర్షన్, ఎందుకంటే అతను తన పని ప్రపంచంపై హానికరమైన ప్రభావాన్ని చూపకుండా ఉండటానికి తదుపరి YOLO మెరుగుదలలపై (లేదా కంప్యూటర్ విజన్ ఏరియాలో కూడా) పని చేయకూడదని నిర్ణయించుకున్నాడు. ఇది ఇప్పుడు ఎక్కువగా ప్రత్యేకమైన ఆబ్జెక్ట్-డిటెక్షన్ ఆర్కిటెక్చర్లను నిర్మించడానికి ప్రారంభ బిందువుగా ఉపయోగించబడుతుంది.
4. యోలోవ్4
అలెక్సీ బోచ్కోవ్స్కీ, చియెన్-యావో వాంగ్ మరియు హాంగ్-యువాన్ మార్క్ లియావో ప్రచురించారు "YOLov4: ఆప్టిమల్ స్పీడ్ మరియు ఆబ్జెక్ట్ డిటెక్షన్ యొక్క ఖచ్చితత్వం” ఏప్రిల్ 2020లో, ఇది YOLO అల్గారిథమ్ యొక్క నాల్గవ పునరావృతం.
వెయిటెడ్ రెసిడ్యువల్ కనెక్షన్లు, క్రాస్-స్టేజ్-పాక్షిక కనెక్షన్లు, క్రాస్ మినీ-బ్యాచ్ సాధారణీకరణ, స్వీయ-వ్యతిరేక శిక్షణ, మిష్ యాక్టివేషన్, డ్రాప్ బ్లాక్ మరియు CIoU లాస్ అన్నీ SPDarknet53 ఆర్కిటెక్చర్లో భాగంగా ప్రవేశపెట్టబడ్డాయి.
YOLOv4 అనేది YOLO కుటుంబానికి చెందినది, అయితే, ఇది ప్రత్యేక శాస్త్రవేత్తలచే అభివృద్ధి చేయబడింది (జోసెఫ్ రెడ్మోన్ మరియు అలీ ఫర్హాదీ కాదు). SPDarknet53 వెన్నెముక, స్పేషియల్ పిరమిడ్ పూలింగ్, మెడగా PANet పాత్-అగ్రిగేషన్ మరియు YOLOv3 హెడ్ దాని నిర్మాణాన్ని రూపొందించాయి.
పర్యవసానంగా, దాని పేరెంట్, YOLOv3తో పోల్చినప్పుడు, YOLOv4 10% అధిక సగటు ఖచ్చితత్వాన్ని మరియు సెకనుకు 12% మెరుగైన ఫ్రేమ్లను సాధిస్తుంది.
5. YOLov5
YOLov5 COCO డేటాసెట్లో ముందస్తుగా శిక్షణ పొందిన YOLO మోడల్ ఆధారంగా ఆబ్జెక్ట్ ఐడెంటిఫికేషన్ మోడల్లు మరియు అల్గారిథమ్ల శ్రేణిని కలిగి ఉన్న ఓపెన్ సోర్స్ ప్రాజెక్ట్.
YOLOv5 అనేది సమ్మేళనం-స్కేల్ చేయబడిన వస్తువు గుర్తింపు నమూనాల సమాహారం TTA, మోడల్ అసెంబ్లీ, హైపర్పారామీటర్ డెవలప్మెంట్ మరియు ONNX, CoreML మరియు TFLiteకి ఎగుమతి చేయడానికి సులభమైన సామర్థ్యాలతో COCO డేటాసెట్పై శిక్షణ పొందారు. YOLOv5 ఏ ప్రత్యేక విధానాలను అమలు చేయనందున లేదా అభివృద్ధి చేయనందున, అధికారిక పత్రాన్ని విడుదల చేయడం సాధ్యపడలేదు. ఇది కేవలం YOLOv3 యొక్క PyTorch పొడిగింపు.
Ultranytics దాని స్పాన్సర్షిప్ క్రింద "కొత్త YOLO" సంస్కరణను ప్రచారం చేయడానికి ఈ దృష్టాంతాన్ని ఉపయోగించుకుంది. ఐదు ప్రీ-ట్రైన్డ్ మోడల్లు కూడా అందుబాటులో ఉన్నందున, YOLOv5 హోమ్పేజీ చాలా సూటిగా మరియు వృత్తిపరంగా నిర్మాణాత్మకంగా మరియు వ్రాయబడింది, శిక్షణ మరియు YOLOv5 మోడల్లను ఉపయోగించడంపై అనేక పాఠాలు మరియు సూచనలతో.
YOLO పరిమితులు
YOLO అనేది పరిష్కరించడానికి గొప్ప టెక్నిక్గా కనిపిస్తున్నప్పటికీ వస్తువు గుర్తింపు సమస్యలు, దీనికి అనేక లోపాలు ఉన్నాయి. ప్రతి గ్రిడ్ ఒక అంశాన్ని మాత్రమే గుర్తించగలదు కాబట్టి, YOLOకి సమూహాలలో కనిపించే చిత్రాలలో చిన్న విషయాలను గుర్తించడం మరియు వేరు చేయడం కష్టం. చీమల గుంపు వంటి సమూహాలలోని చిన్న వస్తువులను గుర్తించడం మరియు గుర్తించడం YOLOకి కష్టం.
ఫాస్ట్ RCNN వంటి గణనీయంగా నెమ్మదిగా ఉన్న ఆబ్జెక్ట్ గుర్తింపు పద్ధతులతో పోల్చినప్పుడు, YOLO కూడా తక్కువ ఖచ్చితత్వంతో ఉంటుంది.
YOLOv5ని ఉపయోగించడం ప్రారంభించండి
మీకు YOLOv5 చర్యను చూడాలని ఆసక్తి ఉంటే, తనిఖీ చేయండి అధికారిక GitHub మరియు PyTorchలో YOLOv5.
ముగింపు
YOLOv5 యొక్క ప్రారంభ వెర్షన్ చాలా శీఘ్రమైనది, పనితీరు మరియు ఉపయోగించడానికి సులభమైనది. YOLOv5 YOLO కుటుంబానికి ఎలాంటి కొత్త మోడల్ ఆర్కిటెక్చర్ను జోడించనప్పటికీ, ఇది కొత్త PyTorch శిక్షణ మరియు విస్తరణ ఫ్రేమ్వర్క్ను అందిస్తుంది, ఇది ఆబ్జెక్ట్ డిటెక్టర్ల కోసం కళ యొక్క స్థితిని మెరుగుపరుస్తుంది.
ఇంకా, YOLOv5 చాలా యూజర్ ఫ్రెండ్లీ మరియు బెస్పోక్ ఆబ్జెక్ట్లపై ఉపయోగించడానికి "అవుట్ ఆఫ్ ది బాక్స్" సిద్ధంగా ఉంది.
సమాధానం ఇవ్వూ