YOLO పరిచయం: రియల్ టైమ్ ఆబ్జెక్ట్ డిటెక్షన్

విషయ సూచిక[దాచు][చూపండి]

కాబట్టి, YOLO అంటే ఏమిటి?
YOLO పని చేస్తోంది
YOLO యొక్క విభిన్న వైవిధ్యాలు+-
YOLO పరిమితులు
YOLOv5ని ఉపయోగించడం ప్రారంభించండి
ముగింపు

ఆబ్జెక్ట్ డిటెక్షన్ అనేది ఒక రకమైన ఇమేజ్ వర్గీకరణ, దీనిలో న్యూరల్ నెట్‌వర్క్ చిత్రంలో అంశాలను అంచనా వేస్తుంది మరియు వాటి చుట్టూ సరిహద్దు పెట్టెలను గీస్తుంది. ప్రీసెట్ క్లాస్ సెట్‌కు అనుగుణంగా ఉండే ఇమేజ్‌లోని విషయాలను గుర్తించడం మరియు స్థానికీకరించడం అనేది ఆబ్జెక్ట్ డిటెక్షన్‌గా సూచించబడుతుంది.

ఆబ్జెక్ట్ డిటెక్షన్ (ఆబ్జెక్ట్ రికగ్నిషన్ అని కూడా పిలుస్తారు) అనేది కంప్యూటర్ విజన్ యొక్క ప్రత్యేకించి ముఖ్యమైన సబ్‌డొమైన్, ఎందుకంటే గుర్తింపు, గుర్తింపు మరియు స్థానికీకరణ వంటి పనులు వాస్తవ-ప్రపంచ సందర్భాలలో విస్తృత అనువర్తనాన్ని కనుగొంటాయి.

YOLO విధానం ఈ పనులను చేయడంలో మీకు సహాయపడుతుంది. ఈ వ్యాసంలో, YOLO అంటే ఏమిటి, ఇది ఎలా పని చేస్తుంది, విభిన్న వైవిధ్యాలు మరియు మరిన్నింటితో సహా మేము దానిని నిశితంగా పరిశీలిస్తాము.

కాబట్టి, YOLO అంటే ఏమిటి?

YOLO అనేది ఫోటోగ్రాఫ్‌లలో నిజ-సమయ వస్తువు గుర్తింపు మరియు గుర్తింపు కోసం ఒక పద్ధతి. ఇది యు ఓన్లీ లుక్ వన్స్ అనే పదానికి సంక్షిప్త రూపం. రెడ్‌మండ్ మరియు ఇతరులు. కంప్యూటర్ విజన్ అండ్ ప్యాటర్న్ రికగ్నిషన్ (CVPR)పై IEEE/CVF కాన్ఫరెన్స్‌లో 2015లో మొదట ప్రచురించబడిన పేపర్‌లో ఈ విధానాన్ని ప్రతిపాదించారు.

పేపర్‌కి ఓపెన్‌సివి పీపుల్స్ ఛాయిస్ అవార్డు లభించింది. మునుపటి ఆబ్జెక్ట్ ఐడెంటిఫికేషన్ పద్ధతుల వలె కాకుండా, గుర్తించడానికి వర్గీకరణదారులను పునర్నిర్మించింది, YOLO ఎండ్-టు-ఎండ్ వినియోగాన్ని ప్రతిపాదించింది నాడీ నెట్వర్క్ ఇది సరిహద్దు పెట్టెలు మరియు తరగతి సంభావ్యతలను ఏకకాలంలో అంచనా వేస్తుంది.

YOLO ఆబ్జెక్ట్ రికగ్నిషన్‌కు ప్రాథమికంగా కొత్త విధానాన్ని తీసుకోవడం ద్వారా అత్యాధునిక ఫలితాలను అందిస్తుంది, మునుపటి నిజ-సమయ ఆబ్జెక్ట్ డిటెక్షన్ పద్ధతులను సులభంగా అధిగమించింది.

YOLO పని చేస్తోంది

YOLO పద్ధతి చిత్రాన్ని N గ్రిడ్‌లుగా విభజిస్తుంది, ప్రతి ఒక్కటి సమాన-పరిమాణ SxS డైమెన్షనల్ సెక్టార్‌తో ఉంటుంది. ఈ N గ్రిడ్‌లలో ప్రతి ఒక్కటి అది కలిగి ఉన్న వస్తువును గుర్తించడం మరియు గుర్తించడం బాధ్యత వహిస్తుంది.

YOLO ఆర్కిటెక్చర్

ఈ గ్రిడ్‌లు, సెల్ కోఆర్డినేట్‌లకు సంబంధించి B బౌండింగ్ బాక్స్ కోఆర్డినేట్‌లను, అలాగే సెల్‌లో ఉన్న వస్తువు పేరు మరియు సంభావ్యతను అంచనా వేస్తాయి. వైవిధ్యమైన సరిహద్దు పెట్టె అంచనాలతో అనేక కణాలు ఒకే అంశాన్ని అంచనా వేయడం వలన, ఈ సాంకేతికత గణనను గణనీయంగా తగ్గిస్తుంది ఎందుకంటే గుర్తించడం మరియు గుర్తింపు రెండూ చిత్రం నుండి కణాల ద్వారా నిర్వహించబడతాయి.

అయినప్పటికీ, ఇది చాలా నకిలీ అంచనాలను ఉత్పత్తి చేస్తుంది. ఈ సమస్యను పరిష్కరించడానికి, YOLO నాన్-మాక్సిమల్ సప్రెషన్‌ని ఉపయోగిస్తుంది. YOLO నాన్-గరిష్ట సప్రెషన్‌లో తక్కువ సంభావ్యత స్కోర్‌లతో అన్ని బౌండింగ్ బాక్స్‌లను అణిచివేస్తుంది.

YOLO ప్రతి ఎంపికతో లింక్ చేయబడిన సంభావ్యత స్కోర్‌లను పరిశీలించడం ద్వారా మరియు అత్యధిక స్కోర్‌తో ఉన్నదాన్ని ఎంచుకోవడం ద్వారా దీన్ని చేస్తుంది. ప్రస్తుత అధిక సంభావ్యత బౌండింగ్ బాక్స్‌తో యూనియన్‌పై అతిపెద్ద ఖండనతో బౌండింగ్ బాక్స్‌లు అణచివేయబడతాయి.

YOLO పని చేస్తోంది

సరిహద్దు పెట్టెలు పూర్తయ్యే వరకు ఈ ప్రక్రియ కొనసాగుతుంది.

YOLO యొక్క విభిన్న వైవిధ్యాలు

మేము అత్యంత సాధారణ YOLO సంస్కరణల్లో కొన్నింటిని పరిశీలిస్తాము. ప్రారంభిద్దాం.

1. YOLov1

ప్రారంభ YOLO వెర్షన్ 2015లో ప్రచురణలో ప్రకటించబడింది "మీరు ఒకసారి మాత్రమే చూడండి: ఏకీకృత, నిజ-సమయ ఆబ్జెక్ట్ డిటెక్షన్” జోసెఫ్ రెడ్‌మోన్, సంతోష్ దివ్వాల, రాస్ గిర్‌షిక్ మరియు అలీ ఫర్హాది.

దాని వేగం, ఖచ్చితత్వం మరియు అభ్యాస సామర్థ్యం కారణంగా, YOLO త్వరగా ఆబ్జెక్ట్ ఐడెంటిఫికేషన్ ప్రాంతంలో ఆధిపత్యం చెలాయించింది మరియు అత్యంత విస్తృతంగా ఉపయోగించే అల్గారిథమ్‌గా మారింది. ఆబ్జెక్ట్ డిటెక్షన్‌ని వర్గీకరణ సమస్యగా పరిగణించే బదులు, రచయితలు భౌగోళికంగా వేరు చేయబడిన బౌండింగ్ బాక్స్‌లు మరియు అనుబంధ తరగతి సంభావ్యతలతో రిగ్రెషన్ సమస్యగా దీనిని సంప్రదించారు, దానిని వారు ఒకే ఉపయోగించి పరిష్కరించారు. నాడీ నెట్వర్క్.

YOLov1

YOLOv1 నిజ సమయంలో సెకనుకు 45 ఫ్రేమ్‌ల చొప్పున ఫోటోలను ప్రాసెస్ చేసింది, అయితే చిన్న వేరియంట్, ఫాస్ట్ YOLO, సెకనుకు 155 ఫ్రేమ్‌ల వద్ద ప్రాసెస్ చేయబడింది మరియు ఇప్పటికీ ఇతర రియల్ టైమ్ డిటెక్టర్‌ల కంటే రెట్టింపు mAPని పొందింది.

2. YOLov2

ఒక సంవత్సరం తర్వాత, 2016లో, జోసెఫ్ రెడ్‌మోన్ మరియు అలీ ఫర్హాదీ పేపర్‌లో YOLOv2 (YOLO9000 అని కూడా పిలుస్తారు)ని విడుదల చేశారు.YOLO9000: మెరుగైన, వేగవంతమైన, బలమైన. "

రియల్ టైమ్‌లో నడుస్తున్నప్పుడు 9000 విభిన్న వస్తువుల వర్గాలను కూడా అంచనా వేయగల మోడల్ సామర్థ్యం దీనికి 9000 హోదాను సంపాదించిపెట్టింది. కొత్త మోడల్ వెర్షన్ ఏకకాలంలో ఆబ్జెక్ట్ డిటెక్షన్ మరియు క్లాసిఫికేషన్ డేటాసెట్‌లపై శిక్షణ పొందడమే కాకుండా, డార్క్‌నెట్-19ని కొత్త బేస్‌లైన్‌గా కూడా పొందింది. మోడల్.

YOLov2

YOLOv2 కూడా పెద్ద విజయాన్ని సాధించింది మరియు త్వరగా తదుపరి స్టేట్ ఆఫ్ ది ఆర్ట్ ఆబ్జెక్ట్ రికగ్నిషన్ మోడల్‌గా మారింది, ఇతర ఇంజనీర్లు అల్గారిథమ్‌తో ప్రయోగాలు చేయడం మరియు వారి స్వంత, ప్రత్యేకమైన YOLO వెర్షన్‌లను తయారు చేయడం ప్రారంభించారు. వాటిలో కొన్ని పేపర్‌లోని వివిధ పాయింట్లలో చర్చించబడతాయి.

3. YOLov3

పేపర్లో "YOLOv3: యాన్ ఇంక్రిమెంటల్ ఇంప్రూవ్‌మెంట్,” జోసెఫ్ రెడ్‌మోన్ మరియు అలీ ఫర్హాది 2018లో అల్గోరిథం యొక్క కొత్త వెర్షన్‌ను ప్రచురించారు. ఇది డార్క్‌నెట్-53 ఆర్కిటెక్చర్‌పై నిర్మించబడింది. YOLOv3లో సాఫ్ట్‌మాక్స్ యాక్టివేషన్ మెకానిజం స్థానంలో ఇండిపెండెంట్ లాజిస్టిక్ క్లాసిఫైయర్‌లు వచ్చాయి.

శిక్షణ సమయంలో బైనరీ క్రాస్-ఎంట్రోపీ నష్టం ఉపయోగించబడింది. డార్క్‌నెట్-19 మెరుగుపరచబడింది మరియు డార్క్‌నెట్-53గా పేరు మార్చబడింది, ఇది ఇప్పుడు 53 కన్వల్యూషనల్ లేయర్‌లను కలిగి ఉంది. అది పక్కన పెడితే, అంచనాలు మూడు విభిన్న ప్రమాణాలపై జరిగాయి, ఇది YOLOv3 చిన్న విషయాలను అంచనా వేయడంలో దాని ఖచ్చితత్వాన్ని మెరుగుపరచడంలో సహాయపడింది.

YOLov3

YOLOv3 అనేది జోసెఫ్ రెడ్‌మోన్ యొక్క చివరి YOLO వెర్షన్, ఎందుకంటే అతను తన పని ప్రపంచంపై హానికరమైన ప్రభావాన్ని చూపకుండా ఉండటానికి తదుపరి YOLO మెరుగుదలలపై (లేదా కంప్యూటర్ విజన్ ఏరియాలో కూడా) పని చేయకూడదని నిర్ణయించుకున్నాడు. ఇది ఇప్పుడు ఎక్కువగా ప్రత్యేకమైన ఆబ్జెక్ట్-డిటెక్షన్ ఆర్కిటెక్చర్‌లను నిర్మించడానికి ప్రారంభ బిందువుగా ఉపయోగించబడుతుంది.

4. యోలోవ్4

అలెక్సీ బోచ్కోవ్స్కీ, చియెన్-యావో వాంగ్ మరియు హాంగ్-యువాన్ మార్క్ లియావో ప్రచురించారు "YOLov4: ఆప్టిమల్ స్పీడ్ మరియు ఆబ్జెక్ట్ డిటెక్షన్ యొక్క ఖచ్చితత్వం” ఏప్రిల్ 2020లో, ఇది YOLO అల్గారిథమ్ యొక్క నాల్గవ పునరావృతం.

వెయిటెడ్ రెసిడ్యువల్ కనెక్షన్‌లు, క్రాస్-స్టేజ్-పాక్షిక కనెక్షన్‌లు, క్రాస్ మినీ-బ్యాచ్ సాధారణీకరణ, స్వీయ-వ్యతిరేక శిక్షణ, మిష్ యాక్టివేషన్, డ్రాప్ బ్లాక్ మరియు CIoU లాస్ అన్నీ SPDarknet53 ఆర్కిటెక్చర్‌లో భాగంగా ప్రవేశపెట్టబడ్డాయి.

YOLov4

YOLOv4 అనేది YOLO కుటుంబానికి చెందినది, అయితే, ఇది ప్రత్యేక శాస్త్రవేత్తలచే అభివృద్ధి చేయబడింది (జోసెఫ్ రెడ్‌మోన్ మరియు అలీ ఫర్హాదీ కాదు). SPDarknet53 వెన్నెముక, స్పేషియల్ పిరమిడ్ పూలింగ్, మెడగా PANet పాత్-అగ్రిగేషన్ మరియు YOLOv3 హెడ్ దాని నిర్మాణాన్ని రూపొందించాయి.

పర్యవసానంగా, దాని పేరెంట్, YOLOv3తో పోల్చినప్పుడు, YOLOv4 10% అధిక సగటు ఖచ్చితత్వాన్ని మరియు సెకనుకు 12% మెరుగైన ఫ్రేమ్‌లను సాధిస్తుంది.

5. YOLov5

YOLov5 COCO డేటాసెట్‌లో ముందస్తుగా శిక్షణ పొందిన YOLO మోడల్ ఆధారంగా ఆబ్జెక్ట్ ఐడెంటిఫికేషన్ మోడల్‌లు మరియు అల్గారిథమ్‌ల శ్రేణిని కలిగి ఉన్న ఓపెన్ సోర్స్ ప్రాజెక్ట్.

YOLOv5 అనేది సమ్మేళనం-స్కేల్ చేయబడిన వస్తువు గుర్తింపు నమూనాల సమాహారం TTA, మోడల్ అసెంబ్లీ, హైపర్‌పారామీటర్ డెవలప్‌మెంట్ మరియు ONNX, CoreML మరియు TFLiteకి ఎగుమతి చేయడానికి సులభమైన సామర్థ్యాలతో COCO డేటాసెట్‌పై శిక్షణ పొందారు. YOLOv5 ఏ ప్రత్యేక విధానాలను అమలు చేయనందున లేదా అభివృద్ధి చేయనందున, అధికారిక పత్రాన్ని విడుదల చేయడం సాధ్యపడలేదు. ఇది కేవలం YOLOv3 యొక్క PyTorch పొడిగింపు.

YOLOv5 వైవిధ్యాలు

Ultranytics దాని స్పాన్సర్‌షిప్ క్రింద "కొత్త YOLO" సంస్కరణను ప్రచారం చేయడానికి ఈ దృష్టాంతాన్ని ఉపయోగించుకుంది. ఐదు ప్రీ-ట్రైన్డ్ మోడల్‌లు కూడా అందుబాటులో ఉన్నందున, YOLOv5 హోమ్‌పేజీ చాలా సూటిగా మరియు వృత్తిపరంగా నిర్మాణాత్మకంగా మరియు వ్రాయబడింది, శిక్షణ మరియు YOLOv5 మోడల్‌లను ఉపయోగించడంపై అనేక పాఠాలు మరియు సూచనలతో.

YOLOv5 వేగం

YOLO పరిమితులు

YOLO అనేది పరిష్కరించడానికి గొప్ప టెక్నిక్‌గా కనిపిస్తున్నప్పటికీ వస్తువు గుర్తింపు సమస్యలు, దీనికి అనేక లోపాలు ఉన్నాయి. ప్రతి గ్రిడ్ ఒక అంశాన్ని మాత్రమే గుర్తించగలదు కాబట్టి, YOLOకి సమూహాలలో కనిపించే చిత్రాలలో చిన్న విషయాలను గుర్తించడం మరియు వేరు చేయడం కష్టం. చీమల గుంపు వంటి సమూహాలలోని చిన్న వస్తువులను గుర్తించడం మరియు గుర్తించడం YOLOకి కష్టం.

ఫాస్ట్ RCNN వంటి గణనీయంగా నెమ్మదిగా ఉన్న ఆబ్జెక్ట్ గుర్తింపు పద్ధతులతో పోల్చినప్పుడు, YOLO కూడా తక్కువ ఖచ్చితత్వంతో ఉంటుంది.

YOLOv5ని ఉపయోగించడం ప్రారంభించండి

మీకు YOLOv5 చర్యను చూడాలని ఆసక్తి ఉంటే, తనిఖీ చేయండి అధికారిక GitHub మరియు PyTorchలో YOLOv5.

ముగింపు

YOLOv5 యొక్క ప్రారంభ వెర్షన్ చాలా శీఘ్రమైనది, పనితీరు మరియు ఉపయోగించడానికి సులభమైనది. YOLOv5 YOLO కుటుంబానికి ఎలాంటి కొత్త మోడల్ ఆర్కిటెక్చర్‌ను జోడించనప్పటికీ, ఇది కొత్త PyTorch శిక్షణ మరియు విస్తరణ ఫ్రేమ్‌వర్క్‌ను అందిస్తుంది, ఇది ఆబ్జెక్ట్ డిటెక్టర్‌ల కోసం కళ యొక్క స్థితిని మెరుగుపరుస్తుంది.

ఇంకా, YOLOv5 చాలా యూజర్ ఫ్రెండ్లీ మరియు బెస్పోక్ ఆబ్జెక్ట్‌లపై ఉపయోగించడానికి "అవుట్ ఆఫ్ ది బాక్స్" సిద్ధంగా ఉంది.

YOLO పరిచయం: రియల్ టైమ్ ఆబ్జెక్ట్ డిటెక్షన్

కాబట్టి, YOLO అంటే ఏమిటి?

YOLO పని చేస్తోంది