విషయ సూచిక[దాచు][చూపండి]
- చిత్రం వర్గీకరణ అంటే ఏమిటి?
- చిత్రం వర్గీకరణ ఎలా పని చేస్తుంది?
పైథాన్లో టెన్సార్ఫ్లో & కేరాస్ని ఉపయోగించి చిత్ర వర్గీకరణ+-
- 1. సంస్థాపన అవసరాలు
- 2. డిపెండెన్సీలను దిగుమతి చేసుకోవడం
- 3. పారామితులను ప్రారంభించడం
- 4. డేటాసెట్ను లోడ్ చేస్తోంది
- 5. మోడల్ సృష్టిస్తోంది
- 6. మోడల్ శిక్షణ
- మోడల్ను పరీక్షిస్తోంది
- 7. పరీక్ష కోసం యుటిలిటీలను దిగుమతి చేస్తోంది
- 8. పైథాన్ డైరెక్టరీని తయారు చేయడం
- 9. పరీక్ష డేటా & మోడల్ లోడ్ అవుతోంది
- 10. మూల్యాంకనం & అంచనా
- 11. ఫలితాలు
- ముగింపు
ఉదాహరణ ద్వారా నేర్చుకునే మరియు వాటి పరిసరాలను గ్రహించే మా సహజ సామర్థ్యాలతో మేము రోబోలను నింపగలిగాము అని తెలుసుకోవడం చాలా భరోసానిస్తుంది. ప్రాథమిక సవాలు ఏమిటంటే, మానవులకు చాలా ఎక్కువ సమయం మరియు కృషి అవసరమయ్యేలా “చూడడానికి” కంప్యూటర్లకు బోధించడం.
అయితే, ఈ నైపుణ్యం ప్రస్తుతం సంస్థలు మరియు సంస్థలకు అందించే ఆచరణాత్మక విలువను పరిగణనలోకి తీసుకున్నప్పుడు, కృషి విలువైనదే. ఈ కథనంలో, మీరు చిత్ర వర్గీకరణ, ఇది ఎలా పని చేస్తుంది మరియు దాని ఆచరణాత్మక అమలు గురించి నేర్చుకుంటారు. ప్రారంభిద్దాం.
చిత్రం వర్గీకరణ అంటే ఏమిటి?
ఒక చిత్రాన్ని ఫీడ్ చేసే పని నాడీ నెట్వర్క్ మరియు అది ఆ చిత్రం కోసం లేబుల్ యొక్క కొన్ని రూపాలను అవుట్పుట్ చేయడాన్ని ఇమేజ్ రికగ్నిషన్ అంటారు. నెట్వర్క్ అవుట్పుట్ లేబుల్ ముందే నిర్వచించబడిన తరగతికి అనుగుణంగా ఉంటుంది.
చిత్రానికి అనేక తరగతులు కేటాయించబడి ఉండవచ్చు లేదా కేవలం ఒకటి ఉండవచ్చు. ఒకే తరగతి ఉన్నప్పుడు, "గుర్తింపు" అనే పదం తరచుగా ఉపయోగించబడుతుంది, అయితే బహుళ తరగతులు ఉన్నప్పుడు, "వర్గీకరణ" అనే పదం తరచుగా ఉపయోగించబడుతుంది.
వస్తువు గుర్తింపు అనేది చిత్ర వర్గీకరణ యొక్క ఉపసమితి, దీనిలో నిర్దిష్ట వస్తువులు జంతువులు, వాహనాలు లేదా మానవులు వంటి నిర్దిష్ట తరగతికి చెందినవిగా గుర్తించబడతాయి.
చిత్రం వర్గీకరణ ఎలా పని చేస్తుంది?
పిక్సెల్ల రూపంలో ఉన్న ఇమేజ్ని కంప్యూటర్ ద్వారా విశ్లేషిస్తారు. ఇది చిత్రాన్ని మాత్రికల సమాహారంగా పరిగణించడం ద్వారా దీనిని సాధిస్తుంది, దీని పరిమాణం ఇమేజ్ రిజల్యూషన్ ద్వారా నిర్ణయించబడుతుంది. సరళంగా చెప్పాలంటే, పిక్చర్ క్లాసిఫికేషన్ అనేది కంప్యూటర్ కోణం నుండి అల్గారిథమ్లను ఉపయోగించి గణాంక డేటాను అధ్యయనం చేయడం.
పిక్సెల్లను ముందుగా నిర్ణయించిన సమూహాలుగా లేదా “తరగతులు”గా వర్గీకరించడం ద్వారా డిజిటల్ ఇమేజ్ ప్రాసెసింగ్లో చిత్ర వర్గీకరణ సాధించబడుతుంది. అల్గారిథమ్లు ఇమేజ్ని గుర్తించదగిన లక్షణాల వరుసలో విభజిస్తాయి, ఇది తుది వర్గీకరణకు భారాన్ని తగ్గిస్తుంది.
ఈ లక్షణాలు చిత్రం యొక్క అర్థం మరియు సంభావ్య వర్గీకరణ గురించి వర్గీకరణకు తెలియజేస్తాయి. చిత్రాన్ని వర్గీకరించడంలో మిగిలిన ప్రక్రియలు దానిపై ఆధారపడి ఉంటాయి కాబట్టి, లక్షణ సంగ్రహణ పద్ధతి అత్యంత క్లిష్టమైన దశ.
మా డేటా అందించబడింది చిత్ర వర్గీకరణలో, ముఖ్యంగా పర్యవేక్షించబడే వర్గీకరణలో అల్గోరిథం కూడా కీలకం. తరగతి మరియు తక్కువ చిత్రం మరియు ఉల్లేఖన నాణ్యత ఆధారంగా డేటా అసమతుల్యతతో కూడిన భయంకరమైన డేటాసెట్తో పోల్చితే, బాగా ఆప్టిమైజ్ చేయబడిన వర్గీకరణ డేటాసెట్ అద్భుతంగా పని చేస్తుంది.
పైథాన్లో టెన్సార్ఫ్లో & కేరాస్ని ఉపయోగించి చిత్ర వర్గీకరణ
మేము ఉపయోగిస్తాము CIFAR-10 డేటాసెట్ (ఇందులో విమానం, విమానాలు, పక్షులు మరియు ఇతర 7 వస్తువులు ఉంటాయి).
1. సంస్థాపన అవసరాలు
దిగువ కోడ్ అన్ని ముందస్తు అవసరాలను ఇన్స్టాల్ చేస్తుంది.
2. డిపెండెన్సీలను దిగుమతి చేసుకోవడం
పైథాన్లో train.py ఫైల్ను రూపొందించండి. దిగువ కోడ్ Tensorflow మరియు Keras డిపెండెన్సీలను దిగుమతి చేస్తుంది.
3. పారామితులను ప్రారంభించడం
CIFAR-10 కేవలం 10 చిత్ర వర్గాలను కలిగి ఉంది, అందువల్ల సంఖ్య తరగతులు వర్గీకరించడానికి వర్గాల సంఖ్యను సూచిస్తాయి.
4. డేటాసెట్ను లోడ్ చేస్తోంది
ఫంక్షన్ డేటాసెట్ను లోడ్ చేయడానికి Tensorflow డేటాసెట్ల మాడ్యూల్ని ఉపయోగిస్తుంది మరియు దాని గురించి కొంత సమాచారాన్ని పొందేందుకు మేము సమాచారాన్ని ట్రూకి సెట్ చేస్తాము. ఫీల్డ్లు మరియు వాటి విలువలు ఏమిటో చూడడానికి మీరు దాన్ని ప్రింట్ చేయవచ్చు మరియు శిక్షణ మరియు పరీక్ష సెట్లలోని నమూనాల సంఖ్యను తిరిగి పొందడానికి మేము సమాచారాన్ని ఉపయోగిస్తాము.
5. మోడల్ సృష్టిస్తోంది
ఇప్పుడు మేము మూడు లేయర్లను నిర్మిస్తాము, ప్రతి ఒక్కటి గరిష్టంగా పూలింగ్ మరియు ReLU యాక్టివేషన్ ఫంక్షన్తో రెండు ConvNets కలిగి ఉంటుంది, దాని తర్వాత పూర్తిగా కనెక్ట్ చేయబడిన 1024-యూనిట్ సిస్టమ్ ఉంటుంది. అత్యాధునిక మోడల్స్ అయిన ResNet50 లేదా Xceptionతో పోల్చితే, ఇది చాలా చిన్న మోడల్ కావచ్చు.
6. మోడల్ శిక్షణ
ప్రతి యుగంలో ఖచ్చితత్వం మరియు నష్టాన్ని కొలవడానికి నేను టెన్సర్బోర్డ్ని ఉపయోగించాను మరియు డేటాను దిగుమతి చేసుకున్న తర్వాత మరియు మోడల్ను రూపొందించిన తర్వాత మాకు మనోహరమైన ప్రదర్శనను అందించాను. కింది కోడ్ను అమలు చేయండి; మీ CPU/GPU ఆధారంగా, శిక్షణకు చాలా నిమిషాలు పడుతుంది.
టెన్సర్బోర్డ్ని ఉపయోగించడానికి, ప్రస్తుత డైరెక్టరీలో టెర్మినల్ లేదా కమాండ్ ప్రాంప్ట్లో కింది ఆదేశాన్ని టైప్ చేయండి:
ధృవీకరణ నష్టం తగ్గడం మరియు ఖచ్చితత్వం దాదాపు 81%కి పెరగడం మీరు చూస్తారు. అది అద్భుతం!
మోడల్ను పరీక్షిస్తోంది
శిక్షణ పూర్తయినప్పుడు, తుది మోడల్ మరియు బరువులు ఫలితాల ఫోల్డర్లో సేవ్ చేయబడతాయి, మేము ఎంచుకున్నప్పుడు ఒకసారి శిక్షణ ఇవ్వడానికి మరియు అంచనాలను రూపొందించడానికి అనుమతిస్తుంది. test.py అనే కొత్త పైథాన్ ఫైల్లో కోడ్ని అనుసరించండి.
7. పరీక్ష కోసం యుటిలిటీలను దిగుమతి చేస్తోంది
8. పైథాన్ డైరెక్టరీని తయారు చేయడం
ప్రతి పూర్ణాంక విలువను డేటాసెట్ యొక్క తగిన లేబుల్కి అనువదించే పైథాన్ నిఘంటువును రూపొందించండి:
9. పరీక్ష డేటా & మోడల్ లోడ్ అవుతోంది
కింది కోడ్ పరీక్ష డేటా మరియు మోడల్ను లోడ్ చేస్తుంది.
10. మూల్యాంకనం & అంచనా
కింది కోడ్ కప్ప చిత్రాలను మూల్యాంకనం చేస్తుంది మరియు అంచనాలను చేస్తుంది.
11. ఫలితాలు
మోడల్ కప్పను 80.62% ఖచ్చితత్వంతో అంచనా వేసింది.
ముగింపు
సరే, మేము ఈ పాఠాన్ని పూర్తి చేసాము. కొద్దిగా CNNకి 80.62% మంచిది కానప్పటికీ, మెరుగైన ఫలితాల కోసం మోడల్ను మార్చమని లేదా ResNet50, Xception లేదా ఇతర అత్యాధునిక మోడల్లను చూడమని నేను మీకు గట్టిగా సలహా ఇస్తున్నాను.
ఇప్పుడు మీరు కెరాస్లో మీ మొదటి ఇమేజ్ రికగ్నిషన్ నెట్వర్క్ని నిర్మించారు, విభిన్న పారామితులు దాని పనితీరును ఎలా ప్రభావితం చేస్తాయో తెలుసుకోవడానికి మీరు మోడల్తో ప్రయోగాలు చేయాలి.
సమాధానం ఇవ్వూ