పైథాన్ - హాష్‌డోర్క్‌లో టెన్సార్‌ఫ్లో & కేరాస్‌తో డీప్ లెర్నింగ్ ఇమేజ్ క్లాసిఫికేషన్

విషయ సూచిక[దాచు][చూపండి]

చిత్రం వర్గీకరణ అంటే ఏమిటి?
చిత్రం వర్గీకరణ ఎలా పని చేస్తుంది?
పైథాన్‌లో టెన్సార్‌ఫ్లో & కేరాస్‌ని ఉపయోగించి చిత్ర వర్గీకరణ+-
ముగింపు

ఉదాహరణ ద్వారా నేర్చుకునే మరియు వాటి పరిసరాలను గ్రహించే మా సహజ సామర్థ్యాలతో మేము రోబోలను నింపగలిగాము అని తెలుసుకోవడం చాలా భరోసానిస్తుంది. ప్రాథమిక సవాలు ఏమిటంటే, మానవులకు చాలా ఎక్కువ సమయం మరియు కృషి అవసరమయ్యేలా “చూడడానికి” కంప్యూటర్‌లకు బోధించడం.

అయితే, ఈ నైపుణ్యం ప్రస్తుతం సంస్థలు మరియు సంస్థలకు అందించే ఆచరణాత్మక విలువను పరిగణనలోకి తీసుకున్నప్పుడు, కృషి విలువైనదే. ఈ కథనంలో, మీరు చిత్ర వర్గీకరణ, ఇది ఎలా పని చేస్తుంది మరియు దాని ఆచరణాత్మక అమలు గురించి నేర్చుకుంటారు. ప్రారంభిద్దాం.

చిత్రం వర్గీకరణ అంటే ఏమిటి?

ఒక చిత్రాన్ని ఫీడ్ చేసే పని నాడీ నెట్వర్క్ మరియు అది ఆ చిత్రం కోసం లేబుల్ యొక్క కొన్ని రూపాలను అవుట్‌పుట్ చేయడాన్ని ఇమేజ్ రికగ్నిషన్ అంటారు. నెట్‌వర్క్ అవుట్‌పుట్ లేబుల్ ముందే నిర్వచించబడిన తరగతికి అనుగుణంగా ఉంటుంది.

చిత్రానికి అనేక తరగతులు కేటాయించబడి ఉండవచ్చు లేదా కేవలం ఒకటి ఉండవచ్చు. ఒకే తరగతి ఉన్నప్పుడు, "గుర్తింపు" అనే పదం తరచుగా ఉపయోగించబడుతుంది, అయితే బహుళ తరగతులు ఉన్నప్పుడు, "వర్గీకరణ" అనే పదం తరచుగా ఉపయోగించబడుతుంది.

వస్తువు గుర్తింపు అనేది చిత్ర వర్గీకరణ యొక్క ఉపసమితి, దీనిలో నిర్దిష్ట వస్తువులు జంతువులు, వాహనాలు లేదా మానవులు వంటి నిర్దిష్ట తరగతికి చెందినవిగా గుర్తించబడతాయి.

చిత్రం వర్గీకరణ ఎలా పని చేస్తుంది?

పిక్సెల్‌ల రూపంలో ఉన్న ఇమేజ్‌ని కంప్యూటర్ ద్వారా విశ్లేషిస్తారు. ఇది చిత్రాన్ని మాత్రికల సమాహారంగా పరిగణించడం ద్వారా దీనిని సాధిస్తుంది, దీని పరిమాణం ఇమేజ్ రిజల్యూషన్ ద్వారా నిర్ణయించబడుతుంది. సరళంగా చెప్పాలంటే, పిక్చర్ క్లాసిఫికేషన్ అనేది కంప్యూటర్ కోణం నుండి అల్గారిథమ్‌లను ఉపయోగించి గణాంక డేటాను అధ్యయనం చేయడం.

పిక్సెల్‌లను ముందుగా నిర్ణయించిన సమూహాలుగా లేదా “తరగతులు”గా వర్గీకరించడం ద్వారా డిజిటల్ ఇమేజ్ ప్రాసెసింగ్‌లో చిత్ర వర్గీకరణ సాధించబడుతుంది. అల్గారిథమ్‌లు ఇమేజ్‌ని గుర్తించదగిన లక్షణాల వరుసలో విభజిస్తాయి, ఇది తుది వర్గీకరణకు భారాన్ని తగ్గిస్తుంది.

ఈ లక్షణాలు చిత్రం యొక్క అర్థం మరియు సంభావ్య వర్గీకరణ గురించి వర్గీకరణకు తెలియజేస్తాయి. చిత్రాన్ని వర్గీకరించడంలో మిగిలిన ప్రక్రియలు దానిపై ఆధారపడి ఉంటాయి కాబట్టి, లక్షణ సంగ్రహణ పద్ధతి అత్యంత క్లిష్టమైన దశ.

మా డేటా అందించబడింది చిత్ర వర్గీకరణలో, ముఖ్యంగా పర్యవేక్షించబడే వర్గీకరణలో అల్గోరిథం కూడా కీలకం. తరగతి మరియు తక్కువ చిత్రం మరియు ఉల్లేఖన నాణ్యత ఆధారంగా డేటా అసమతుల్యతతో కూడిన భయంకరమైన డేటాసెట్‌తో పోల్చితే, బాగా ఆప్టిమైజ్ చేయబడిన వర్గీకరణ డేటాసెట్ అద్భుతంగా పని చేస్తుంది.

పైథాన్‌లో టెన్సార్‌ఫ్లో & కేరాస్‌ని ఉపయోగించి చిత్ర వర్గీకరణ

మేము ఉపయోగిస్తాము CIFAR-10 డేటాసెట్ (ఇందులో విమానం, విమానాలు, పక్షులు మరియు ఇతర 7 వస్తువులు ఉంటాయి).

1. సంస్థాపన అవసరాలు

దిగువ కోడ్ అన్ని ముందస్తు అవసరాలను ఇన్‌స్టాల్ చేస్తుంది.

ఇన్‌స్టాలేషన్ అవసరాలు 1

2. డిపెండెన్సీలను దిగుమతి చేసుకోవడం

పైథాన్‌లో train.py ఫైల్‌ను రూపొందించండి. దిగువ కోడ్ Tensorflow మరియు Keras డిపెండెన్సీలను దిగుమతి చేస్తుంది.

డిపెండెన్సీలను దిగుమతి చేసుకోవడం 1

3. పారామితులను ప్రారంభించడం

CIFAR-10 కేవలం 10 చిత్ర వర్గాలను కలిగి ఉంది, అందువల్ల సంఖ్య తరగతులు వర్గీకరించడానికి వర్గాల సంఖ్యను సూచిస్తాయి.

పారామితులను ప్రారంభించడం

4. డేటాసెట్‌ను లోడ్ చేస్తోంది

ఫంక్షన్ డేటాసెట్‌ను లోడ్ చేయడానికి Tensorflow డేటాసెట్‌ల మాడ్యూల్‌ని ఉపయోగిస్తుంది మరియు దాని గురించి కొంత సమాచారాన్ని పొందేందుకు మేము సమాచారాన్ని ట్రూకి సెట్ చేస్తాము. ఫీల్డ్‌లు మరియు వాటి విలువలు ఏమిటో చూడడానికి మీరు దాన్ని ప్రింట్ చేయవచ్చు మరియు శిక్షణ మరియు పరీక్ష సెట్‌లలోని నమూనాల సంఖ్యను తిరిగి పొందడానికి మేము సమాచారాన్ని ఉపయోగిస్తాము.

5. మోడల్ సృష్టిస్తోంది

ఇప్పుడు మేము మూడు లేయర్‌లను నిర్మిస్తాము, ప్రతి ఒక్కటి గరిష్టంగా పూలింగ్ మరియు ReLU యాక్టివేషన్ ఫంక్షన్‌తో రెండు ConvNets కలిగి ఉంటుంది, దాని తర్వాత పూర్తిగా కనెక్ట్ చేయబడిన 1024-యూనిట్ సిస్టమ్ ఉంటుంది. అత్యాధునిక మోడల్స్ అయిన ResNet50 లేదా Xceptionతో పోల్చితే, ఇది చాలా చిన్న మోడల్ కావచ్చు.

మోడల్ సృష్టిస్తోంది 1

6. మోడల్ శిక్షణ

ప్రతి యుగంలో ఖచ్చితత్వం మరియు నష్టాన్ని కొలవడానికి నేను టెన్సర్‌బోర్డ్‌ని ఉపయోగించాను మరియు డేటాను దిగుమతి చేసుకున్న తర్వాత మరియు మోడల్‌ను రూపొందించిన తర్వాత మాకు మనోహరమైన ప్రదర్శనను అందించాను. కింది కోడ్‌ను అమలు చేయండి; మీ CPU/GPU ఆధారంగా, శిక్షణకు చాలా నిమిషాలు పడుతుంది.

మోడల్ శిక్షణ

టెన్సర్‌బోర్డ్‌ని ఉపయోగించడానికి, ప్రస్తుత డైరెక్టరీలో టెర్మినల్ లేదా కమాండ్ ప్రాంప్ట్‌లో కింది ఆదేశాన్ని టైప్ చేయండి:

టెన్సర్‌బోర్డ్ 1

ధృవీకరణ నష్టం తగ్గడం మరియు ఖచ్చితత్వం దాదాపు 81%కి పెరగడం మీరు చూస్తారు. అది అద్భుతం!

ధృవీకరణ ఖచ్చితత్వం

ధ్రువీకరణ నష్టం

మోడల్‌ను పరీక్షిస్తోంది

శిక్షణ పూర్తయినప్పుడు, తుది మోడల్ మరియు బరువులు ఫలితాల ఫోల్డర్‌లో సేవ్ చేయబడతాయి, మేము ఎంచుకున్నప్పుడు ఒకసారి శిక్షణ ఇవ్వడానికి మరియు అంచనాలను రూపొందించడానికి అనుమతిస్తుంది. test.py అనే కొత్త పైథాన్ ఫైల్‌లో కోడ్‌ని అనుసరించండి.

7. పరీక్ష కోసం యుటిలిటీలను దిగుమతి చేస్తోంది

పరీక్ష కోసం అవసరమైన యుటిలిటీలను దిగుమతి చేస్తోంది

8. పైథాన్ డైరెక్టరీని తయారు చేయడం

ప్రతి పూర్ణాంక విలువను డేటాసెట్ యొక్క తగిన లేబుల్‌కి అనువదించే పైథాన్ నిఘంటువును రూపొందించండి:

పైథాన్ డైరెక్టరీని తయారు చేయడం 1

9. పరీక్ష డేటా & మోడల్ లోడ్ అవుతోంది

కింది కోడ్ పరీక్ష డేటా మరియు మోడల్‌ను లోడ్ చేస్తుంది.

10. మూల్యాంకనం & అంచనా

కింది కోడ్ కప్ప చిత్రాలను మూల్యాంకనం చేస్తుంది మరియు అంచనాలను చేస్తుంది.

మూల్యాంకనం అంచనా 1

11. ఫలితాలు

మోడల్ కప్పను 80.62% ఖచ్చితత్వంతో అంచనా వేసింది.

ఫలితాలు

ముగింపు

సరే, మేము ఈ పాఠాన్ని పూర్తి చేసాము. కొద్దిగా CNNకి 80.62% మంచిది కానప్పటికీ, మెరుగైన ఫలితాల కోసం మోడల్‌ను మార్చమని లేదా ResNet50, Xception లేదా ఇతర అత్యాధునిక మోడల్‌లను చూడమని నేను మీకు గట్టిగా సలహా ఇస్తున్నాను.

ఇప్పుడు మీరు కెరాస్‌లో మీ మొదటి ఇమేజ్ రికగ్నిషన్ నెట్‌వర్క్‌ని నిర్మించారు, విభిన్న పారామితులు దాని పనితీరును ఎలా ప్రభావితం చేస్తాయో తెలుసుకోవడానికి మీరు మోడల్‌తో ప్రయోగాలు చేయాలి.

పైథాన్‌లో టెన్సార్‌ఫ్లో & కేరాస్‌తో డీప్ లెర్నింగ్ ఇమేజ్ క్లాసిఫికేషన్

చిత్రం వర్గీకరణ అంటే ఏమిటి?

చిత్రం వర్గీకరణ ఎలా పని చేస్తుంది?