பொருளடக்கம்[மறை][காட்டு]
- பட வகைப்பாடு என்றால் என்ன?
- பட வகைப்பாடு எவ்வாறு செயல்படுகிறது?
பைத்தானில் Tensorflow & Keras ஐப் பயன்படுத்தி பட வகைப்பாடு+-
- 1. தேவைகளை நிறுவுதல்
- 2. சார்புகளை இறக்குமதி செய்தல்
- 3. அளவுருக்களை துவக்குதல்
- 4. தரவுத்தொகுப்பை ஏற்றுகிறது
- 5. மாதிரியை உருவாக்குதல்
- 6. மாதிரி பயிற்சி
- மாதிரியை சோதிக்கிறது
- 7. சோதனைக்கான பயன்பாடுகளை இறக்குமதி செய்தல்
- 8. பைதான் கோப்பகத்தை உருவாக்குதல்
- 9. சோதனை தரவு மற்றும் மாதிரியை ஏற்றுகிறது
- 10. மதிப்பீடு & கணிப்பு
- 11. முடிவுகள்
- தீர்மானம்
ரோபோக்களை உதாரணத்தின் மூலம் கற்றுக்கொள்வதற்கும் அவற்றின் சுற்றுப்புறங்களை உணருவதற்கும் நமது உள்ளார்ந்த திறன்களைக் கொண்டு நாம் ஊக்கப்படுத்த முடிந்தது என்பதை அறிவது உறுதியளிக்கிறது. மனிதர்களுக்கு அதிக நேரமும் முயற்சியும் தேவைப்படுவது போல் "பார்க்க" கணினிகளுக்கு கற்பிப்பதே அடிப்படை சவால்.
இருப்பினும், இந்த திறன் தற்போது நிறுவனங்கள் மற்றும் நிறுவனங்களுக்கு வழங்கும் நடைமுறை மதிப்பைக் கருத்தில் கொள்ளும்போது, முயற்சி பயனுள்ளது. இந்த கட்டுரையில், பட வகைப்பாடு, அது எவ்வாறு செயல்படுகிறது மற்றும் அதன் நடைமுறைச் செயலாக்கம் பற்றி நீங்கள் அறிந்து கொள்வீர்கள். ஆரம்பித்துவிடுவோம்.
பட வகைப்பாடு என்றால் என்ன?
ஒரு படத்தை ஒரு படத்திற்கு ஊட்டும் வேலை நரம்பு நெட்வொர்க் அந்த படத்திற்கான லேபிளின் சில வடிவங்களை வெளியிடுவது பட அங்கீகாரம் என அழைக்கப்படுகிறது. நெட்வொர்க்கின் வெளியீட்டு லேபிள் முன் வரையறுக்கப்பட்ட வகுப்பிற்கு ஒத்திருக்கும்.
படத்திற்கு பல வகுப்புகள் ஒதுக்கப்பட்டிருக்கலாம் அல்லது ஒன்று. ஒரே ஒரு வகுப்பு இருக்கும்போது, "அங்கீகாரம்" என்ற சொல் அடிக்கடி பயன்படுத்தப்படுகிறது, அதே சமயம் பல வகுப்புகள் இருக்கும்போது, "வகைப்படுத்தல்" என்ற சொல் அடிக்கடி பயன்படுத்தப்படுகிறது.
பொருள் கண்டறிதல் விலங்குகள், வாகனங்கள் அல்லது மனிதர்கள் போன்ற கொடுக்கப்பட்ட வகுப்பைச் சேர்ந்த பொருள்களின் குறிப்பிட்ட நிகழ்வுகள் கண்டறியப்படும் பட வகைப்பாட்டின் துணைக்குழு ஆகும்.
பட வகைப்பாடு எவ்வாறு செயல்படுகிறது?
பிக்சல்கள் வடிவில் உள்ள படம் கணினி மூலம் பகுப்பாய்வு செய்யப்படுகிறது. படத்தை மெட்ரிக்குகளின் தொகுப்பாகக் கருதுவதன் மூலம் இது இதை நிறைவேற்றுகிறது, அதன் அளவு படத்தின் தீர்மானத்தால் தீர்மானிக்கப்படுகிறது. எளிமையாகச் சொன்னால், பட வகைப்பாடு என்பது கணினியின் கண்ணோட்டத்தில் அல்காரிதம்களைப் பயன்படுத்தும் புள்ளிவிவரத் தரவுகளின் ஆய்வு ஆகும்.
பிக்சல்களை முன்னரே தீர்மானிக்கப்பட்ட குழுக்களாக அல்லது “வகுப்புகளாக” தொகுப்பதன் மூலம் டிஜிட்டல் பட செயலாக்கத்தில் பட வகைப்பாடு செய்யப்படுகிறது. அல்காரிதம்கள் படத்தை குறிப்பிடத்தக்க குணாதிசயங்களின் தொடர்ச்சியாக பிரிக்கிறது, இது இறுதி வகைப்படுத்திக்கான சுமையை குறைக்கிறது.
இந்த குணங்கள் படத்தின் பொருள் மற்றும் சாத்தியமான வகைப்பாடு பற்றி வகைப்படுத்திக்கு தெரிவிக்கின்றன. ஒரு படத்தை வகைப்படுத்துவதில் மீதமுள்ள செயல்முறைகள் அதைச் சார்ந்து இருப்பதால், சிறப்பியல்பு பிரித்தெடுக்கும் முறை மிகவும் முக்கியமான கட்டமாகும்.
தி தரவு வழங்கப்பட்டது படிமுறை வகைப்பாடு, குறிப்பாக மேற்பார்வையிடப்பட்ட வகைப்பாடு ஆகியவற்றிலும் மிக முக்கியமானது. வகுப்பு மற்றும் குறைந்த படம் மற்றும் சிறுகுறிப்பு தரத்தின் அடிப்படையில் தரவு சமநிலையின்மை கொண்ட பயங்கரமான தரவுத்தொகுப்புடன் ஒப்பிடுகையில், நன்கு உகந்த வகைப்பாடு தரவுத்தொகுப்பு வியக்கத்தக்க வகையில் செயல்படுகிறது.
பைத்தானில் Tensorflow & Keras ஐப் பயன்படுத்தி பட வகைப்பாடு
நாங்கள் பயன்படுத்துவோம் CIFAR-10 தரவுத்தொகுப்பு (விமானம், விமானங்கள், பறவைகள் மற்றும் பிற 7 விஷயங்களை உள்ளடக்கியது).
1. தேவைகளை நிறுவுதல்
கீழே உள்ள குறியீடு அனைத்து முன்நிபந்தனைகளையும் நிறுவும்.
2. சார்புகளை இறக்குமதி செய்தல்
பைத்தானில் ஒரு train.py கோப்பை உருவாக்கவும். கீழே உள்ள குறியீடு Tensorflow மற்றும் Keras சார்புகளை இறக்குமதி செய்யும்.
3. அளவுருக்களை துவக்குதல்
CIFAR-10 ஆனது வெறும் 10 பட வகைகளை உள்ளடக்கியது, எனவே எண் வகுப்புகள் வகைப்படுத்த வேண்டிய வகைகளின் எண்ணிக்கையைக் குறிப்பிடுகின்றன.
4. தரவுத்தொகுப்பை ஏற்றுகிறது
செயல்பாடு தரவுத்தொகுப்பை ஏற்றுவதற்கு Tensorflow Datasets தொகுதியைப் பயன்படுத்துகிறது, மேலும் அதைப் பற்றிய சில தகவல்களைப் பெறுவதற்கு உண்மை என தகவலை அமைத்துள்ளோம். எந்தப் புலங்கள் மற்றும் அவற்றின் மதிப்புகள் என்பதைப் பார்க்க, நீங்கள் அதை அச்சிடலாம், மேலும் பயிற்சி மற்றும் சோதனைத் தொகுப்புகளில் உள்ள மாதிரிகளின் எண்ணிக்கையை மீட்டெடுக்க தகவலைப் பயன்படுத்துவோம்.
5. மாதிரியை உருவாக்குதல்
இப்போது நாம் மூன்று அடுக்குகளை உருவாக்குவோம், ஒவ்வொன்றும் அதிகபட்சமாக பூலிங் மற்றும் ReLU ஆக்டிவேஷன் செயல்பாட்டைக் கொண்ட இரண்டு கான்விநெட்களைக் கொண்டுள்ளது, அதைத் தொடர்ந்து முழுமையாக இணைக்கப்பட்ட 1024-யூனிட் அமைப்பு. அதிநவீன மாடல்களான ResNet50 அல்லது Xception உடன் ஒப்பிடுகையில், இது ஒப்பீட்டளவில் சிறிய மாடலாக இருக்கலாம்.
6. மாதிரி பயிற்சி
ஒவ்வொரு சகாப்தத்திலும் துல்லியம் மற்றும் இழப்பை அளவிட டென்சர்போர்டைப் பயன்படுத்தினேன் மற்றும் தரவை இறக்குமதி செய்து மாதிரியை உருவாக்கிய பிறகு எங்களுக்கு அழகான காட்சியை வழங்கினேன். பின்வரும் குறியீட்டை இயக்கவும்; உங்கள் CPU/GPU ஐப் பொறுத்து, பயிற்சி பல நிமிடங்கள் எடுக்கும்.
டென்சர்போர்டைப் பயன்படுத்த, பின்வரும் கட்டளையை முனையத்தில் அல்லது தற்போதைய கோப்பகத்தில் கட்டளை வரியில் தட்டச்சு செய்யவும்:
சரிபார்ப்பு இழப்பு குறைவதையும், துல்லியம் சுமார் 81% ஆக உயர்வதையும் நீங்கள் காண்பீர்கள். அது அற்புதம்!
மாதிரியை சோதிக்கிறது
பயிற்சி முடிந்ததும், இறுதி மாதிரி மற்றும் எடைகள் முடிவுகள் கோப்புறையில் சேமிக்கப்படும், இது ஒருமுறை பயிற்சி செய்யவும், நாங்கள் தேர்வு செய்யும் போதெல்லாம் கணிக்கவும் அனுமதிக்கிறது. test.py என்ற புதிய பைதான் கோப்பில் குறியீட்டைப் பின்பற்றவும்.
7. சோதனைக்கான பயன்பாடுகளை இறக்குமதி செய்தல்
8. பைதான் கோப்பகத்தை உருவாக்குதல்
ஒவ்வொரு முழு எண் மதிப்பையும் தரவுத்தொகுப்பின் பொருத்தமான லேபிளுக்கு மொழிபெயர்க்கும் பைதான் அகராதியை உருவாக்கவும்:
9. சோதனை தரவு மற்றும் மாதிரியை ஏற்றுகிறது
பின்வரும் குறியீடு சோதனை தரவு மற்றும் மாதிரியை ஏற்றும்.
10. மதிப்பீடு & கணிப்பு
பின்வரும் குறியீடு தவளைப் படங்களை மதிப்பீடு செய்து கணிப்புகளைச் செய்யும்.
11. முடிவுகள்
மாதிரியானது தவளையை 80.62% துல்லியத்துடன் கணித்துள்ளது.
தீர்மானம்
சரி, இந்தப் பாடத்தை முடித்துவிட்டோம். ஒரு சிறிய CNNக்கு 80.62% நல்லதல்ல என்றாலும், சிறந்த முடிவுகளுக்கு, மாதிரியை மாற்ற அல்லது ResNet50, Xception அல்லது பிற அதிநவீன மாடல்களைப் பார்க்குமாறு நான் கடுமையாக அறிவுறுத்துகிறேன்.
இப்போது நீங்கள் Keras இல் உங்கள் முதல் பட அங்கீகார நெட்வொர்க்கை உருவாக்கியுள்ளீர்கள், வெவ்வேறு அளவுருக்கள் அதன் செயல்திறனை எவ்வாறு பாதிக்கின்றன என்பதைக் கண்டறிய மாதிரியைப் பரிசோதிக்க வேண்டும்.
ஒரு பதில் விடவும்