பொருளடக்கம்[மறை][காட்டு]
செயற்கை நுண்ணறிவு மற்றும் இயந்திர கற்றல் காரணமாக உலகம் விரைவாக மாறுகிறது, இது நமது அன்றாட வாழ்க்கையின் ஒவ்வொரு அம்சத்திலும் தாக்கத்தை ஏற்படுத்துகிறது.
NLP மற்றும் மெஷின் லேர்னிங்கைப் பயன்படுத்தும் குரல் உதவியாளர்கள் முதல் சந்திப்புகளை முன்பதிவு செய்வது, எங்கள் காலெண்டரில் நிகழ்வுகளைப் பார்ப்பது மற்றும் இசையை இயக்குவது போன்ற துல்லியமான சாதனங்கள் வரை நமது தேவைகளை நாங்கள் கருத்தில் கொள்வதற்கு முன்பே அவர்களால் எதிர்பார்க்க முடியும்.
கணினிகள் சதுரங்கம் விளையாடலாம், அறுவை சிகிச்சை செய்யலாம் மற்றும் இயந்திர கற்றல் வழிமுறைகளின் உதவியுடன் புத்திசாலித்தனமான, மனிதனைப் போன்ற இயந்திரங்களாக உருவாகலாம்.
நாம் தொடர்ச்சியான தொழில்நுட்ப முன்னேற்றத்தின் ஒரு நேரத்தில் இருக்கிறோம், மேலும் காலப்போக்கில் கணினிகள் எவ்வாறு வளர்ந்தன என்பதைப் பார்ப்பதன் மூலம், எதிர்காலத்தில் என்ன நடக்கும் என்பதைப் பற்றி நாம் கணிக்க முடியும்.
கம்ப்யூட்டிங் கருவிகள் மற்றும் முறைகளின் ஜனநாயகமயமாக்கல் இந்த புரட்சியின் முக்கிய அம்சங்களில் ஒன்றாகும். தரவு விஞ்ஞானிகள் அதிநவீன வழிமுறைகளை சிரமமின்றி செயல்படுத்துவதன் மூலம், கடந்த ஐந்து ஆண்டுகளில் சக்திவாய்ந்த தரவுகளை நசுக்கும் கணினிகளை உருவாக்கியுள்ளனர். முடிவுகள் வியக்க வைக்கின்றன.
இந்த இடுகையில், நாம் கூர்ந்து கவனிப்போம் இயந்திர கற்றல் அல்காரிதம்கள் மற்றும் அவற்றின் அனைத்து மாறுபாடுகளும்.
எனவே, இயந்திர கற்றல் அல்காரிதம்கள் என்றால் என்ன?
AI அமைப்பு அதன் பணியைச் செய்யப் பயன்படுத்தும் அணுகுமுறை—பொதுவாக, கொடுக்கப்பட்ட உள்ளீட்டுத் தரவிலிருந்து வெளியீட்டு மதிப்புகளைக் கணிப்பது—ஒரு இயந்திர கற்றல் வழிமுறை என அழைக்கப்படுகிறது.
இயந்திர கற்றல் அல்காரிதம் என்பது தரவைப் பயன்படுத்தும் ஒரு செயல்முறையாகும் மற்றும் உற்பத்திக்குத் தயாராக இருக்கும் இயந்திர கற்றல் மாதிரிகளை உருவாக்கப் பயன்படுகிறது. மெஷின் லேர்னிங் என்பது ஒரு வேலையைச் செய்யும் ரயில் என்றால், இயந்திர கற்றல் அல்காரிதம்கள் வேலையை நகர்த்தும் என்ஜின்கள்.
பயன்படுத்துவதற்கான சிறந்த இயந்திர கற்றல் அணுகுமுறையானது, நீங்கள் தீர்க்க முயற்சிக்கும் வணிகச் சிக்கல், நீங்கள் பயன்படுத்தும் தரவுத்தொகுப்பு வகை மற்றும் உங்களிடம் உள்ள ஆதாரங்கள் ஆகியவற்றால் தீர்மானிக்கப்படும்.
மெஷின் லேர்னிங் அல்காரிதம்கள் என்பது தரவுத் தொகுப்பை மாதிரியாக மாற்றும். நீங்கள் பதிலளிக்க முயற்சிக்கும் பிரச்சனையின் வகை, கிடைக்கும் செயலாக்க சக்தி மற்றும் உங்களிடம் உள்ள தரவு வகை, மேற்பார்வையிடப்பட்ட, மேற்பார்வை செய்யப்படாத அல்லது வலுவூட்டல் கற்றல் அல்காரிதம்கள் சிறப்பாகச் செயல்படும்.
எனவே, நாங்கள் மேற்பார்வையிடப்பட்ட, மேற்பார்வை செய்யப்படாத மற்றும் வலுவூட்டல் கற்றல் பற்றி பேசினோம், ஆனால் அவை என்ன? அவற்றை ஆராய்வோம்.
மேற்பார்வையிடப்பட்ட, மேற்பார்வை செய்யப்படாத & வலுவூட்டல் கற்றல்
மேற்பார்வை கற்றல்
மேற்பார்வையிடப்பட்ட கற்றலில், AI மாதிரியானது வழங்கப்பட்ட உள்ளீடு மற்றும் முன்னறிவிக்கப்பட்ட முடிவைக் குறிக்கும் லேபிளின் அடிப்படையில் உருவாக்கப்படுகிறது. உள்ளீடுகள் மற்றும் வெளியீடுகளின் அடிப்படையில், மாதிரி ஒரு மேப்பிங் சமன்பாட்டை உருவாக்குகிறது, மேலும் அந்த மேப்பிங் சமன்பாட்டைப் பயன்படுத்தி, அது எதிர்காலத்தில் உள்ளீடுகளின் லேபிளை முன்னறிவிக்கிறது.
நாயையும் பூனையையும் வேறுபடுத்திப் பார்க்கக்கூடிய மாதிரியை உருவாக்க வேண்டும் என்று சொல்லலாம். மாடலைப் பயிற்றுவிப்பதற்காக பூனைகள் மற்றும் நாய்களின் பல புகைப்படங்கள் அவை பூனைகளா அல்லது நாய்களா என்பதைக் குறிக்கும் லேபிள்களுடன் மாடலில் கொடுக்கப்பட்டுள்ளன.
இந்த மாதிரியானது அந்த படங்களுக்கான உள்ளீட்டு புகைப்படங்களில் உள்ள லேபிள்கள் தொடர்பான சமன்பாட்டை நிறுவ முயல்கிறது. மாடல் இதுவரை படத்தைப் பார்த்ததில்லை என்றாலும், பயிற்சிக்குப் பிறகு, அது பூனையா அல்லது நாயா என்பதை அடையாளம் காண முடியும்.
மேற்பார்வை செய்யப்படாத கற்றல்
மேற்பார்வை செய்யப்படாத கற்றல் என்பது AI மாதிரியை லேபிளிடாமல் உள்ளீடுகளில் மட்டுமே பயிற்றுவிப்பதை உள்ளடக்கியது. மாதிரியானது உள்ளீட்டுத் தரவை தொடர்புடைய பண்புகளுடன் குழுக்களாகப் பிரிக்கிறது.
உள்ளீட்டின் எதிர்கால லேபிள் அதன் பண்புக்கூறுகள் வகைப்பாடுகளில் ஒன்றோடு எவ்வளவு நெருக்கமாக பொருந்துகிறது என்பதைப் பொறுத்து கணிக்கப்படுகிறது. சிவப்பு மற்றும் நீல பந்துகளின் குழுவை இரண்டு வகைகளாகப் பிரிக்க வேண்டிய சூழ்நிலையைக் கவனியுங்கள்.
வண்ணத்தைத் தவிர்த்து, பந்துகளின் மற்ற குணாதிசயங்கள் ஒரே மாதிரியானவை என்று வைத்துக்கொள்வோம். பந்துகளை எப்படி இரண்டு வகுப்புகளாகப் பிரிக்கலாம் என்பதன் அடிப்படையில், பந்துகளுக்கு இடையில் வேறுபடும் பண்புகளை மாதிரி தேடுகிறது.
பந்துகளை அவற்றின் சாயலின் அடிப்படையில் இரண்டு குழுக்களாகப் பிரிக்கும்போது இரண்டு கொத்து பந்துகள்-ஒரு நீலம் மற்றும் ஒரு சிவப்பு-உற்பத்தியாகும்.
வலுவூட்டல் கற்றல்
வலுவூட்டல் கற்றலில், AI மாதிரியானது ஒரு குறிப்பிட்ட சூழ்நிலையில் செயல்படுவதன் மூலம் ஒட்டுமொத்த லாபத்தை அதிகரிக்க முயல்கிறது. அதன் முந்தைய முடிவுகள் குறித்த கருத்து மாதிரி அறிய உதவுகிறது.
A மற்றும் B புள்ளிகளுக்கு இடையே ஒரு வழியைத் தேர்ந்தெடுக்க ரோபோவுக்கு அறிவுறுத்தப்படும்போது, அந்தச் சூழ்நிலையைப் பற்றி யோசித்துப் பாருங்கள். முன் அனுபவம் இல்லாததால், ரோபோ முதலில் ஏதேனும் ஒரு பாடத்தைத் தேர்ந்தெடுக்கும்.
ரோபோ தான் செல்லும் பாதையில் உள்ளீட்டைப் பெற்று அதிலிருந்து அறிவைப் பெறுகிறது. அடுத்த முறை இதேபோன்ற சூழ்நிலையை எதிர்கொள்ளும்போது சிக்கலைச் சரிசெய்ய ரோபோ உள்ளீட்டைப் பயன்படுத்தலாம்.
உதாரணமாக, ரோபோ விருப்பம் B ஐத் தேர்ந்தெடுத்து, நேர்மறையான கருத்து போன்ற வெகுமதியைப் பெற்றால், அதன் வெகுமதியை அதிகரிக்க B வழியைத் தேர்ந்தெடுக்க வேண்டும் என்பதை இந்த நேரத்தில் அது புரிந்துகொள்கிறது.
இப்போது இறுதியாக நீங்கள் அனைவரும் காத்துக்கொண்டிருப்பது அல்காரிதம்கள்.
முக்கிய இயந்திர கற்றல் அல்காரிதம்கள்
1. நேரியல் பின்னடைவு
மேற்பார்வையிடப்பட்ட கற்றலில் இருந்து விலகும் எளிய இயந்திர கற்றல் அணுகுமுறை நேரியல் பின்னடைவு ஆகும். சுயாதீன மாறிகளின் அறிவைக் கொண்டு, இது பெரும்பாலும் பின்னடைவு சிக்கல்களைத் தீர்க்கவும், தொடர்ச்சியான சார்பு மாறிகள் மீது கணிப்புகளை உருவாக்கவும் பயன்படுத்தப்படுகிறது.
தொடர்ச்சியான சார்பு மாறிகளின் முடிவைக் கணிக்க உதவும் சிறந்த பொருத்தத்தின் கோட்டைக் கண்டறிவது, நேரியல் பின்னடைவின் நோக்கமாகும். வீட்டின் விலைகள், வயது மற்றும் ஊதியங்கள் ஆகியவை தொடர்ச்சியான மதிப்புகளுக்கு சில எடுத்துக்காட்டுகள்.
எளிய நேரியல் பின்னடைவு எனப்படும் மாதிரியானது, ஒரு சார்பற்ற மாறிக்கும் ஒரு சார்பு மாறிக்கும் இடையே உள்ள தொடர்பைக் கணக்கிட நேர்கோட்டைப் பயன்படுத்துகிறது. பல நேரியல் பின்னடைவில் இரண்டுக்கும் மேற்பட்ட சுயாதீன மாறிகள் உள்ளன.
ஒரு நேரியல் பின்னடைவு மாதிரி நான்கு அடிப்படை அனுமானங்களைக் கொண்டுள்ளது:
- நேரியல்: X மற்றும் Y இன் சராசரிக்கு இடையே நேரியல் தொடர்பு உள்ளது.
- ஓரினச்சேர்க்கை: X இன் ஒவ்வொரு மதிப்புக்கும், எஞ்சிய மாறுபாடு ஒன்றுதான்.
- சுதந்திரம்: சுதந்திரத்தின் அடிப்படையில் அவதானிப்புகள் ஒன்றுக்கொன்று சுயாதீனமானவை.
- இயல்புநிலை: X சரி செய்யப்படும் போது, Y பொதுவாக விநியோகிக்கப்படுகிறது.
கோடுகளுடன் பிரிக்கக்கூடிய தரவுகளுக்கு நேரியல் பின்னடைவு வியக்கத்தக்க வகையில் செயல்படுகிறது. இது முறைப்படுத்தல், குறுக்கு சரிபார்ப்பு மற்றும் பரிமாணக் குறைப்பு நுட்பங்களைப் பயன்படுத்துவதன் மூலம் அதிகப்படியான பொருத்துதலைக் கட்டுப்படுத்தலாம். எவ்வாறாயினும், விரிவான அம்ச பொறியியல் தேவைப்படும் நிகழ்வுகள் உள்ளன, இது எப்போதாவது அதிகப்படியான பொருத்தம் மற்றும் சத்தத்தை விளைவிக்கும்.
2. லாஜிஸ்டிக் பின்னடைவு
லாஜிஸ்டிக் பின்னடைவு என்பது மேற்பார்வையிடப்பட்ட கற்றலில் இருந்து புறப்படும் மற்றொரு இயந்திர கற்றல் நுட்பமாகும். அதன் முக்கிய பயன்பாடானது வகைப்பாடு ஆகும், அதே சமயம் இது பின்னடைவு பிரச்சனைகளுக்கும் பயன்படுத்தப்படலாம்.
லாஜிஸ்டிக் பின்னடைவு என்பது சுயாதீன காரணிகளின் தகவலைப் பயன்படுத்தி வகைப்படுத்தப்பட்ட சார்பு மாறியை முன்னறிவிக்கப் பயன்படுகிறது. 0 மற்றும் 1 க்கு இடையில் மட்டுமே விழக்கூடிய வெளியீடுகளை வகைப்படுத்துவதே குறிக்கோள்.
உள்ளீடுகளின் எடையுள்ள மொத்தமானது சிக்மாய்டு செயல்பாட்டால் செயலாக்கப்படுகிறது, இது 0 மற்றும் 1 க்கு இடையில் மதிப்புகளை மாற்றும் ஒரு செயல்படுத்தும் செயல்பாடாகும்.
லாஜிஸ்டிக் பின்னடைவின் அடிப்படையானது அதிகபட்ச சாத்தியக்கூறு மதிப்பீடு ஆகும், இது குறிப்பிட்ட கவனிக்கப்பட்ட தரவைக் கொண்டு அனுமானிக்கப்படும் நிகழ்தகவு விநியோகத்தின் அளவுருக்களைக் கணக்கிடுவதற்கான ஒரு முறையாகும்.
3. முடிவு மரம்
மேற்பார்வையிடப்பட்ட கற்றலில் இருந்து பிரிக்கப்படும் மற்றொரு இயந்திர கற்றல் முறை முடிவு மரம் ஆகும். வகைப்பாடு மற்றும் பின்னடைவு சிக்கல்கள் இரண்டிற்கும், முடிவு மர அணுகுமுறையைப் பயன்படுத்தலாம்.
ஒரு மரத்தை ஒத்திருக்கும் இந்த முடிவெடுக்கும் கருவி, செயல்களின் வருங்கால முடிவுகள், செலவுகள் மற்றும் பின்விளைவுகளைக் காட்ட காட்சிப் பிரதிநிதித்துவங்களைப் பயன்படுத்துகிறது. தரவுகளை தனித்தனி பகுதிகளாகப் பிரிப்பதன் மூலம், யோசனை மனித மனதைப் போன்றது.
தரவுகளை நாம் கிரானுலேட் செய்யக்கூடிய அளவுக்கு தனித்தனி பகுதிகளாகப் பிரிக்கலாம். ஒரு முடிவு மரத்தின் முக்கிய நோக்கம், இலக்கு மாறியின் வகுப்பை முன்னறிவிக்கப் பயன்படும் பயிற்சி மாதிரியை உருவாக்குவதாகும். விடுபட்ட மதிப்புகளை டிசிஷன் ட்ரீயைப் பயன்படுத்தி தானாகவே கையாளலாம்.
ஒரு ஷாட் குறியாக்கம், போலி மாறிகள் அல்லது பிற தரவு முன் சிகிச்சை படிகள் தேவை இல்லை. புதிய தரவுகளைச் சேர்ப்பது கடினம் என்ற பொருளில் இது கடினமானது. லேபிளிடப்பட்ட கூடுதல் தரவு உங்களிடம் இருந்தால், முழு தரவுத்தொகுப்பிலும் மரத்தை மீண்டும் பயிற்சி செய்ய வேண்டும்.
இதன் விளைவாக, டைனமிக் மாதிரி மாற்றம் தேவைப்படும் எந்தவொரு பயன்பாட்டிற்கும் முடிவு மரங்கள் ஒரு மோசமான தேர்வாகும்.
இலக்கு மாறியின் வகையின் அடிப்படையில், முடிவு மரங்கள் இரண்டு வகைகளாக வகைப்படுத்தப்படுகின்றன:
- வகை மாறி: ஒரு முடிவு மரம், இதில் இலக்கு மாறி வகைப்படும்.
- தொடர்ச்சியான மாறி: இலக்கு மாறி தொடர்ச்சியாக இருக்கும் ஒரு முடிவு மரம்.
4. சீரற்ற காடு
ரேண்டம் ஃபாரஸ்ட் மெத்தட் என்பது அடுத்த இயந்திர கற்றல் நுட்பமாகும், மேலும் இது வகைப்படுத்தல் மற்றும் பின்னடைவு சிக்கல்களில் விரிவாகப் பயன்படுத்தப்படும் மேற்பார்வையிடப்பட்ட இயந்திர கற்றல் வழிமுறையாகும். இது ஒரு முடிவு மரத்தைப் போன்ற ஒரு மர அடிப்படையிலான முறையாகும்.
மரங்களின் காடு, அல்லது பல முடிவு மரங்கள், தீர்ப்புகளை வழங்க சீரற்ற வன முறையால் பயன்படுத்தப்படுகிறது. வகைப்படுத்தல் பணிகளைக் கையாளும் போது, தொடர்ச்சியான மாறிகளைக் கொண்ட தரவுத்தொகுப்புகளுடன் பின்னடைவு பணிகளைக் கையாளும் போது சீரற்ற வன முறையானது வகைப்படுத்தப்பட்ட மாறிகளைப் பயன்படுத்துகிறது.
ஒரு குழுமம், அல்லது பல மாதிரிகளின் கலவை, சீரற்ற வன முறை என்ன செய்கிறது, அதாவது ஒரு மாதிரியைக் காட்டிலும் ஒரு குழுவைப் பயன்படுத்தி கணிப்புகள் செய்யப்படுகின்றன.
பெரும்பாலான நவீன இயந்திர கற்றல் அமைப்புகளை உருவாக்கும் வகைப்பாடு மற்றும் பின்னடைவு சிக்கல்கள் இரண்டிற்கும் பயன்படுத்தக்கூடிய திறன் சீரற்ற காடுகளின் முக்கிய நன்மையாகும்.
குழுமத்தால் இரண்டு வெவ்வேறு உத்திகள் பயன்படுத்தப்படுகின்றன:
- பேக்கிங்: இதைச் செய்வதன் மூலம், பயிற்சி தரவுத்தொகுப்பிற்கு அதிக தரவு தயாரிக்கப்படுகிறது. முன்னறிவிப்புகளில் உள்ள மாறுபாட்டைக் குறைக்க, இது செய்யப்படுகிறது.
- பூஸ்டிங் என்பது பலவீனமான கற்பவர்களுடன் தொடர்ச்சியான மாதிரிகளை உருவாக்குவதன் மூலம் வலுவான கற்பவர்களுடன் இணைக்கும் செயல்முறையாகும், இதன் விளைவாக அதிகபட்ச துல்லியத்துடன் இறுதி மாதிரி உருவாகிறது.
5. நைவ் பேயஸ்
பைனரி (இரண்டு-வகுப்பு) மற்றும் பல-வகுப்பு வகைப்பாடு சிக்கலை Naive Bayes நுட்பத்தைப் பயன்படுத்தி தீர்க்க முடியும். பைனரி அல்லது வகை உள்ளீட்டு மதிப்புகளைப் பயன்படுத்தி முறை விளக்கப்படும்போது, அதைப் புரிந்துகொள்வது எளிது. ஒரு Naive Bayes வகைப்படுத்தியவர் செய்த அனுமானம் என்னவென்றால், ஒரு வகுப்பில் ஒரு அம்சத்தின் இருப்பு வேறு எந்த அம்சங்களின் இருப்பையும் பாதிக்காது.
மேலே உள்ள சூத்திரம் குறிக்கிறது:
- பி(எச்): கருதுகோள் எச் சரியானதாக இருக்கும் வாய்ப்பு. முந்தைய நிகழ்தகவு இவ்வாறு குறிப்பிடப்படுகிறது.
- பி(இ): ஆதாரத்தின் சாத்தியக்கூறு
- P(E|H): கருதுகோள் ஆதாரங்களால் ஆதரிக்கப்படும் சாத்தியக்கூறு.
- P(H|E): ஆதாரம் கொடுக்கப்பட்டால், கருதுகோள் உண்மையாக இருப்பதற்கான வாய்ப்பு.
இந்த பண்புக்கூறுகள் ஒன்றோடொன்று இணைக்கப்பட்டிருந்தாலும் கூட, ஒரு குறிப்பிட்ட முடிவின் சாத்தியக்கூறுகளை தீர்மானிக்கும் போது, ஒரு Naive Bayes வகைப்படுத்தி இந்த குணாதிசயங்கள் ஒவ்வொன்றையும் தனித்தனியாக கணக்கில் எடுத்துக்கொள்ளும். ஒரு Naive Bayesian மாதிரியானது கட்டமைக்க எளிதானது மற்றும் பெரிய தரவுத்தொகுப்புகளுக்கு பயனுள்ளதாக இருக்கும்.
அடிப்படையாக இருக்கும்போது மிகவும் சிக்கலான வகைப்படுத்தல் நுட்பங்களைக் காட்டிலும் சிறப்பாகச் செயல்படுவதாக அறியப்படுகிறது. இது ஒற்றை முறையைக் காட்டிலும் பேய்ஸ் தேற்றத்தை அடிப்படையாகக் கொண்ட அல்காரிதம்களின் தொகுப்பாகும்.
6. கே-அருகில் உள்ளவர்கள்
K-nearest nears (kNN) நுட்பம் என்பது மேற்பார்வையிடப்பட்ட இயந்திரக் கற்றலின் துணைக்குழு ஆகும், இது வகைப்படுத்தல் மற்றும் பின்னடைவு சிக்கல்களைத் தீர்க்கப் பயன்படுகிறது. KNN அல்காரிதம் ஒப்பிடக்கூடிய பொருட்களை அருகிலேயே காணலாம் என்று ஊகிக்கிறது.
ஒத்த எண்ணம் கொண்டவர்களின் கூட்டமாக இதை நினைவு கூர்கிறேன். kNN மற்ற தரவுப் புள்ளிகளுக்கு இடையே உள்ள ஒற்றுமையைப் பயன்படுத்தி அருகாமை, நெருக்கம் அல்லது தூரத்தைப் பயன்படுத்திக் கொள்கிறது. அருகிலுள்ள லேபிளிடப்பட்ட கவனிக்கக்கூடிய தரவுப் புள்ளிகளின் அடிப்படையில் காணப்படாத தரவை லேபிளிடுவதற்காக, வரைபடத்தில் உள்ள புள்ளிகளுக்கு இடையேயான பிரிவைத் தீர்மானிக்க ஒரு கணித முறை பயன்படுத்தப்படுகிறது.
அருகிலுள்ள ஒப்பிடக்கூடிய புள்ளிகளை அடையாளம் காண தரவு புள்ளிகளுக்கு இடையிலான தூரத்தை நீங்கள் தீர்மானிக்க வேண்டும். யூக்ளிடியன் தூரம், ஹாமிங் தூரம், மன்ஹாட்டன் தூரம் மற்றும் மின்கோவ்ஸ்கி தூரம் போன்ற தூர அளவீடுகள் இதற்குப் பயன்படுத்தப்படலாம். K ஆனது அருகிலுள்ள அண்டை எண்ணாக அறியப்படுகிறது, மேலும் இது பெரும்பாலும் ஒற்றைப்படை எண்ணாகும்.
வகைப்பாடு மற்றும் பின்னடைவு பிரச்சனைகளுக்கு KNN பயன்படுத்தப்படலாம். பின்னடைவு சிக்கல்களுக்கு KNN பயன்படுத்தப்படும் போது செய்யப்படும் கணிப்பு, K- மிகவும் ஒத்த நிகழ்வுகளின் சராசரி அல்லது சராசரியை அடிப்படையாகக் கொண்டது.
KNN அடிப்படையிலான ஒரு வகைப்பாடு அல்காரிதம் முடிவு K மிகவும் ஒத்த நிகழ்வுகளில் அதிக அதிர்வெண் கொண்ட வகுப்பாக தீர்மானிக்கப்படலாம். ஒவ்வொரு நிகழ்வும் அடிப்படையில் அவர்களின் வகுப்பிற்கு வாக்களிக்கின்றன, மேலும் கணிப்பு அதிக வாக்குகளைப் பெறும் வகுப்பைச் சார்ந்தது.
7. கே-என்பது
இது கிளஸ்டரிங் சிக்கல்களை நிவர்த்தி செய்யும் மேற்பார்வை செய்யப்படாத கற்றலுக்கான ஒரு நுட்பமாகும். தரவுத் தொகுப்புகள் ஒரு குறிப்பிட்ட எண்ணிக்கையிலான க்ளஸ்டர்களாகப் பிரிக்கப்படுகின்றன-அழைக்கலாம் K-இவ்வாறு ஒவ்வொரு க்ளஸ்டரின் தரவுப் புள்ளிகளும் ஒரே மாதிரியாகவும் மற்ற கொத்துகளில் இருந்து வேறுபட்டதாகவும் இருக்கும்.
K- என்றால் கிளஸ்டரிங் முறை:
- ஒவ்வொரு கிளஸ்டருக்கும், K-என்ற அல்காரிதம் கே சென்ட்ராய்டுகள் அல்லது புள்ளிகளைத் தேர்ந்தெடுக்கிறது.
- அருகிலுள்ள சென்ட்ராய்டுகள் அல்லது K கிளஸ்டர்களுடன், ஒவ்வொரு தரவு புள்ளியும் ஒரு கிளஸ்டரை உருவாக்குகிறது.
- இப்போது, ஏற்கனவே இருக்கும் கிளஸ்டர் உறுப்பினர்களைப் பொறுத்து புதிய சென்ட்ராய்டுகள் தயாரிக்கப்படுகின்றன.
- இந்த மேம்படுத்தப்பட்ட சென்ட்ராய்டுகளைப் பயன்படுத்தி ஒவ்வொரு தரவுப் புள்ளிக்கும் மிக நெருக்கமான தூரம் கணக்கிடப்படுகிறது. சென்ட்ராய்டுகள் மாறாத வரை, இந்த செயல்முறை மீண்டும் மீண்டும் செய்யப்படுகிறது.
இது விரைவானது, நம்பகமானது மற்றும் புரிந்துகொள்வதற்கு எளிதானது. சிக்கல்கள் இருந்தால், கே-மீன்ஸின் ஏற்புத்திறன் மாற்றங்களை எளிதாக்குகிறது. தரவுத்தொகுப்புகள் தனித்தனியாக அல்லது ஒன்றிலிருந்து மற்றொன்று தனிமைப்படுத்தப்பட்டால், முடிவுகள் சிறப்பாக இருக்கும். இது ஒழுங்கற்ற தரவு அல்லது வெளிப்புறங்களை நிர்வகிக்க முடியாது.
8. ஆதரவு திசையன் இயந்திரங்கள்
தரவை வகைப்படுத்த SVM நுட்பத்தைப் பயன்படுத்தும் போது, மூலத் தரவு n-பரிமாண இடத்தில் புள்ளிகளாகக் காட்டப்படும் (இங்கு n என்பது உங்களிடம் உள்ள அம்சங்களின் எண்ணிக்கை). ஒவ்வொரு அம்சத்தின் மதிப்பும் ஒரு குறிப்பிட்ட ஒருங்கிணைப்புடன் இணைக்கப்பட்டிருப்பதால் தரவை எளிதாக வகைப்படுத்தலாம்.
தரவைப் பிரித்து அவற்றை வரைபடத்தில் வைக்க, வகைப்படுத்திகள் எனப்படும் வரிகளைப் பயன்படுத்தவும். இந்த அணுகுமுறை ஒவ்வொரு தரவுப் புள்ளியையும் ஒரு n-பரிமாண இடத்தில் ஒரு புள்ளியாகத் திட்டமிடுகிறது, இங்கு n என்பது உங்களிடம் உள்ள அம்சங்களின் எண்ணிக்கை மற்றும் ஒவ்வொரு அம்சத்தின் மதிப்பும் ஒரு குறிப்பிட்ட ஒருங்கிணைப்பு மதிப்பாகும்.
தரவை வெவ்வேறு வகைகளாகப் பிரிக்கப்பட்ட இரண்டு தரவுத் தொகுப்புகளாகப் பிரிக்கும் ஒரு வரியை இப்போது கண்டுபிடிப்போம். இரண்டு குழுக்களில் ஒவ்வொன்றிலும் அருகிலுள்ள புள்ளிகளிலிருந்து தூரங்கள் இந்தக் கோட்டுடன் அதிக தொலைவில் இருக்கும்.
மேலே உள்ள எடுத்துக்காட்டில் உள்ள கோட்டிலிருந்து மிகவும் தொலைவில் உள்ள இரண்டு நெருங்கிய புள்ளிகள் என்பதால், தரவை வெவ்வேறு வகைகளாகப் பிரிக்கப்பட்ட இரண்டு குழுக்களாகப் பிரிக்கும் கோடு நடுக் கோடு. எங்கள் வகைப்படுத்தி இந்த வரி.
9. பரிமாணக் குறைப்பு
பரிமாணக் குறைப்பு அணுகுமுறையைப் பயன்படுத்தி, பயிற்சித் தரவு குறைவான உள்ளீட்டு மாறிகளைக் கொண்டிருக்கலாம். எளிமையான சொற்களில், இது உங்கள் அம்சத் தொகுப்பின் அளவைச் சுருக்கும் செயல்முறையைக் குறிக்கிறது. உங்கள் தரவுத்தொகுப்பில் 100 நெடுவரிசைகள் இருப்பதாக கற்பனை செய்துகொள்வோம்; பரிமாணக் குறைப்பு அந்தத் தொகையை 20 நெடுவரிசைகளாகக் குறைக்கும்.
மாடல் தானாகவே மிகவும் நுட்பமாக வளரும் மற்றும் அம்சங்களின் எண்ணிக்கை உயரும் போது அதிகப் பொருத்தம் ஏற்படும் அபாயம் உள்ளது. அதிக பரிமாணங்களில் தரவுகளுடன் பணிபுரிவதில் உள்ள மிகப்பெரிய சிக்கல், "பரிமாணத்தின் சாபம்" என்று அழைக்கப்படுகிறது, இது உங்கள் தரவு அதிக எண்ணிக்கையிலான பண்புகளைக் கொண்டிருக்கும் போது ஏற்படுகிறது.
பரிமாணக் குறைப்பைச் செய்ய பின்வரும் கூறுகள் பயன்படுத்தப்படலாம்:
- பொருத்தமான பண்புகளைக் கண்டறிந்து தேர்வு செய்ய, அம்சத் தேர்வு பயன்படுத்தப்படுகிறது.
- ஏற்கனவே உள்ள அம்சங்களைப் பயன்படுத்தி, அம்ச பொறியியல் கைமுறையாக புதிய அம்சங்களை உருவாக்குகிறது.
தீர்மானம்
மேற்பார்வை செய்யப்படாத அல்லது மேற்பார்வையிடப்படாத இயந்திர கற்றல் இரண்டும் சாத்தியமாகும். உங்கள் தரவு குறைவாகவும் பயிற்சிக்காக நன்கு குறியிடப்பட்டதாகவும் இருந்தால் கண்காணிக்கப்படும் கற்றலைத் தேர்வு செய்யவும்.
பெரிய தரவுத் தொகுப்புகள் பெரும்பாலும் மேற்பார்வை செய்யப்படாத கற்றலைப் பயன்படுத்தி சிறந்த விளைவுகளைச் செய்யும். ஆழமான கற்றல் உங்களிடம் கணிசமான தரவு சேகரிப்பு இருந்தால், அது உடனடியாகக் கிடைக்கும் முறைகள் சிறந்தது.
வலுவூட்டல் கற்றல் மற்றும் ஆழ்ந்த வலுவூட்டல் கற்றல் என்பது நீங்கள் படித்த சில தலைப்புகள். நரம்பியல் நெட்வொர்க்குகளின் பண்புகள், பயன்பாடுகள் மற்றும் கட்டுப்பாடுகள் இப்போது உங்களுக்கு தெளிவாகத் தெரியும். கடைசியாக ஆனால் குறைந்தது அல்ல, வெவ்வேறு நிரலாக்க மொழிகள், IDEகள் மற்றும் இயங்குதளங்களுக்கான விருப்பங்களை உங்கள் சொந்தமாக உருவாக்கும்போது நீங்கள் கருத்தில் கொண்டீர்கள் இயந்திர கற்றல் மாதிரிகள்.
நீங்கள் செய்ய வேண்டிய அடுத்த விஷயம், ஒவ்வொன்றையும் படித்து பயன்படுத்தத் தொடங்குவது இயந்திர கற்றல் அணுகுமுறை. பரந்த விஷயமாக இருந்தாலும், எந்த ஒரு தலைப்பையும் அதன் ஆழத்தில் கவனம் செலுத்தினால் சில மணிநேரங்களில் புரிந்து கொள்ள முடியும். ஒவ்வொரு பாடமும் மற்றவற்றிலிருந்து தனித்து நிற்கிறது.
நீங்கள் ஒரு நேரத்தில் ஒரு சிக்கலைப் பற்றி சிந்திக்க வேண்டும், அதைப் படித்து, அதை நடைமுறைக்குக் கொண்டு வர வேண்டும், மேலும் அதில் உள்ள வழிமுறைகளை (களை) செயல்படுத்த உங்களுக்கு விருப்பமான மொழியைப் பயன்படுத்த வேண்டும்.
ஒரு பதில் விடவும்