பொருளடக்கம்[மறை][காட்டு]
எந்தவொரு கார்ப்பரேட் செயல்பாட்டிற்கும் முதன்மையான அளவுகோல்களில் ஒன்று தகவலை திறம்பட பயன்படுத்துவதாகும். ஒரு கட்டத்தில், உருவாக்கப்பட்ட தரவுகளின் அளவு அடிப்படை செயலாக்கத்தின் திறனை மீறுகிறது.
அங்குதான் இயந்திர கற்றல் வழிமுறைகள் செயல்படுகின்றன. இருப்பினும், இவை எதுவும் நிகழும் முன், தகவல் ஆய்வு செய்யப்பட்டு விளக்கப்பட வேண்டும். சுருக்கமாக, இது மேற்பார்வை செய்யப்படாத இயந்திர கற்றல் பயன்படுத்தப்படுகிறது.
இந்தக் கட்டுரையில், ஆழ்ந்த மேற்பார்வை செய்யப்படாத இயந்திரக் கற்றல், அதன் வழிமுறைகள், பயன்பாட்டு வழக்குகள் மற்றும் பலவற்றைப் பற்றி ஆராய்வோம்.
மேற்பார்வை செய்யப்படாத இயந்திர கற்றல் என்றால் என்ன?
மேற்பார்வை செய்யப்படாத இயந்திரக் கற்றல் வழிமுறைகள், அறியப்பட்ட அல்லது பெயரிடப்பட்ட விளைவுகளை ஏற்படுத்தாத தரவுத்தொகுப்பில் உள்ள வடிவங்களைக் கண்டறியும். மேற்பார்வையிடப்பட்டது இயந்திர கற்றல் வழிமுறைகள் லேபிளிடப்பட்ட வெளியீடு உள்ளது.
வெளியீட்டுத் தரவின் மதிப்பு/பதில் என்னவாக இருக்கும் என்று உங்களுக்குத் தெரியாததால், இந்த வேறுபாட்டை அறிந்துகொள்வது, பின்னடைவு அல்லது வகைப்படுத்தல் சிக்கல்களைத் தீர்க்க, மேற்பார்வை செய்யப்படாத இயந்திரக் கற்றல் முறைகளை ஏன் பயன்படுத்த முடியாது என்பதைப் புரிந்துகொள்ள உதவுகிறது. மதிப்பு/பதில் தெரியாவிட்டால், அல்காரிதத்தை சாதாரணமாகப் பயிற்றுவிக்க முடியாது.
மேலும், தரவுகளின் அடிப்படை கட்டமைப்பை அடையாளம் காண மேற்பார்வை செய்யப்படாத கற்றல் பயன்படுத்தப்படலாம். இந்த வழிமுறைகள் மனித தொடர்பு தேவையில்லாமல் மறைக்கப்பட்ட வடிவங்கள் அல்லது தரவுக் குழுக்களைக் கண்டறிகின்றன.
தகவலில் உள்ள ஒற்றுமைகள் மற்றும் முரண்பாடுகளைக் கண்டறிவதற்கான அதன் திறன், ஆய்வு தரவு பகுப்பாய்வு, குறுக்கு விற்பனை நுட்பங்கள், நுகர்வோர் பிரிவு மற்றும் படத்தை அடையாளம் காண சிறந்த தேர்வாக அமைகிறது.
பின்வரும் காட்சியைக் கவனியுங்கள்: நீங்கள் ஒரு மளிகைக் கடையில் இருக்கிறீர்கள், நீங்கள் இதுவரை பார்த்திராத அடையாளம் தெரியாத பழத்தைப் பார்க்கிறீர்கள். அதன் வடிவம், அளவு அல்லது நிறம் பற்றிய உங்கள் அவதானிப்புகளின் அடிப்படையில் அறியப்படாத பழங்களை மற்ற பழங்களிலிருந்து வேறுபடுத்தி அறியலாம்.
மேற்பார்வை செய்யப்படாத இயந்திர கற்றல் அல்காரிதம்கள்
கிளஸ்டரிங்
கிளஸ்டரிங் என்பது மிகவும் பரவலாகப் பயன்படுத்தப்படும் மேற்பார்வை செய்யப்படாத கற்றல் அணுகுமுறை என்பதில் சந்தேகமில்லை. இந்த அணுகுமுறை தொடர்புடைய தரவு உருப்படிகளை தோராயமாக உருவாக்கப்பட்ட கிளஸ்டர்களில் வைக்கிறது.
ஒரு ML மாதிரியானது, வகைப்படுத்தப்படாத தரவு கட்டமைப்பில் ஏதேனும் வடிவங்கள், ஒற்றுமைகள் மற்றும்/அல்லது வேறுபாடுகளைக் கண்டறியும். ஒரு மாதிரியானது தரவுகளில் ஏதேனும் இயற்கையான குழுக்கள் அல்லது வகுப்புகளைக் கண்டறிய முடியும்.
வகைகள்
பயன்படுத்தக்கூடிய பல வகையான கிளஸ்டரிங் உள்ளன. முதலில் முக்கியமானவற்றைப் பார்ப்போம்.
- பிரத்தியேக கிளஸ்டரிங், சில நேரங்களில் "ஹார்ட்" கிளஸ்டரிங் என்று அழைக்கப்படுகிறது, இது ஒரு வகை குழுவாகும், இதில் ஒரு தரவு ஒரே ஒரு கிளஸ்டருக்கு சொந்தமானது.
- ஓவர்லேப்பிங் க்ளஸ்டரிங், பெரும்பாலும் "மென்மையான" கிளஸ்டரிங் என்று அழைக்கப்படுகிறது, தரவுப் பொருள்கள் ஒன்றுக்கு மேற்பட்ட கிளஸ்டர்களை வெவ்வேறு அளவுகளில் இருக்க அனுமதிக்கிறது. மேலும், "மென்மையான" கிளஸ்டரிங் அல்லது அடர்த்தி மதிப்பீடு சிக்கல்களைச் சமாளிக்கவும், குறிப்பிட்ட கிளஸ்டர்களுக்குச் சொந்தமான தரவுப் புள்ளிகளின் நிகழ்தகவு அல்லது சாத்தியக்கூறுகளை மதிப்பிடவும் நிகழ்தகவு கிளஸ்டரிங் பயன்படுத்தப்படலாம்.
- குழுவாக்கப்பட்ட தரவு உருப்படிகளின் படிநிலையை உருவாக்குவது, பெயர் குறிப்பிடுவது போல, படிநிலை கிளஸ்டரிங்கின் இலக்காகும். க்ளஸ்டர்களை உருவாக்க படிநிலையின் அடிப்படையில் தரவு உருப்படிகள் மறுகட்டமைக்கப்படுகின்றன அல்லது இணைக்கப்படுகின்றன.
பயன்பாடு வழக்குகள்:
- ஒழுங்கின்மை கண்டறிதல்:
க்ளஸ்டரிங்கைப் பயன்படுத்தி தரவுகளில் உள்ள எந்த விதமான வெளிப்புறத்தையும் கண்டறியலாம். போக்குவரத்து மற்றும் தளவாடங்களில் உள்ள நிறுவனங்கள், எடுத்துக்காட்டாக, தளவாடத் தடைகளைக் கண்டறிய அல்லது சேதமடைந்த இயந்திர பாகங்களை (முன்கணிப்பு பராமரிப்பு) வெளிப்படுத்த ஒழுங்கின்மை கண்டறிதலைப் பயன்படுத்தலாம்.
நிதி நிறுவனங்கள் தொழில்நுட்பத்தைப் பயன்படுத்தி மோசடியான பரிவர்த்தனைகளைக் கண்டறிந்து விரைவாகப் பதிலளிப்பதன் மூலம் நிறையப் பணத்தைச் சேமிக்க முடியும். எங்கள் வீடியோவைப் பார்ப்பதன் மூலம் அசாதாரணங்கள் மற்றும் மோசடிகளைக் கண்டறிவது பற்றி மேலும் அறியவும்.
- வாடிக்கையாளர்கள் மற்றும் சந்தைகளின் பிரிவு:
க்ளஸ்டரிங் அல்காரிதம்கள் ஒரே மாதிரியான குணாதிசயங்களைக் கொண்ட நபர்களைக் குழுவாக்க உதவுகின்றன மற்றும் மிகவும் பயனுள்ள சந்தைப்படுத்தல் மற்றும் இலக்கு முன்முயற்சிகளுக்காக நுகர்வோர் நபர்களை உருவாக்குகின்றன.
கே-அர்த்தம்
K- அர்த்தம் என்பது ஒரு கிளஸ்டரிங் முறையாகும், இது பகிர்வு அல்லது பிரித்தல் என்றும் அழைக்கப்படுகிறது. இது தரவுப் புள்ளிகளை K எனப்படும் முன்னரே தீர்மானிக்கப்பட்ட எண்ணிக்கையிலான க்ளஸ்டர்களாகப் பிரிக்கிறது.
K- அர்த்தம் முறையில், K என்பது உள்ளீடு ஆகும், ஏனெனில் உங்கள் தரவுகளில் எத்தனை கிளஸ்டர்களை நீங்கள் அடையாளம் காண விரும்புகிறீர்கள் என்பதை கணினியிடம் கூறுவீர்கள். ஒவ்வொரு தரவு உருப்படியும் பின்னர், சென்ட்ராய்டு (படத்தில் உள்ள கருப்பு புள்ளிகள்) என அழைக்கப்படும் மிக நெருக்கமான கிளஸ்டர் மையத்திற்கு ஒதுக்கப்படும்.
பிந்தையது தரவு சேமிப்பக இடமாக செயல்படுகிறது. கிளஸ்டர்கள் நன்கு வரையறுக்கப்படும் வரை கிளஸ்டரிங் நுட்பத்தை பல முறை செய்யலாம்.
Fuzzy K-என்றால்
Fuzzy K-means என்பது K-means நுட்பத்தின் நீட்டிப்பாகும், இது ஒன்றுடன் ஒன்று கிளஸ்டரிங் செய்யப் பயன்படுகிறது. K- அர்த்தம் நுட்பத்தைப் போலன்றி, தெளிவற்ற K- என்பது தரவுப் புள்ளிகள் ஒவ்வொன்றிற்கும் வெவ்வேறு அளவு அருகாமையில் உள்ள பல கிளஸ்டர்களைச் சேர்ந்ததாக இருக்கலாம் என்பதைக் குறிக்கிறது.
தரவுப் புள்ளிகளுக்கும் கிளஸ்டரின் மையப்பகுதிக்கும் இடையிலான தூரம் அருகாமையைக் கணக்கிடப் பயன்படுகிறது. இதன் விளைவாக, பல்வேறு கிளஸ்டர்கள் ஒன்றுடன் ஒன்று சேரும் சந்தர்ப்பங்கள் இருக்கலாம்.
காஸியன் கலவை மாதிரிகள்
காஸியன் கலவை மாதிரிகள் (GMMs) என்பது நிகழ்தகவு கிளஸ்டரிங்கில் பயன்படுத்தப்படும் ஒரு முறையாகும். சராசரி மற்றும் மாறுபாடு தெரியாததால், மாதிரிகள் ஒரு குறிப்பிட்ட எண்ணிக்கையிலான காஸியன் விநியோகங்கள் இருப்பதாகக் கருதுகின்றன, ஒவ்வொன்றும் ஒரு தனித்தனி கிளஸ்டரைக் குறிக்கின்றன.
ஒரு குறிப்பிட்ட தரவு புள்ளி எந்த கிளஸ்டருக்கு சொந்தமானது என்பதை தீர்மானிக்க, முறை முக்கியமாக பயன்படுத்தப்படுகிறது.
படிநிலை கிளஸ்டரிங்
படிநிலை கிளஸ்டரிங் மூலோபாயம் ஒவ்வொரு தரவு புள்ளியும் வெவ்வேறு கிளஸ்டருக்கு ஒதுக்கப்படும். ஒன்றுக்கொன்று நெருக்கமாக இருக்கும் இரண்டு கொத்துகளும் பின்னர் ஒரு கொத்துக்குள் கலக்கப்படுகின்றன. ஒரே ஒரு கிளஸ்டர் மட்டுமே மேலே இருக்கும் வரை மீண்டும் இணைத்தல் தொடர்கிறது.
இந்த முறை பாட்டம்-அப் அல்லது agglomerative என்று அழைக்கப்படுகிறது. நீங்கள் அனைத்து தரவு உருப்படிகளையும் ஒரே கிளஸ்டருடன் இணைத்து, பின்னர் ஒவ்வொரு தரவு உருப்படியும் தனித்தனி கிளஸ்டராக ஒதுக்கப்படும் வரை பிளவுகளை நடத்தினால், இந்த முறை மேல்-கீழ் அல்லது பிரிக்கும் படிநிலை கிளஸ்டரிங் எனப்படும்.
Apriori அல்காரிதம்
சந்தை கூடை பகுப்பாய்வு அப்ரியோரி அல்காரிதங்களை பிரபலப்படுத்தியது, இதன் விளைவாக இசை தளங்கள் மற்றும் ஆன்லைன் ஸ்டோர்களுக்கான பல்வேறு பரிந்துரை இயந்திரங்கள்.
ஒரு தயாரிப்பை மற்றொன்றின் நுகர்வு அடிப்படையில் உட்கொள்வதற்கான சாத்தியக்கூறுகளை கணிப்பதற்காக, அடிக்கடி உருப்படிகள் அல்லது பொருட்களின் குழுக்களைக் கண்டறிய பரிவர்த்தனை தரவுத்தொகுப்புகளில் அவை பயன்படுத்தப்படுகின்றன.
எடுத்துக்காட்டாக, நான் OneRepublic இன் ரேடியோவை Spotify இல் “கவுண்டிங் ஸ்டார்ஸ்” மூலம் இயக்கத் தொடங்கினால், இந்தச் சேனலில் உள்ள மற்ற பாடல்களில் ஒன்று நிச்சயமாக “பேட் லையர்” போன்ற இமேஜின் டிராகன் பாடலாக இருக்கும்.
இது எனது முந்தைய கேட்கும் பழக்கம் மற்றும் மற்றவர்களின் கேட்கும் முறை ஆகியவற்றை அடிப்படையாகக் கொண்டது. அப்ரியோரி முறைகள் ஹாஷ் ட்ரீயைப் பயன்படுத்தி உருப்படிகளை எண்ணுகின்றன, தரவுத்தொகுப்பு அகலத்தை முதலில் கடந்து செல்கின்றன.
பரிமாண குறைப்பு
பரிமாணக் குறைப்பு என்பது ஒரு தரவுத்தொகுப்பில் உள்ள அம்சங்களின் எண்ணிக்கை அல்லது பரிமாணங்களைக் குறைக்க உத்திகளின் தொகுப்பைப் பயன்படுத்தும் மேற்பார்வை செய்யப்படாத கற்றல் வகையாகும். தெளிவுபடுத்த எங்களை அனுமதிக்கவும்.
உங்களுடையதை உருவாக்கும் போது முடிந்தவரை அதிகமான தரவுகளை இணைத்துக்கொள்ள இது தூண்டுதலாக இருக்கலாம் இயந்திர கற்றலுக்கான தரவுத்தொகுப்பு. எங்களை தவறாக எண்ண வேண்டாம்: அதிக தரவு பொதுவாக மிகவும் துல்லியமான கண்டுபிடிப்புகளை வழங்குவதால் இந்த உத்தி நன்றாக வேலை செய்கிறது.
ஒவ்வொரு அம்சமும் வெவ்வேறு பரிமாணத்தைக் குறிக்கும், N- பரிமாண இடத்தில் தரவு சேமிக்கப்படுகிறது என்று வைத்துக்கொள்வோம். நிறைய தரவு இருந்தால் நூற்றுக்கணக்கான பரிமாணங்கள் இருக்கலாம்.
எக்செல் விரிதாள்களைக் கருத்தில் கொள்ளுங்கள், நெடுவரிசைகள் பண்புகளைக் குறிக்கும் மற்றும் வரிசைகளைக் குறிக்கும் தரவு உருப்படிகள். பல பரிமாணங்கள் இருக்கும்போது, ML அல்காரிதம்கள் மோசமாகச் செயல்படக்கூடும் தரவு காட்சிப்படுத்தல் கடினமாக முடியும்.
எனவே இது பண்புகள் அல்லது பரிமாணங்களை மட்டுப்படுத்துவது தர்க்கரீதியானதாக ஆக்குகிறது, மேலும் பொருத்தமான தகவலை மட்டும் தெரிவிக்கிறது. பரிமாணக் குறைப்பு அவ்வளவுதான். தரவுத்தொகுப்பின் ஒருமைப்பாட்டை சமரசம் செய்யாமல் நிர்வகிக்கக்கூடிய அளவிலான தரவு உள்ளீடுகளை இது அனுமதிக்கிறது.
முதன்மை உபகரண பகுப்பாய்வு (பிசிஏ)
முக்கிய கூறு பகுப்பாய்வு ஒரு பரிமாண குறைப்பு அணுகுமுறை ஆகும். பெரிய தரவுத்தொகுப்புகளில் உள்ள அம்சங்களின் எண்ணிக்கையைக் குறைக்க இது பயன்படுகிறது, இதன் விளைவாக துல்லியத்தை தியாகம் செய்யாமல் அதிக தரவு எளிமை கிடைக்கும்.
தரவுத்தொகுப்பு சுருக்கமானது அம்சம் பிரித்தெடுத்தல் எனப்படும் ஒரு முறை மூலம் நிறைவேற்றப்படுகிறது. அசல் தொகுப்பின் கூறுகள் புதிய, சிறிய ஒன்றாக கலக்கப்படுவதை இது குறிக்கிறது. இந்த புதிய குணாதிசயங்கள் முதன்மை கூறுகள் என்று அழைக்கப்படுகின்றன.
நிச்சயமாக, உங்கள் மேற்பார்வை செய்யப்படாத கற்றல் பயன்பாடுகளில் நீங்கள் பயன்படுத்தக்கூடிய கூடுதல் அல்காரிதம்கள் உள்ளன. மேலே பட்டியலிடப்பட்டவை மிகவும் பொதுவானவை, அதனால்தான் அவை இன்னும் விரிவாக விவாதிக்கப்படுகின்றன.
மேற்பார்வை செய்யப்படாத கற்றலின் பயன்பாடு
- கண்பார்வையற்ற கற்றல் முறைகள் பொருள் அங்கீகாரம் போன்ற காட்சி உணர்தல் பணிகளுக்குப் பயன்படுத்தப்படுகின்றன.
- மேற்பார்வை செய்யப்படாத இயந்திரக் கற்றல் மருத்துவ இமேஜிங் அமைப்புகளுக்கு முக்கியமான அம்சங்களை வழங்குகிறது, அதாவது பட அடையாளம், வகைப்பாடு மற்றும் பிரிவு, இவை கதிரியக்கவியல் மற்றும் நோயியல் ஆகியவற்றில் நோயாளிகளை விரைவாகவும் நம்பகத்தன்மையுடனும் கண்டறிய பயன்படுத்தப்படுகின்றன.
- மேற்பார்வை செய்யப்படாத கற்றல், நுகர்வோர் நடத்தை குறித்த கடந்த காலத் தரவைப் பயன்படுத்தி மிகவும் பயனுள்ள குறுக்கு விற்பனை உத்திகளை உருவாக்கப் பயன்படும் தரவுப் போக்குகளைக் கண்டறிய உதவும். செக் அவுட் செயல்பாட்டின் போது, வாடிக்கையாளர்களுக்கு சரியான துணை நிரல்களை பரிந்துரைக்க ஆன்லைன் வணிகங்களால் இது பயன்படுத்தப்படுகிறது.
- மேற்பார்வை செய்யப்படாத கற்றல் முறைகள், அபரிமிதமான அளவிலான தரவுகளை அவுட்லையர்களைக் கண்டறிய முடியும். இந்த அசாதாரணங்கள் செயலிழந்த உபகரணங்கள், மனித தவறுகள் அல்லது பாதுகாப்பு மீறல்கள் பற்றிய அறிவிப்பை எழுப்பலாம்.
மேற்பார்வை செய்யப்படாத கற்றலில் உள்ள சிக்கல்கள்
முக்கியமான நுண்ணறிவுகளைக் கண்டறிவதில் இருந்து, பல்வேறு வழிகளில் மேற்பார்வையிடப்படாத கற்றல் ஈர்க்கிறது விலையுயர்ந்த தரவு லேபிளிங்கைத் தவிர்ப்பதற்கான தரவு செயல்பாடுகள். இருப்பினும், பயிற்சிக்கு இந்த உத்தியைப் பயன்படுத்துவதில் பல குறைபாடுகள் உள்ளன இயந்திர கற்றல் மாதிரிகள் நீங்கள் அறிந்திருக்க வேண்டும். இங்கே சில உதாரணங்கள்.
- உள்ளீட்டுத் தரவில் பதில் விசைகளாகச் செயல்படும் லேபிள்கள் இல்லாததால், மேற்பார்வை செய்யப்படாத கற்றல் மாதிரிகளின் முடிவுகள் குறைவான துல்லியமாக இருக்கும்.
- மேற்பார்வை செய்யப்படாத கற்றல் பாரிய தரவுத்தொகுப்புகளுடன் அடிக்கடி வேலை செய்கிறது, இது கணக்கீட்டு சிக்கலை அதிகரிக்கும்.
- அணுகுமுறையானது, விசாரணைப் பொருளில் உள்ள அக அல்லது வெளிப்புற நிபுணர்களால், மனிதர்களால் வெளியீட்டு உறுதிப்படுத்தல் தேவைப்படுகிறது.
- அல்காரிதம்கள் பயிற்சி கட்டம் முழுவதும் சாத்தியமான ஒவ்வொரு காட்சியையும் ஆய்வு செய்து கணக்கிட வேண்டும், இதற்கு சிறிது நேரம் ஆகும்.
தீர்மானம்
ஒரு குறிப்பிட்ட சந்தையில் ஒரு போட்டித்தன்மையை நிலைநிறுத்துவதற்கான திறவுகோல் பயனுள்ள தரவு பயன்பாடு ஆகும்.
உங்கள் இலக்கு பார்வையாளர்களின் விருப்பங்களை ஆய்வு செய்ய அல்லது குறிப்பிட்ட சிகிச்சைக்கு ஒரு குறிப்பிட்ட தொற்று எவ்வாறு பதிலளிக்கிறது என்பதைத் தீர்மானிக்க மேற்பார்வை செய்யப்படாத இயந்திர கற்றல் வழிமுறைகளைப் பயன்படுத்தி தரவைப் பிரிக்கலாம்.
பல நடைமுறை பயன்பாடுகள் உள்ளன, மற்றும் தரவு விஞ்ஞானிகள், பொறியாளர்கள் மற்றும் கட்டிடக் கலைஞர்கள் உங்கள் இலக்குகளை வரையறுப்பதற்கும் உங்கள் நிறுவனத்திற்கான தனித்துவமான ML தீர்வுகளை உருவாக்குவதற்கும் உங்களுக்கு உதவ முடியும்.
ஒரு பதில் விடவும்