பொருளடக்கம்[மறை][காட்டு]
2021க்குள் நுகர்வோர் தொடர்புத் தரவைப் பெறுவதில் வணிகங்கள் தேர்ச்சி பெறும்.
மறுபுறம், இந்தத் தரவுப் புள்ளிகளை அதிகமாகச் சார்ந்திருப்பது, வாடிக்கையாளர் உள்ளீட்டை புள்ளி விவரமாகக் கருதும் நிறுவனங்களுக்கு அடிக்கடி வழிவகுக்கிறது - வாடிக்கையாளரின் குரலைக் கேட்பதற்கு மாறாக ஒரு பரிமாண அணுகுமுறை.
வாடிக்கையாளரின் குரலை பேட்ஜ் செய்யவோ அல்லது எண்ணாக மாற்றவோ முடியாது.
இது படிக்கப்பட வேண்டும், சுருக்கப்பட்டு, எல்லாவற்றிற்கும் மேலாக, புரிந்து கொள்ளப்பட வேண்டும்.
உண்மை என்னவென்றால், தொலைபேசி அழைப்புகள், மின்னஞ்சல்கள் அல்லது நேரலை அரட்டை மூலம் அவர்கள் தொடர்பு கொள்ளும் ஒவ்வொரு சேனலிலும் தங்கள் நுகர்வோர் என்ன சொல்கிறார்கள் என்பதை நிறுவனங்கள் தீவிரமாகக் கேட்க வேண்டும்.
ஒவ்வொரு நிறுவனமும் நுகர்வோர் கருத்து உணர்வை கண்காணிப்பதற்கும் மதிப்பீடு செய்வதற்கும் முன்னுரிமை அளிக்க வேண்டும், ஆனால் நிறுவனங்கள் பாரம்பரியமாக இந்தத் தரவைக் கையாளவும், அர்த்தமுள்ள நுண்ணறிவாக மாற்றவும் போராடி வருகின்றன.
சென்டிமென்ட் பகுப்பாய்வில் இது இனி இல்லை.
இந்த டுடோரியலில், உணர்வு பகுப்பாய்வு, அதன் நன்மைகள் மற்றும் அதை எவ்வாறு பயன்படுத்துவது என்பதைப் பற்றி விரிவாகப் பார்ப்போம். என்.எல்.டி.கே தரவுகளில் உணர்வு பகுப்பாய்வு செய்ய நூலகம்.
உணர்வு பகுப்பாய்வு என்றால் என்ன?
உணர்ச்சி பகுப்பாய்வு, பெரும்பாலும் உரையாடல் சுரங்கம் என்று அழைக்கப்படுகிறது, இது மக்களின் உணர்வுகள், எண்ணங்கள் மற்றும் பார்வைகளை பகுப்பாய்வு செய்வதற்கான ஒரு முறையாகும்.
சென்டிமென்ட் பகுப்பாய்வானது வணிகங்கள் தங்கள் வாடிக்கையாளர்களைப் பற்றி நன்கு புரிந்து கொள்ளவும், வருவாயை அதிகரிக்கவும், வாடிக்கையாளர் உள்ளீட்டின் அடிப்படையில் தங்கள் தயாரிப்புகள் மற்றும் சேவைகளை மேம்படுத்தவும் அனுமதிக்கிறது.
வாடிக்கையாளரின் உணர்வை பகுப்பாய்வு செய்யும் திறன் கொண்ட மென்பொருள் அமைப்புக்கும் விற்பனையாளர்/வாடிக்கையாளர் சேவை பிரதிநிதிக்கும் இடையே உள்ள வித்தியாசம், மூல உரையிலிருந்து புறநிலை முடிவுகளைப் பெறுவதற்கு முந்தையவரின் முழுமையான திறன் ஆகும் - இது முதன்மையாக இயற்கை மொழி செயலாக்கம் (NLP) மற்றும் இயந்திர கற்றல் நுட்பங்களை.
உணர்ச்சி அடையாளப்படுத்தல் முதல் உரை வகைப்படுத்தல் வரை, உணர்வு பகுப்பாய்வு பரந்த அளவிலான பயன்பாடுகளைக் கொண்டுள்ளது. தயாரிப்பு மதிப்பீடுகள் அல்லது நுகர்வோர் கருத்துகளின் உணர்வைக் கண்காணிக்க ஒரு நிறுவனம் உதவ, உரைத் தரவுகளில் உணர்வுப் பகுப்பாய்வைப் பயன்படுத்துகிறோம்.
பல்வேறு சமூக ஊடக தளங்கள் இடுகைகளின் உணர்வை மதிப்பிடுவதற்கு இதைப் பயன்படுத்துகின்றன, மேலும் உணர்ச்சிகள் மிகவும் வலுவானதாகவோ அல்லது வன்முறையாகவோ இருந்தால் அல்லது அவற்றின் வரம்புக்குக் கீழே விழுந்தால், இடுகை நீக்கப்படும் அல்லது மறைக்கப்படும்.
உணர்ச்சிகளை அடையாளம் காண்பது முதல் உரை வகைப்படுத்தல் வரை அனைத்திற்கும் உணர்வு பகுப்பாய்வு பயன்படுத்தப்படலாம்.
உணர்வுப் பகுப்பாய்வின் மிகவும் பிரபலமான பயன்பாடானது உரைத் தரவு ஆகும், இது தயாரிப்பு மதிப்பீடுகள் அல்லது நுகர்வோர் கருத்துகளின் உணர்வைக் கண்காணிப்பதில் நிறுவனத்திற்கு உதவப் பயன்படுகிறது.
வெவ்வேறு சமூக ஊடகத் தளங்கள் இடுகைகளின் உணர்வை மதிப்பிடுவதற்கும் இதைப் பயன்படுத்துகின்றன, மேலும் உணர்ச்சிகள் மிகவும் வலுவானதாகவோ அல்லது வன்முறையாகவோ இருந்தால் அல்லது அவற்றின் வரம்புக்குக் கீழே விழுந்தால், அவை இடுகையை நீக்குகின்றன அல்லது மறைக்கின்றன.
உணர்வு பகுப்பாய்வின் நன்மைகள்
புறக்கணிக்கக் கூடாத உணர்வுப் பகுப்பாய்வின் மிக முக்கியமான சில நன்மைகள் பின்வருமாறு.
- உங்கள் இலக்கு மக்கள்தொகையில் உங்கள் பிராண்டின் உணர்வை மதிப்பிடுவதில் உதவுங்கள்.
- உங்கள் தயாரிப்பை மேம்படுத்த உங்களுக்கு உதவ நேரடி வாடிக்கையாளர் கருத்து வழங்கப்படுகிறது.
- விற்பனை வருவாய் மற்றும் எதிர்பார்ப்பு அதிகரிக்கிறது.
- உங்கள் தயாரிப்பின் சாம்பியன்களுக்கான அப்செல் வாய்ப்புகள் அதிகரித்துள்ளன.
- செயல்திறன் மிக்க வாடிக்கையாளர் சேவை ஒரு நடைமுறை விருப்பமாகும்.
மார்க்கெட்டிங் பிரச்சாரத்தின் மூல செயல்திறன், வருங்கால அழைப்பில் ஈடுபாட்டின் அளவு மற்றும் வாடிக்கையாளர் ஆதரவில் நிலுவையில் உள்ள டிக்கெட்டுகளின் எண்ணிக்கை போன்ற தகவல்களை எண்கள் உங்களுக்கு வழங்க முடியும்.
இருப்பினும், ஒரு குறிப்பிட்ட நிகழ்வு ஏன் நடந்தது அல்லது அது எதனால் ஏற்பட்டது என்பதை இது உங்களுக்குச் சொல்லாது. எடுத்துக்காட்டாக, Google மற்றும் Facebook போன்ற பகுப்பாய்வுக் கருவிகள், உங்கள் மார்க்கெட்டிங் முயற்சிகளின் செயல்திறனை மதிப்பிட உதவும்.
ஆனால் அந்த குறிப்பிட்ட பிரச்சாரம் ஏன் வெற்றிகரமாக இருந்தது என்பது பற்றிய ஆழமான அறிவை அவை உங்களுக்கு வழங்கவில்லை.
சென்டிமென்ட் அனாலிசிஸ் இந்த விஷயத்தில் விளையாட்டை மாற்றும் திறனைக் கொண்டுள்ளது.
உணர்வு பகுப்பாய்வு - பிரச்சனை அறிக்கை
ட்வீட்களின் அடிப்படையில் ஆறு அமெரிக்க விமான நிறுவனங்களைப் பற்றி ஒரு ட்வீட் சாதகமான, எதிர்மறை அல்லது நடுநிலை உணர்ச்சிகளைக் கொண்டிருக்கிறதா என்பதை தீர்மானிப்பதே இதன் நோக்கம்.
இது ஒரு நிலையான மேற்பார்வையிடப்பட்ட கற்றல் வேலையாகும், இதில் உரைச் சரம் கொடுக்கப்பட்ட முன்னரே தீர்மானிக்கப்பட்ட வகைகளாக நாம் உரைச் சரத்தை வகைப்படுத்த வேண்டும்.
தீர்வு
இந்த சிக்கலை தீர்க்க நிலையான இயந்திர கற்றல் செயல்முறையைப் பயன்படுத்துவோம். தேவையான நூலகங்கள் மற்றும் தரவுத்தொகுப்புகளை இறக்குமதி செய்வதன் மூலம் தொடங்குவோம்.
தரவுகளில் ஏதேனும் வடிவங்கள் உள்ளதா என்பதைத் தீர்மானிக்க சில ஆய்வுத் தரவுப் பகுப்பாய்வைச் செய்வோம். அதைத் தொடர்ந்து, உரை உள்ளீடு எண் தரவை மாற்றுவதற்கு உரை முன் செயலாக்கத்தை மேற்கொள்வோம் a இயந்திர கற்றல் அமைப்பு பயன்படுத்த முடியும்.
இறுதியாக, இயந்திர கற்றல் முறைகளைப் பயன்படுத்தி எங்கள் உணர்வு பகுப்பாய்வு மாதிரிகளைப் பயிற்றுவிப்போம் மற்றும் மதிப்பீடு செய்வோம்.
1. நூலகங்களை இறக்குமதி செய்தல்
தேவையான நூலகங்களை ஏற்றவும்.
2. தரவுத்தொகுப்பை இறக்குமதி செய்யவும்
இந்தக் கட்டுரையில் காணக்கூடிய தரவுத்தொகுப்பின் அடிப்படையில் இருக்கும் கிட்ஹப். கீழே காணப்படுவது போல், பாண்டாஸின் ரீட் CSV செயல்பாட்டைப் பயன்படுத்தி தரவுத்தொகுப்பு இறக்குமதி செய்யப்படும்:
ஹெட்() செயல்பாட்டைப் பயன்படுத்தி, தரவுத்தொகுப்பின் முதல் ஐந்து வரிசைகளை ஆராயவும்:
வெளியீடு:
3. தரவுகளின் பகுப்பாய்வு
ஏதேனும் போக்குகள் உள்ளதா என்பதைத் தீர்மானிக்க தரவை ஆராய்வோம். ஆனால் முதலில், விளக்கப்படங்களை மேலும் தெரியப்படுத்த, இயல்புநிலை ப்ளாட்டின் அளவை மாற்றுவோம்.
ஒவ்வொரு விமான நிறுவனமும் பெற்ற ட்வீட்களின் எண்ணிக்கையுடன் ஆரம்பிக்கலாம். இதற்கு ஒரு பை விளக்கப்படத்தைப் பயன்படுத்துவோம்:
ஒவ்வொரு விமான நிறுவனத்திற்கும் பொது ட்வீட்களின் சதவீதம் வெளியீட்டில் காட்டப்படும்.
அனைத்து ட்வீட்களிலும் உணர்வுகள் எவ்வாறு விநியோகிக்கப்படுகின்றன என்பதைப் பார்ப்போம்.
வெளியீடு:
ஒவ்வொரு குறிப்பிட்ட விமான நிறுவனத்திற்கும் உணர்வுப் பரவலை இப்போது ஆராய்வோம்.
முடிவுகளின்படி, ஏறக்குறைய அனைத்து விமான நிறுவனங்களின் ட்வீட்களின் பெரும்பகுதி சாதகமற்றது, நடுநிலை மற்றும் நல்ல ட்வீட்கள் தொடர்ந்து வருகின்றன. மூன்று உணர்வுகளின் விகிதத்தை ஒப்பிடக்கூடிய ஒரே விமான நிறுவனம் விர்ஜின் அமெரிக்காவாக இருக்கலாம்.
வெளியீடு:
இறுதியாக, மூன்று உணர்வு வகைகளின் ட்வீட்களுக்கான சராசரி நம்பிக்கை அளவைப் பெற, Seaborn நூலகத்தைப் பயன்படுத்துவோம்.
வெளியீடு:
நேர்மறை அல்லது நடுநிலை ட்வீட்களை விட எதிர்மறை ட்வீட்டுகளுக்கான நம்பிக்கை நிலை அதிகமாக இருப்பதை முடிவு காட்டுகிறது.
4. தரவுகளை சுத்தம் செய்தல்
பல ஸ்லாங் சொற்கள் மற்றும் நிறுத்தற்குறிகள் ட்வீட்களில் காணப்படுகின்றன. இயந்திரக் கற்றல் மாதிரியைப் பயிற்றுவிப்பதற்கு முன், நமது ட்வீட்களை சுத்தம் செய்ய வேண்டும்.
இருப்பினும், ட்வீட்களை சுத்தம் செய்யத் தொடங்கும் முன், எங்கள் தரவுத்தொகுப்பை அம்சம் மற்றும் லேபிள் தொகுப்புகளாகப் பிரிக்க வேண்டும்.
தரவை அம்சங்கள் மற்றும் பயிற்சித் தொகுப்புகளாகப் பிரித்தவுடன் அதைச் சுத்தம் செய்யலாம். இதைச் செய்ய வழக்கமான வெளிப்பாடுகள் பயன்படுத்தப்படும்.
5. உரையின் எண் பிரதிநிதித்துவம்
இயந்திர கற்றல் மாதிரிகளைப் பயிற்றுவிக்க, புள்ளிவிவர வழிமுறைகள் கணிதத்தைப் பயன்படுத்துகின்றன. கணிதம், மறுபுறம், எண்களுடன் மட்டுமே செயல்படுகிறது.
புள்ளியியல் அல்காரிதங்களைச் சமாளிப்பதற்கான உரையை எண்களாக மாற்ற வேண்டும். அவ்வாறு செய்வதற்கு மூன்று அடிப்படை வழிகள் உள்ளன: வார்த்தைகளின் பை, TF-IDF மற்றும் Word2Vec.
அதிர்ஷ்டவசமாக, Python's Scikit-Learn தொகுதியில் உள்ள TfidfVectorizer வகுப்பு உரை அம்சங்களை TF-IDF அம்ச திசையன்களாக மாற்ற பயன்படுகிறது.
6. தரவு உந்துதல் பயிற்சி மற்றும் சோதனைத் தொகுப்புகளை உருவாக்குதல்
இறுதியாக, நமது அல்காரிதம்களைப் பயிற்றுவிப்பதற்கு முன், நமது தரவை பயிற்சி மற்றும் சோதனைத் தொகுப்புகளாகப் பிரிக்க வேண்டும்.
பயிற்சித் தொகுப்பு அல்காரிதத்தைப் பயிற்றுவிக்கப் பயன்படும், மேலும் சோதனைத் தொகுப்பு இயந்திரக் கற்றல் மாதிரியின் செயல்திறனை மதிப்பிடுவதற்குப் பயன்படுத்தப்படும்.
7. மாதிரி வளர்ச்சி
பயிற்சி மற்றும் சோதனைத் தொகுப்புகளாக தரவு பிரிக்கப்பட்ட பிறகு, பயிற்சி தரவிலிருந்து கற்றுக்கொள்ள இயந்திர கற்றல் நுட்பங்கள் பயன்படுத்தப்படுகின்றன.
நீங்கள் எந்த இயந்திர கற்றல் அல்காரிதத்தையும் பயன்படுத்தலாம். எவ்வாறாயினும், ரேண்டம் ஃபாரஸ்ட் அணுகுமுறையானது, இயல்பாக்கப்படாத தரவைச் சமாளிக்கும் திறன் காரணமாகப் பயன்படுத்தப்படும்.
8. கணிப்புகள் மற்றும் மாதிரி மதிப்பீடு
மாதிரி பயிற்சி பெற்ற பிறகு, இறுதி கட்டம் கணிப்புகளை உருவாக்க வேண்டும். இதைச் செய்ய, நாம் பயிற்றுவித்த RandomForestClassifier வகுப்பு பொருளுக்கு முன்கணிப்பு முறையைப் பயன்படுத்த வேண்டும்.
இறுதியாக, குழப்ப அளவீடுகள், F1 அளவீடுகள், துல்லியம் மற்றும் பல வகைப்பாடு நடவடிக்கைகள் இயந்திர கற்றல் மாதிரிகளின் செயல்திறனை மதிப்பிடுவதற்குப் பயன்படுத்தப்படலாம்.
வெளியீடு:
எங்களின் அல்காரிதம் முடிவுகளின்படி 75.30 துல்லியத்தை அடைந்தது.
தீர்மானம்
செண்டிமென்ட் பகுப்பாய்வானது மிகவும் அடிக்கடி நிகழும் NLP வேலைகளில் ஒன்றாகும், ஏனெனில் இது ஒரு குறிப்பிட்ட பிரச்சினையில் ஒட்டுமொத்த பொதுக் கருத்தை கண்டறிய உதவுகிறது.
பல பைதான் நூலகங்கள் உணர்வு பகுப்பாய்வுக்கு எவ்வாறு உதவுகின்றன என்பதைப் பார்த்தோம்.
நாங்கள் ஆறு அமெரிக்க விமான நிறுவனங்களைப் பற்றிய பொது ட்வீட்களை ஆய்வு செய்து தோராயமாக 75% துல்லியத்தை அடைந்தோம்.
நீங்கள் சிறந்த முடிவுகளை அடைய முடியுமா என்பதைப் பார்க்க, லாஜிஸ்டிக் ரிக்ரஷன், SVM அல்லது KNN போன்ற மற்றொரு இயந்திர கற்றல் வழிமுறையை முயற்சிக்குமாறு நான் பரிந்துரைக்கிறேன்.
ஒரு பதில் விடவும்