ንግዶች በ2021 የደንበኛ መስተጋብር መረጃን ማግኘትን የተካኑ ይሆናሉ።
በእነዚህ የውሂብ ነጥቦች ላይ ከመጠን በላይ መታመን፣ በሌላ በኩል፣ በተደጋጋሚ የደንበኞችን ግብአት እንደ ስታስቲክስ ወደሚወስዱ ድርጅቶች ይመራል - የደንበኞችን ድምጽ ለማዳመጥ አንድ አቅጣጫዊ አቀራረብ።
የደንበኛው ድምጽ ባጅ ወይም ቁጥር ወደ ቁጥር ሊቀየር አይችልም።
መነበብ፣ መጨናነቅ እና ከሁሉም በላይ መረዳት አለበት።
እውነታው ግን ኩባንያዎች ደንበኞቻቸው ከእነሱ ጋር በሚገናኙበት በእያንዳንዱ ቻናል፣ በስልክ ጥሪዎች፣ በኢሜል ወይም በቀጥታ ውይይት የሚናገሩትን በንቃት ማዳመጥ አለባቸው።
እያንዳንዱ ኩባንያ የደንበኞችን አስተያየት ለመከታተል እና ለመገምገም ቅድሚያ መስጠት አለበት, ነገር ግን ኩባንያዎች በተለምዶ ይህንን ውሂብ ለመያዝ እና ወደ ትርጉም ያለው ብልህነት ለመለወጥ ታግለዋል.
ይህ ከአሁን በኋላ በስሜት ትንተና ጉዳይ አይደለም።
በዚህ ማጠናከሪያ ትምህርት ውስጥ፣ ስሜትን ትንተና፣ ጥቅሞቹን እና እንዴት መጠቀም እንደሚቻል በጥልቀት እንመለከታለን NLTK በመረጃ ላይ የስሜት ትንተና ለማድረግ ቤተ-መጽሐፍት.
የስሜት ትንተና ምንድን ነው?
የስሜት ትንተና፣ ብዙ ጊዜ የውይይት ማዕድን በመባል የሚታወቀው፣ የሰዎችን ስሜት፣ አስተሳሰብ እና አመለካከት የመተንተን ዘዴ ነው።
የስሜት ትንተና ንግዶች ስለተጠቃሚዎቻቸው የተሻለ ግንዛቤ እንዲኖራቸው፣ ገቢ እንዲያሳድጉ እና በደንበኛ ግብአት ላይ ተመስርተው ምርቶቻቸውን እና አገልግሎቶቻቸውን እንዲያሳድጉ ያስችላቸዋል።
የደንበኞችን ስሜት ሊመረምር በሚችል የሶፍትዌር ሥርዓት እና በሽያጭ ሰው/የደንበኛ አገልግሎት ተወካይ መካከል ያለው ልዩነት የቀደመው ሰው ከጥሬ ጽሑፍ ተጨባጭ ውጤቶችን የማግኘት ችሎታው ነው - ይህ በዋነኝነት የሚከናወነው በተፈጥሮ ቋንቋ ማቀነባበሪያ (NLP) እና የማሽን መማር ዘዴዎች.
ከስሜት መታወቂያ እስከ የጽሑፍ ምድብ፣ ስሜት ትንተና ሰፊ አፕሊኬሽኖች አሉት። አንድ ኩባንያ የምርት ግምገማዎችን ወይም የሸማቾችን አስተያየት ስሜት ለመቆጣጠር እንዲረዳው በስሜት ትንተና በጽሑፍ መረጃ ላይ እንቀጥራለን።
የተለያዩ ማህበራዊ ድረ-ገጾች የተለጠፉትን ስሜቶች ለመገምገም ይጠቀሙበታል, እና ስሜቱ በጣም ጠንካራ ወይም ኃይለኛ ከሆነ, ወይም ከደረጃቸው በታች ከወደቀ, ልጥፉ ይሰረዛል ወይም ይደበቃል.
የስሜት ትንተና ከስሜት መለያ እስከ የጽሑፍ ምድብ ድረስ ለሁሉም ነገር ጥቅም ላይ ሊውል ይችላል።
በጣም ታዋቂው የስሜት ትንተና አጠቃቀም በጽሑፍ መረጃ ላይ ነው, እሱም አንድ ኩባንያ የምርት ግምገማዎችን ወይም የሸማቾች አስተያየቶችን ስሜት ለመከታተል ለመርዳት ጥቅም ላይ ይውላል.
የተለያዩ ማህበራዊ ድረ-ገጾችም የተለጠፉትን ስሜቶች ለመገምገም ይጠቀሙበታል፣ እና ስሜቱ በጣም ጠንካራ ወይም ኃይለኛ ከሆነ ወይም ከደረጃቸው በታች ቢወድቅ ልጥፉን ይሰርዙታል ወይም ይደብቃሉ።
የስሜት ትንተና ጥቅሞች
ችላ ሊባሉ የማይገባቸው የስሜት ትንተና ጠቃሚ ጥቅሞች የሚከተሉት ናቸው።
- ከዒላማዎ የስነ ሕዝብ አወቃቀር መካከል የምርትዎን ግንዛቤ ለመገምገም ያግዙ።
- ምርትዎን ለማዳበር እርስዎን ለመርዳት ቀጥተኛ የደንበኛ ግብረመልስ ቀርቧል።
- የሽያጭ ገቢን እና ተስፋን ይጨምራል።
- ለምርትዎ ሻምፒዮን የሚሆኑ እድሎች ጨምረዋል።
- ንቁ የደንበኞች አገልግሎት ተግባራዊ አማራጭ ነው።
ቁጥሮች እንደ የግብይት ዘመቻ ጥሬ አፈጻጸም፣ በተጠባባቂ ጥሪ ውስጥ ያለው የተሳትፎ መጠን እና በደንበኛ ድጋፍ ላይ ያሉ የቲኬቶች ብዛት ያሉ መረጃዎችን ሊሰጡዎት ይችላሉ።
ሆኖም፣ አንድ የተወሰነ ክስተት ለምን እንደተከሰተ ወይም ለምን እንደተፈጠረ አይነግርዎትም። ለምሳሌ እንደ Google እና Facebook ያሉ የትንታኔ መሳሪያዎች የግብይት ጥረቶችዎን አፈጻጸም ለመገምገም ሊረዱዎት ይችላሉ።
ነገር ግን ያ የተለየ ዘመቻ ለምን እንደተሳካ ጥልቅ ዕውቀት አይሰጡዎትም።
የስሜት ትንተና በዚህ ረገድ ጨዋታን የመቀየር አቅም አለው።
የስሜት ትንተና - የችግር መግለጫ
ዓላማው በትዊቶች ላይ በመመስረት ስድስት የአሜሪካ አየር መንገዶችን በተመለከተ ትዊት ጥሩ፣ አሉታዊ ወይም ገለልተኛ ስሜት እንዳለው ለማወቅ ነው።
ይህ መደበኛ ክትትል የሚደረግበት የመማሪያ ሥራ ነው፣ በዚህ ውስጥ የጽሑፍ ሕብረቁምፊን በጽሑፍ ሕብረቁምፊ በተሰጡ ቀድሞ ወደተወሰኑ ምድቦች መከፋፈል ያለብን።
መፍትሔ
ይህንን ችግር ለመፍታት መደበኛውን የማሽን መማር ሂደት እንጠቀማለን። አስፈላጊ የሆኑትን ቤተ-መጻሕፍት እና የውሂብ ስብስቦችን በማስመጣት እንጀምራለን.
ከዚያ በመረጃው ውስጥ ማንኛቸውም ቅጦች መኖራቸውን ለማወቅ አንዳንድ የዳሰሳ ዳታ ትንታኔዎችን እናደርጋለን። ከዚያ በኋላ፣ የጽሑፍ ግቤት አሃዛዊ መረጃን ለመቀየር የጽሑፍ ቅድመ ሂደትን እናከናውናለን። የማሽን መማር ስርዓት መጠቀም ይችላል።
በመጨረሻም የማሽን መማሪያ ዘዴዎችን በመጠቀም የስሜት ትንተና ሞዴሎቻችንን እናሰልጥና እንገመግማለን።
1. ቤተ-መጻሕፍት ማስመጣት
አስፈላጊዎቹን ቤተ-መጻሕፍት ይጫኑ.
2. የውሂብ ስብስብ አስመጣ
ይህ ጽሑፍ ሊገኝ በሚችል የውሂብ ስብስብ ላይ የተመሰረተ ይሆናል የፊልሙ. ከዚህ በታች እንደሚታየው የዳታ ስብስቡ የፓንዳስ ማንበብ CSV ተግባርን በመጠቀም ነው የሚመጣው፡-
የጭንቅላት() ተግባርን በመጠቀም የመረጃ ቋቱን የመጀመሪያዎቹን አምስት ረድፎች ይመርምሩ፡-
ውጤት
3. የመረጃ ትንተና
ማንኛቸውም አዝማሚያዎች መኖራቸውን ለመወሰን ውሂቡን እንመርምር. መጀመሪያ ግን ገበታዎቹ ይበልጥ እንዲታዩ ለማድረግ ነባሪውን የቦታ መጠን እንለውጣለን።
በእያንዳንዱ አየር መንገድ በተቀበሉት የትዊቶች ብዛት እንጀምር። ለዚህ የፓይ ሰንጠረዥን እንጠቀማለን-
ለእያንዳንዱ አየር መንገድ የህዝብ ትዊቶች መቶኛ በውጤቱ ውስጥ ይታያል።
ስሜቶቹ በሁሉም ትዊቶች ላይ እንዴት እንደተከፋፈሉ እንመልከት።
ውጤት
አሁን ለእያንዳንዱ የተለየ አየር መንገድ የስሜት ስርጭትን እንመርምር.
በውጤቶቹ መሰረት፣ ለሁሉም አየር መንገዶች አብዛኛዎቹ ትዊቶች ጥሩ አይደሉም፣ ገለልተኛ እና ጥሩ ትዊቶች ይከተላሉ። ቨርጂን አሜሪካ ምናልባት የሶስቱ ስሜቶች መጠን ተመጣጣኝ የሆነበት ብቸኛው አየር መንገድ ነው።
ውጤት
በመጨረሻም፣ ከሶስት ስሜት ምድቦች ለትዊቶች አማካይ የመተማመን ደረጃ ለማግኘት የ Seaborn ቤተ-መጽሐፍትን እንጠቀማለን።
ውጤት
ውጤቱ እንደሚያሳየው ለአሉታዊ ትዊቶች የመተማመን ደረጃ ከአዎንታዊ ወይም ገለልተኛ ትዊቶች የበለጠ ነው።
4. ውሂቡን ማጽዳት
ብዙ የቃላት ቃላት እና ሥርዓተ-ነጥብ ምልክቶች በትዊቶች ውስጥ ይገኛሉ። የማሽን መማሪያ ሞዴሉን ከማሰልጠንዎ በፊት፣ ትዊቶቻችንን ማጽዳት አለብን።
ነገር ግን፣ ትዊቶቹን ማጽዳት ከመጀመራችን በፊት፣ የእኛን ዳታ ስብስብ ወደ ባህሪ እና መለያ ስብስቦች መለየት አለብን።
ወደ ባህሪያት እና የስልጠና ስብስቦች ከለየን በኋላ ውሂቡን ማጽዳት እንችላለን። ይህንን ለማድረግ መደበኛ መግለጫዎች ጥቅም ላይ ይውላሉ.
5. የጽሑፍ አሃዛዊ ውክልና
የማሽን መማሪያ ሞዴሎችን ለማሰልጠን፣ ስታቲስቲካዊ ስልተ ቀመሮች ሂሳብን ይጠቀማሉ። በሌላ በኩል ሂሳብ በቁጥር ብቻ ይሰራል።
እሱን ለመቋቋም መጀመሪያ ጽሑፉን ወደ ቁጥሮች መለወጥ አለብን ስታቲስቲካዊ ስልተ ቀመሮች። ይህን ለማድረግ ሶስት መሰረታዊ መንገዶች አሉ፡ የቃላት ቦርሳ፣ TF-IDF እና Word2Vec።
እንደ እድል ሆኖ፣ የTfidfVectorizer ክፍል በ Python Scikit-Learn ሞዱል የጽሁፍ ባህሪያትን ወደ TF-IDF ባህሪ ቬክተር ለመቀየር ጥቅም ላይ ሊውል ይችላል።
6. በመረጃ ላይ የተመሰረተ ስልጠና እና የሙከራ ስብስቦችን መፍጠር
በመጨረሻም ስልተ ቀመሮቻችንን ከማሰልጠን በፊት መረጃዎቻችንን ወደ ስልጠና እና የሙከራ ስብስቦች መክፈል አለብን።
የስልጠናው ስብስብ አልጎሪዝምን ለማሰልጠን ጥቅም ላይ ይውላል, እና የፈተናው ስብስብ የማሽን መማሪያ ሞዴልን አፈፃፀም ለመገምገም ጥቅም ላይ ይውላል.
7. ሞዴል ልማት
መረጃው ወደ ስልጠና እና የፈተና ስብስቦች ከተከፋፈለ በኋላ ከስልጠናው መረጃ ለመማር የማሽን መማሪያ ዘዴዎች ጥቅም ላይ ይውላሉ.
ማንኛውንም የማሽን መማሪያ ስልተ ቀመር መጠቀም ይችላሉ። የ Random Forest አካሄድ ግን ጥቅም ላይ የሚውለው መደበኛ ያልሆነ መረጃን የመቋቋም ችሎታ ስላለው ነው።
8. ትንበያዎች እና ሞዴል ግምገማ
ሞዴሉ ከሰለጠነ በኋላ የመጨረሻው ደረጃ ትንበያዎችን ማድረግ ነው. ይህንን ለማድረግ የትንበያ ዘዴውን ለሰለጠንነው የ RandomForestClassifier ክፍል ነገር መተግበር አለብን።
በመጨረሻም፣ የማሽን መማሪያ ሞዴሎችን አፈጻጸም ለመገምገም እንደ ግራ መጋባት፣ F1 መለኪያዎች፣ ትክክለኛነት እና የመሳሰሉት የምደባ እርምጃዎችን መጠቀም ይቻላል።
ውጤት
ውጤቶቹ እንደታየው የእኛ አልጎሪዝም የ 75.30 ትክክለኛነትን አግኝቷል።
መደምደሚያ
በአንድ የተወሰነ ጉዳይ ላይ አጠቃላይ የህዝብ አስተያየትን ለመለየት ስለሚረዳ የስሜት ትንተና በጣም ተደጋጋሚ የ NLP ስራዎች አንዱ ነው።
በርካታ የ Python ቤተ-መጻሕፍት በስሜት ትንተና እንዴት እንደሚረዱ አይተናል።
ስለ ስድስት የአሜሪካ አየር መንገዶች በሕዝብ ትዊቶች ላይ ጥናት አድርገን ወደ 75% ገደማ ትክክለኛነት ላይ ደርሰናል።
የተሻለ ውጤት ማግኘት ይችሉ እንደሆነ ለማየት ሌላ የማሽን መማሪያ አልጎሪዝምን ለምሳሌ እንደ ሎጅስቲክ ሪግሬሽን፣ SVM ወይም KNN እንድትሞክሩ እመክራለሁ።
መልስ ይስጡ