فهرست[پټ][ښکاره]
سوداګرۍ به تر 2021 پورې د مصرف کونکو متقابل معلوماتو ترلاسه کولو کې مهارت ترلاسه کړي.
له بلې خوا په دې ډیټا نقطو باندې ډیر تکیه، په مکرر ډول هغه سازمانونو ته لاره هواروي چې د پیرودونکي ان پټ سره د احصایې په توګه چلند کوي - د پیرودونکي غږ اوریدلو لپاره یو اړخیز چلند.
د پیرودونکي غږ نشي بدلیدلی یا په شمیره بدلیدلی شي.
دا باید ولوستل شي، راټول شي، او له هرڅه پورته، پوه شي.
حقیقت دا دی چې شرکتونه باید په فعاله توګه هغه څه واوري چې د دوی پیرودونکي باید په هر چینل کې ووایی چې د دوی سره اړیکه لري، که دا د تلیفون زنګونو، بریښنالیکونو، یا ژوندی خبرو اترو له لارې وي.
هر شرکت باید د مرصفوونکو د فیډبیک احساساتو نظارت او ارزونه لومړیتوب ورکړي، مګر شرکتونو په دودیز ډول د دې معلوماتو اداره کولو لپاره مبارزه کړې او دا په معتبر استخباراتو بدلوي.
دا نور د احساس تحلیل سره قضیه نده.
پدې لوست کې، موږ به د احساساتو تحلیل، د هغې ګټې، او د کارولو څرنګوالی ته نږدې کتنه وکړو. NLTK کتابتون د معلوماتو په اړه د احساساتو تحلیل کولو لپاره.
د احساساتو تحلیل څه شی دی؟
د احساساتو تحلیل، چې ډیری وختونه د خبرو اترو کان کیندنې په نوم پیژندل کیږي، د خلکو احساساتو، فکرونو او نظرونو تحلیل کولو لپاره یوه طریقه ده.
د احساساتو تحلیل سوداګرۍ ته اجازه ورکوي چې د خپلو پیرودونکو ښه پوهه ترلاسه کړي، عاید زیات کړي، او د پیرودونکي انډول پراساس خپل محصولات او خدمات لوړ کړي.
د سافټویر سیسټم ترمنځ توپیر چې د پیرودونکي احساساتو تحلیل کولو توان لري او د پلورونکي / پیرودونکي خدمت استازي هڅه کوي چې دا د تحلیل کولو هڅه وکړي د پخواني متن څخه د هدف پایلې ترلاسه کولو لپاره د پخوانۍ وړتیا ده - دا په ابتدايي توګه د طبیعي ژبې پروسس کولو (NLP) له لارې ترسره کیږي. ماشین زده کړه تخنيکونه.
د احساساتو پیژندنې څخه د متن کټګورۍ پورې، د احساساتو تحلیل د غوښتنلیکونو پراخه لړۍ لري. موږ د متني معلوماتو په اړه د احساساتو تحلیل ګمارو ترڅو د محصول ارزونې یا د مصرف کونکي فیډبیک احساس نظارت کولو کې د شرکت سره مرسته وکړي.
د ټولنیزو رسنیو مختلف سایټونه دا د پوسټونو احساسات ارزولو لپاره کاروي، او که چیرې احساسات خورا پیاوړي یا تاوتریخوالی وي، یا د دوی د حد څخه ښکته وي، پوسټ یا حذف یا پټ شوی.
د احساساتو تحلیل د احساساتو پیژندنې څخه د متن کټګورۍ پورې د هرڅه لپاره کارول کیدی شي.
د احساساتو تحلیل خورا مشهور کارول په متني معلوماتو کې دي ، چیرې چې دا د محصول ارزونو یا مصرف کونکو نظرونو احساسات تعقیب کولو کې د شرکت سره د مرستې لپاره کارول کیږي.
د ټولنیزو رسنیو مختلف سایټونه دا د پوسټ کولو احساسات ارزولو لپاره هم کاروي، او که چیرې احساسات خورا پیاوړي یا تاوتریخوالی وي، یا د دوی د حد څخه ښکته وي، دوی پوسټ ړنګوي یا پټوي.
د احساساتو تحلیل ګټې
لاندې د احساساتي تحلیل ځینې خورا مهمې ګټې دي چې باید له پامه ونه غورځول شي.
- ستاسو د نښه شوي ډیموګرافیک په مینځ کې ستاسو د برانډ لید ارزولو کې مرسته وکړئ.
- د پیرودونکي مستقیم فیډبیک چمتو کیږي ترڅو ستاسو د محصول په پراختیا کې ستاسو سره مرسته وکړي.
- د پلور عاید او اټکل زیاتوي.
- ستاسو د محصول اتلانو لپاره د پلور فرصتونه ډیر شوي.
- د پیرودونکي فعال خدمت یو عملي اختیار دی.
شمیرې کولی شي تاسو ته معلومات درکړي لکه د بازار موندنې کمپاین خام فعالیت، په احتمالي تلیفون کې د ښکیلتیا اندازه، او د پیرودونکو مالتړ کې د پاتې ټکټونو شمیر.
په هرصورت، دا به تاسو ته ونه ویل شي چې ولې یوه ځانګړې پیښه رامنځ ته شوې یا د دې لامل شوی. د تحلیلي وسیلې لکه ګوګل او فیسبوک، د بیلګې په توګه، کولی شي تاسو سره ستاسو د بازار موندنې هڅو فعالیت ارزولو کې مرسته وکړي.
مګر دوی تاسو ته ژوره پوهه نه ورکوي چې ولې دا ځانګړی کمپاین بریالی و.
د احساساتو تحلیل پدې برخه کې د لوبې بدلولو احتمال لري.
د احساساتو تحلیل - د ستونزې بیان
موخه دا ده چې معلومه کړي چې ایا یو ټویټ د متحده ایالاتو د شپږو هوایی شرکتونو په اړه د ټویټونو پراساس مناسب، منفي یا غیر جانبدار احساسات لري.
دا یو معیاري څارل شوي زده کړې دنده ده په کوم کې چې موږ باید د متن سټرینګ له مخکې ټاکل شوي کټګوریو کې طبقه بندي کړو.
د حل
موږ به د دې ستونزې د حل لپاره د معیاري ماشین زده کړې پروسې څخه کار واخلو. موږ به د اړین کتابتونونو او ډیټاسیټونو په واردولو پیل وکړو.
بیا به موږ د ځینې سپړنې ډیټا تحلیل ترسره کړو ترڅو معلومه کړو چې ایا په ډیټا کې کوم نمونې شتون لري. د هغې په تعقیب، موږ به د متن پری پروسس پیل کړو ترڅو د متني ان پټ شمیرې ډاټا بدل کړو چې د ماشین زده کړه سیسټم کارول کیدی شي.
په نهایت کې ، موږ به د ماشین زده کړې میتودونو په کارولو سره زموږ د احساساتو تحلیل ماډلونه وروزو او ارزونه وکړو.
1. د کتابتونونو واردول
اړین کتابتونونه پورته کړئ.
2. د ډیټا سیټ واردول
دا مقاله به د ډیټاسیټ پراساس وي چې موندل کیدی شي Github. ډیټاسیټ به د پانډاس لوستلو CSV فعالیت په کارولو سره وارد شي ، لکه څنګه چې لاندې لیدل کیږي:
د سر () فنکشن په کارولو سره، د ډیټاسیټ لومړی پنځه قطارونه معاینه کړئ:
محصول:
3. د معلوماتو تحلیل
راځئ چې ډاټا معاینه کړو ترڅو معلومه کړو چې ایا کوم رجحان شتون لري. مګر لومړی، موږ به د ډیفالټ پلاټ اندازه بدل کړو ترڅو چارټونه نور ښکاره شي.
راځئ چې د هر هوایی ډګر لخوا ترلاسه شوي ټویټونو شمیر سره پیل وکړو. موږ به د دې لپاره یو پای چارټ وکاروو:
د هر هوایی ډګر لپاره د عامه ټویټونو سلنه په محصول کې ښودل کیږي.
راځئ چې وګورو چې احساسات څنګه په ټولو ټویټونو ویشل شوي.
محصول:
راځئ چې اوس د هر ځانګړي هوایی ډګر لپاره د احساساتو ویش معاینه کړو.
د پایلو په وینا، د نږدې ټولو هوایی شرکتونو لپاره ډیری ټویټونه نا مناسب دي، د بې طرفه او ښه ټویټونو تعقیب سره. ویرجین امریکا شاید یوازینی هوایی ډګر دی چیرې چې د دریو احساساتو تناسب د پرتلې وړ دی.
محصول:
په نهایت کې ، موږ به د سیبورن کتابتون څخه کار واخلو ترڅو د دریو احساساتو کټګوریو څخه د ټویټونو لپاره د اوسط باور کچه ترلاسه کړو.
محصول:
پایله ښیې چې د منفي ټویټونو لپاره د باور کچه د مثبت یا غیر جانبدار ټویټونو په پرتله لوړه ده.
4. د معلوماتو پاکول
ډیری سلینګ اصطلاحات او د ټکي نښه نښه په ټویټونو کې موندل کیدی شي. مخکې لدې چې موږ د ماشین زده کړې ماډل وروزو، موږ باید خپل ټویټونه پاک کړو.
په هرصورت، مخکې لدې چې موږ د ټویټونو پاکول پیل کړو، موږ باید خپل ډیټاسیټ په فیچر او لیبل سیټونو کې جلا کړو.
موږ کولی شو معلومات پاک کړو کله چې موږ دا په ځانګړتیاو او روزنې سیټونو کې جلا کړو. د دې کولو لپاره به منظم بیانونه وکارول شي.
5. د متن شمیري نمایندګي
د ماشین زده کړې ماډلونو روزلو لپاره، احصایوي الګوریتمونه ریاضي کاروي. له بلې خوا ریاضي یوازې د شمیرو سره کار کوي.
موږ باید لومړی متن د احصایوي الګوریتمونو لپاره په شمیرو بدل کړو ترڅو ورسره معامله وکړو. د دې کولو لپاره درې اساسي لارې شتون لري: د کلمو کڅوړه، TF-IDF، او Word2Vec.
خوشبختانه، د Python په Scikit-Learn ماډل کې د TfidfVectorizer ټولګي د متن ځانګړتیاوې د TF-IDF فیچر ویکتورونو ته د بدلولو لپاره کارول کیدی شي.
6. د معلوماتو له مخې د روزنې او ټیسټ سیټونو جوړول
په نهایت کې ، موږ باید زموږ د الګوریتمونو روزنې دمخه خپل معلومات د روزنې او ازموینې سیټونو کې وویشو.
د روزنې سیټ به د الګوریتم روزلو لپاره وکارول شي، او د ازموینې سیټ به د ماشین زده کړې ماډل فعالیت ارزولو لپاره وکارول شي.
7. د ماډل پراختیا
وروسته له دې چې معلومات د روزنې او ازموینې سیټونو کې جلا شي، د ماشین زده کړې تخنیکونه د روزنې ډیټا څخه د زده کړې لپاره کارول کیږي.
تاسو کولی شئ د ماشین زده کړې هر ډول الګوریتم وکاروئ. په هرصورت، د تصادفي ځنګل طریقه به د غیر نورمال شوي معلوماتو سره د مقابلې وړتیا له امله وکارول شي.
8. وړاندوینې او د ماډل ارزونه
وروسته له دې چې موډل روزل شوی، وروستی مرحله د وړاندوینې کولو لپاره ده. د دې کولو لپاره، موږ باید د RandomForestClassifier ټولګي اعتراض ته د وړاندوینې میتود پلي کړو چې موږ روزلي.
په نهایت کې ، د ډلبندۍ اقدامات لکه د مغشوش میټریکونه ، F1 اقدامات ، دقت او داسې نور د ماشین زده کړې ماډلونو فعالیت ارزولو لپاره کارول کیدی شي.
محصول:
زموږ الګوریتم د 75.30 دقیقیت ترلاسه کړ، لکه څنګه چې د پایلو لخوا لیدل کیږي.
پایله
د احساساتو تحلیل د NLP یو له خورا مکرر کارونو څخه دی ځکه چې دا د یوې ځانګړې مسلې په اړه د عمومي عامه نظر پیژندلو کې مرسته کوي.
موږ ولیدل چې څنګه د Python څو کتابتونونه د احساساتو تحلیل سره مرسته کولی شي.
موږ د متحده ایالاتو د شپږو هوایی شرکتونو په اړه د عامه ټویټونو مطالعه ترسره کړه او نږدې 75٪ دقت ته ورسیدو.
زه به وړاندیز وکړم چې تاسو د ماشین زده کړې یو بل الګوریتم هڅه وکړئ، لکه لوژستیک ریګریشن، SVM، یا KNN، ترڅو وګورئ چې تاسو غوره پایلې ترلاسه کولی شئ.
یو ځواب ورکړئ ووځي