Python - HashDork استعمال ڪندي اين ايل پي جذبي جو تجزيو

مواد جي جدول[لڪ][ڏسو]

جذباتي تجزيو ڇا آهي؟
جذبي جي تجزيي جا فائدا
جذبي جو تجزيو - مسئلو بيان+-
ٿڪل

ڪاروبار 2021 تائين صارفين جي رابطي واري ڊيٽا جي حصول ۾ مهارت حاصل ڪري سگهندا.

انهن ڊيٽا پوائنٽس تي وڌيڪ انحصار، ٻئي طرف، اڪثر ڪري تنظيمن ڏانهن وٺي ٿو جيڪو ڪسٽمر ان پٽ کي شماريات جي طور تي علاج ڪري ٿو - صارف جي آواز کي ٻڌڻ لاء هڪ بلڪه هڪ طرفي طريقو.

ڪسٽمر جو آواز بيج نٿو ٿي سگھي يا نمبر ۾ تبديل ٿي سگھي ٿو.

ان کي پڙهڻ گهرجي، ڳڻي، ۽، سڀ کان وڌيڪ، سمجھڻ گهرجي.

حقيقت اها آهي ته ڪمپنين کي لازمي طور تي ٻڌڻ گهرجي ته انهن جي صارفين کي هر چينل تي ڇا چوڻ آهي جنهن جي ذريعي اهي انهن سان رابطو ڪن ٿا، ڇا اهو فون ڪال، اي ميل، يا لائيو چيٽ ذريعي آهي.

هر ڪمپني کي صارفين جي راءِ جي جذبي جي نگراني ۽ جائزو وٺڻ کي ترجيح ڏيڻ گهرجي، پر ڪمپنيون روايتي طور تي هن ڊيٽا کي سنڀالڻ ۽ ان کي بامعني ذهانت ۾ تبديل ڪرڻ لاءِ جدوجهد ڪري رهيون آهن.

اهو معاملو هاڻي جذبي جي تجزيي سان ناهي.

هن سبق ۾، اسان جذبي جي تجزيي، ان جي فائدن، ۽ ڪيئن استعمال ڪرڻ تي هڪ ويجهي نظر ڪنداسين. NLTK ڊيٽا تي جذباتي تجزيو ڪرڻ لاءِ لائبريري.

جذباتي تجزيو ڇا آهي؟

جذبي جو تجزيو، اڪثر ڪري گفتگو کان کني طور سڃاتو وڃي ٿو، ماڻهن جي جذبات، سوچن ۽ نظرين جو تجزيو ڪرڻ جو هڪ طريقو آهي.

جذبي جو تجزيو ڪاروبار کي اجازت ڏئي ٿو ته انهن جي صارفين کي بهتر سمجھڻ، آمدني وڌائڻ، ۽ ڪلائنٽ ان پٽ جي بنياد تي انهن جي شين ۽ خدمتن کي وڌايو.

هڪ سافٽ ويئر سسٽم جي وچ ۾ فرق جيڪو گراهڪ جي جذبي جو تجزيو ڪرڻ جي قابل آهي ۽ هڪ وڪرو ڪندڙ / ڪسٽمر سروس نمائندو جيڪو ان کي گهٽائڻ جي ڪوشش ڪري رهيو آهي اهو اڳئين جي خام متن مان مقصدي نتيجا حاصل ڪرڻ جي مڪمل صلاحيت آهي - اهو بنيادي طور تي قدرتي ٻولي پروسيسنگ (NLP) ذريعي مڪمل ڪيو ويو آهي ۽ مشين جي سکيا طريقن.

جذبات جي سڃاڻپ کان وٺي متن جي درجه بندي تائين، جذبي جي تجزيي ۾ ايپليڪيشنن جو هڪ وسيع سلسلو آهي. اسان متن جي ڊيٽا تي جذباتي تجزيي کي ملازمت ڪندا آهيون هڪ فرم جي مدد لاءِ پراڊڪٽ جي تشخيص يا صارف جي راءِ جي جذبي جي نگراني.

مختلف سوشل ميڊيا سائيٽون پوسٽنگ جي جذبي جو اندازو لڳائڻ لاءِ ان کي استعمال ڪنديون آهن، ۽ جيڪڏهن جذبو تمام گهڻو مضبوط يا پرتشدد آهي، يا انهن جي حد کان هيٺ اچي ٿو، ته پوسٽ يا ته ڊاهي يا لڪائي ويندي آهي.

جذبي جو تجزيو جذبات جي سڃاڻپ کان وٺي متن جي درجه بندي تائين هر شيءِ لاءِ استعمال ٿي سگهي ٿو.

جذبي جي تجزيي جو سڀ کان وڌيڪ مشهور استعمال متن جي ڊيٽا تي آهي، جتي اهو استعمال ڪيو ويندو آهي هڪ ڪمپني جي مدد ڪرڻ ۾ پراڊڪٽ جي تشخيص يا صارفين جي تبصرن جي جذبي کي ٽريڪ ڪرڻ ۾.

مختلف سوشل ميڊيا سائيٽون ان کي پوسٽنگ جي جذبي جو اندازو لڳائڻ لاءِ پڻ استعمال ڪنديون آهن، ۽ جيڪڏهن جذبات تمام گهڻو مضبوط يا پرتشدد آهي، يا انهن جي حد کان هيٺ اچي ٿو، اهي پوسٽ کي حذف يا لڪائي ڇڏيندا آهن.

جذبي جي تجزيي جا فائدا

جذباتي تجزيي جا هيٺيان ڪجھ اهم فائدا آھن جن کي نظرانداز نه ڪيو وڃي.

توھان جي ھدف ٿيل ڊيموگرافڪ جي وچ ۾ توھان جي برانڊ جي تصور جو جائزو وٺڻ ۾ مدد ڪريو.
توهان جي پيداوار کي ترقي ڪرڻ ۾ توهان جي مدد لاءِ سڌو ڪلائنٽ راءِ فراهم ڪئي وئي آهي.
سيلز آمدني ۽ امڪان وڌائي ٿو.
توهان جي پراڊڪٽ جي چيمپئن لاءِ اپسيل جا موقعا وڌي ويا آهن.
فعال ڪسٽمر سروس هڪ عملي اختيار آهي.

نمبر توهان کي معلومات مهيا ڪري سگھن ٿا جهڙوڪ مارڪيٽنگ مهم جي خام ڪارڪردگي، امڪاني ڪال ۾ مصروفيت جي رقم، ۽ ڪسٽمر سپورٽ ۾ التوا ۾ ٽڪيٽن جو تعداد.

بهرحال، اهو توهان کي نه ٻڌائيندو ته هڪ خاص واقعو ڇو ٿيو يا ان جو سبب ڇا آهي. تجزياتي اوزار جهڙوڪ گوگل ۽ فيسڪشن، مثال طور، توهان جي مارڪيٽنگ جي ڪوششن جي ڪارڪردگي جو جائزو وٺڻ ۾ مدد ڪري سگھن ٿا.

پر اهي توهان کي نه ڄاڻن ٿا ته ان جي باري ۾ تفصيلي ڄاڻ ڇو ته اها مخصوص مهم ڪامياب هئي.

جذبي جو تجزيو هن سلسلي ۾ راند کي تبديل ڪرڻ جي صلاحيت رکي ٿو.

جذبي جو تجزيو - مسئلو بيان

مقصد اهو طئي ڪرڻ آهي ته ڇا هڪ ٽوئيٽ ۾ ڇهن آمريڪي ايئر لائنز جي حوالي سان سازگار، منفي، يا غير جانبدار جذبو آهي.

هي هڪ معياري نگراني ڪيل سکيا وارو ڪم آهي جنهن ۾ اسان کي لازمي طور تي هڪ ٽيڪسٽ اسٽرنگ کي اڳواٽ مقرر ڪيل ڀاڱن ۾ ورهائڻو پوندو.

حل

اسان هن مسئلي کي حل ڪرڻ لاءِ معياري مشين سکيا وارو عمل استعمال ڪنداسين. اسان ضروري لائبريريون ۽ ڊيٽا سيٽ درآمد ڪندي شروع ڪنداسين.

پوءِ اسين ڪجھ تحقيقي ڊيٽا جو تجزيو ڪنداسين ته اھو معلوم ڪرڻ لاءِ ته ڇا ڊيٽا ۾ ڪي نمونا آھن. ان کان پوءِ، اسان ٽيڪسٽ انپٽ عددي ڊيٽا کي تبديل ڪرڻ لاءِ ٽيڪسٽ پري پروسيسنگ شروع ڪنداسين جيڪو هڪ مشين جي سکيا سسٽم استعمال ڪري سگھن ٿا.

آخرڪار، اسان مشين جي سکيا جا طريقا استعمال ڪندي اسان جي جذبي جي تجزيي جي ماڊل کي تربيت ۽ جانچ ڪنداسين.

1. لائبريريون درآمد ڪرڻ

ضروري لائبريريون لوڊ ڪريو.

درآمد لائبريريون

2. ڊيٽا سيٽ درآمد ڪريو

هي آرٽيڪل هڪ ڊيٽا سيٽ تي ٻڌل هوندو جنهن تي ڳولي سگهجي ٿو GitHub. ڊيٽا سيٽ کي استعمال ڪندي درآمد ڪيو ويندو پانڊاس جي پڙهائي CSV فنڪشن، جيئن هيٺ ڏٺو ويو آهي:

ڊيٽا سيٽ درآمد ڪرڻ

هيڊ () فنڪشن کي استعمال ڪندي، ڊيٽا سيٽ جي پهرين پنجن قطارن کي جانچيو:

هيڊ ڊيٽا سيٽ

پيداوار:

هيڊ ڊيٽا سيٽ جو آئوٽ

3. ڊيٽا جو تجزيو

اچو ته ڊيٽا کي جانچڻ لاءِ اهو طئي ڪريون ته ڇا ڪي رجحان آهن. پر پهرين، اسان چارٽ کي وڌيڪ نمايان بڻائڻ لاءِ ڊفالٽ پلاٽ جي سائيز کي تبديل ڪنداسين.

پلاٽ جي سائيز کي ترتيب ڏيڻ

اچو ته هر ايئر لائن پاران مليل ٽوئيٽس جي تعداد سان شروع ڪريون. اسان هن لاء هڪ پائي چارٽ استعمال ڪنداسين:

پائي چارٽ

هر ايئر لائن لاءِ عوامي ٽائڪن جو سيڪڙو آئوٽ ۾ ڏيکاريل آهي.

پائي چارٽ آئوٽ

اچو ته هڪ نظر رکون ته جذبات سڀني ٽوئيٽس تي ڪيئن ورهايل آهن.

سيمينٽڪ پائي چارٽ

پيداوار:

سيمينٽڪ پائي چارٽ آئوٽ

اچو ته هاڻي هر مخصوص ايئر لائن لاء جذبي جي تقسيم کي جانچيو.

نتيجن جي مطابق، تقريبن سڀني ايئر لائنز لاء ٽوئيٽس جو وڏو حصو ناپسنديده آهن، غير جانبدار ۽ سٺي ٽائڪن جي پٺيان. ورجن آمريڪا شايد واحد ايئر لائن آهي جتي ٽن احساسن جو تناسب برابر آهي.

هر ايئر لائن جي تقسيم

پيداوار:

هر ايئر لائن جي پيداوار جي ورڇ

آخرڪار، اسان استعمال ڪنداسين Seaborn لائبريري ٽن جذبن جي قسمن مان ٽوئيٽس لاءِ سراسري اعتماد جي سطح حاصل ڪرڻ لاءِ.

بار پلاٽ

پيداوار:

بار پلاٽ آئوٽ

نتيجو ڏيکاري ٿو ته منفي ٽوئيٽس لاءِ اعتماد جي سطح مثبت يا غير جانبدار ٽوئيٽس کان وڌيڪ آهي.

4. ڊيٽا کي صاف ڪرڻ

ڪيتريون ئي ڳڻي اصطلاح ۽ اوقاف جا نشان ٽائڪن ۾ ملي سگھن ٿا. ان کان اڳ جو اسان مشين سکيا واري ماڊل کي ٽرين ڪري سگھون، اسان کي اسان جي ٽائڪن کي صاف ڪرڻ جي ضرورت آھي.

جڏهن ته، ان کان اڳ جو اسان ٽائڪن کي صاف ڪرڻ شروع ڪريون، اسان کي پنهنجي ڊيٽا سيٽ کي خصوصيت ۽ ليبل سيٽن ۾ الڳ ڪرڻ گهرجي.

خاصيتون ۽ ليبل

اسان ڊيٽا کي صاف ڪري سگھون ٿا هڪ دفعو اسان ان کي خصوصيتن ۽ تربيتي سيٽن ۾ ورهايو. هن کي ڪرڻ لاءِ باقاعده اظهار استعمال ڪيو ويندو.

باقاعدي اظهار

5. متن جي عددي نمائندگي

مشين لرننگ ماڊلز کي تربيت ڏيڻ لاءِ، شمارياتي الگورتھم رياضي کي استعمال ڪن ٿا. رياضي، ٻئي طرف، صرف انگن سان ڪم ڪري ٿو.

اسان کي ان سان ڊيل ڪرڻ لاءِ انگن اکرن کي انگن اکرن ۾ تبديل ڪرڻ گهرجي. ائين ڪرڻ جا ٽي بنيادي طريقا آهن: لفظن جو ٿلهو، TF-IDF، ۽ Word2Vec.

خوشقسمتيءَ سان، Python جي Scikit-Learn module ۾ TfidfVectorizer ڪلاس ٽيڪسٽ فيچرز کي TF-IDF فيچر ویکٹر ۾ تبديل ڪرڻ لاءِ استعمال ڪري سگھجي ٿو.

TF IDF

6. ڊيٽا تي ٻڌل ٽريننگ ۽ ٽيسٽ سيٽ ٺاهڻ

آخرڪار، اسان کي اسان جي الگورتھم کي تربيت ڏيڻ کان اڳ اسان جي ڊيٽا کي تربيت ۽ جانچ جي سيٽن ۾ ورهائڻ گھرجي.

ٽريننگ سيٽ الورورٿم کي تربيت ڏيڻ لاءِ استعمال ڪيو ويندو، ۽ ٽيسٽ سيٽ مشين لرننگ ماڊل جي ڪارڪردگي کي جانچڻ لاءِ استعمال ڪيو ويندو.

ٽرين ٽيسٽ

7. ماڊل ڊولپمينٽ

ڊيٽا کي ٽريننگ ۽ ٽيسٽ سيٽن ۾ ورهائڻ کان پوءِ، مشين لرننگ ٽيڪنڪ استعمال ٿينديون آهن ٽريننگ ڊيٽا مان سکڻ لاءِ.

توھان استعمال ڪري سگھوٿا ڪو به مشين لرننگ الگورتھم. رينڊم فاريسٽ جو طريقو، جيتوڻيڪ، استعمال ڪيو ويندو ان جي قابليت جي ڪري غير معمولي ڊيٽا کي منهن ڏيڻ جي.

ماڊل ٽريننگ

8. اڳڪٿيون ۽ ماڊل تشخيص

ماڊل کي تربيت ڏيڻ کان پوء، آخري مرحلو پيش گوئي ڪرڻ آهي. ائين ڪرڻ لاءِ، اسان کي اڳڪٿي ڪرڻ جو طريقو لاڳو ڪرڻو پوندو RandomForestClassifier طبقي جي اعتراض تي جنهن کي اسان تربيت ڏني هئي.

ماڊل جي اڳڪٿي

آخرڪار، درجه بندي جي قدمن جهڙوڪ مونجهارو ميٽرڪس، F1 قدمن، درستگي، ۽ انهي تي مشين سکيا جي ماڊل جي ڪارڪردگي جو جائزو وٺڻ لاء استعمال ڪري سگهجي ٿو.

درجه بندي ميٽرڪس

پيداوار:

درجه بندي ميٽرڪ آئوٽ

اسان جي الگورتھم 75.30 جي درستگي حاصل ڪئي، جيئن نتيجن کي ڏٺو ويو.

ٿڪل

جذبي جو تجزيو اين ايل پي جي اڪثر نوڪرين مان هڪ آهي ڇاڪاڻ ته اها هڪ خاص مسئلي تي مجموعي عوامي راءِ کي سڃاڻڻ ۾ مدد ڪري ٿي.

اسان ڏٺو ته ڪيتريون ئي پٿون لائبريريون جذباتي تجزيي سان مدد ڪري سگھن ٿيون.

اسان ڇهن يو ايس ايئر لائنز بابت عوامي ٽوئيٽس جو مطالعو ڪيو ۽ تقريبن 75٪ جي درستگي تي پهچي ويا.

مان صلاح ڏيندس ته توهان ڪوشش ڪريو هڪ ٻيو مشين لرننگ الگورٿم، جهڙوڪ لاجسٽڪ ريگريشن، SVM، يا KNN، ڏسڻ لاءِ ته ڇا توهان بهتر نتيجا حاصل ڪري سگهو ٿا.

پٿون استعمال ڪندي اين ايل پي جذبي جو تجزيو

جذباتي تجزيو ڇا آهي؟

جذبي جي تجزيي جا فائدا

جذبي جو تجزيو - مسئلو بيان