Python - HashDork کا استعمال کرتے ہوئے NLP جذباتی تجزیہ

کی میز کے مندرجات[چھپائیں][دکھائیں]

جذبات کا تجزیہ کیا ہے؟
جذباتی تجزیہ کے فوائد
جذبات کا تجزیہ - مسئلہ کا بیان+-
نتیجہ

کاروبار 2021 تک صارفین کی بات چیت کے ڈیٹا کے حصول میں مہارت حاصل کر لیں گے۔

ان ڈیٹا پوائنٹس پر زیادہ انحصار، دوسری طرف، اکثر تنظیموں کی طرف لے جاتا ہے جو گاہک کے ان پٹ کو اعدادوشمار کے طور پر پیش کرتی ہے – گاہک کی آواز سننے کے لیے ایک جہتی نقطہ نظر۔

گاہک کی آواز کو بیج نہیں لگایا جا سکتا اور نہ ہی اسے نمبر میں تبدیل کیا جا سکتا ہے۔

اسے پڑھنا، گاڑھا، اور سب سے بڑھ کر سمجھنا چاہیے۔

حقیقت یہ ہے کہ کمپنیوں کو فعال طور پر سننا چاہیے کہ ان کے صارفین ہر اس چینل پر کیا کہتے ہیں جس کے ذریعے وہ ان کے ساتھ بات چیت کرتے ہیں، چاہے وہ فون کالز، ای میلز، یا لائیو چیٹ کے ذریعے ہو۔

ہر کمپنی کو صارفین کے تاثرات کے جذبات کی نگرانی اور جائزہ لینے کو ترجیح دینی چاہیے، لیکن کمپنیوں نے روایتی طور پر اس ڈیٹا کو سنبھالنے اور اسے بامعنی ذہانت میں تبدیل کرنے کے لیے جدوجہد کی ہے۔

یہ اب Sentiment Analysis کا معاملہ نہیں رہا۔

اس ٹیوٹوریل میں، ہم جذبات کے تجزیے، اس کے فوائد، اور اس کے استعمال کے طریقے پر گہری نظر ڈالیں گے۔ این ایل ٹی کے ڈیٹا پر جذباتی تجزیہ کرنے کے لیے لائبریری۔

جذبات کا تجزیہ کیا ہے؟

جذباتی تجزیہ، جسے اکثر گفتگو کی کان کنی کے نام سے جانا جاتا ہے، لوگوں کے احساسات، خیالات اور خیالات کا تجزیہ کرنے کا ایک طریقہ ہے۔

جذباتی تجزیہ کاروباروں کو اپنے صارفین کے بارے میں بہتر تفہیم حاصل کرنے، آمدنی بڑھانے اور کلائنٹ کے ان پٹ کی بنیاد پر اپنی مصنوعات اور خدمات کو بڑھانے کی اجازت دیتا ہے۔

صارف کے جذبات کا تجزیہ کرنے کے قابل سافٹ ویئر سسٹم اور سیلز پرسن/کسٹمر سروس کے نمائندے کے درمیان فرق جو اسے اخذ کرنے کی کوشش کر رہا ہے وہ خام متن سے معروضی نتائج اخذ کرنے کی سابقہ صلاحیت ہے۔ مشین لرننگ کی تراکیب.

جذبات کی شناخت سے لے کر متن کی درجہ بندی تک، جذبات کے تجزیے میں ایپلی کیشنز کی ایک وسیع رینج ہے۔ ہم متنی ڈیٹا پر جذباتی تجزیہ کا استعمال کرتے ہیں تاکہ ایک فرم کی مصنوعات کی تشخیص یا صارفین کے تاثرات کے جذبات کی نگرانی کی جا سکے۔

مختلف سوشل میڈیا سائٹس پوسٹنگ کے جذبات کا اندازہ لگانے کے لیے اس کا استعمال کرتی ہیں، اور اگر جذبات بہت شدید یا پرتشدد ہیں، یا ان کی حد سے نیچے آتے ہیں، تو پوسٹ کو یا تو حذف یا چھپا دیا جاتا ہے۔

جذباتی تجزیہ جذبات کی شناخت سے لے کر متن کی درجہ بندی تک ہر چیز کے لیے استعمال کیا جا سکتا ہے۔

جذباتی تجزیہ کا سب سے زیادہ مقبول استعمال متنی اعداد و شمار پر ہے، جہاں اس کا استعمال مصنوعات کی تشخیص یا صارفین کے تبصروں کے جذبات کو ٹریک کرنے میں کمپنی کی مدد کرنے کے لیے کیا جاتا ہے۔

مختلف سوشل میڈیا سائٹس بھی پوسٹنگ کے جذبات کا اندازہ لگانے کے لیے اس کا استعمال کرتی ہیں، اور اگر جذبات بہت شدید یا پرتشدد ہیں، یا ان کی حد سے نیچے آتے ہیں، تو وہ پوسٹ کو حذف یا چھپا دیتے ہیں۔

جذباتی تجزیہ کے فوائد

جذباتی تجزیہ کے چند اہم ترین فوائد درج ذیل ہیں جن کو نظرانداز نہیں کیا جانا چاہیے۔

اپنے ہدف کی آبادی کے درمیان اپنے برانڈ کے تاثرات کا اندازہ لگانے میں مدد کریں۔
آپ کی مصنوعات کو تیار کرنے میں آپ کی مدد کے لیے براہ راست کلائنٹ کی رائے فراہم کی جاتی ہے۔
فروخت کی آمدنی اور امکانات کو بڑھاتا ہے۔
آپ کے پروڈکٹ کے چیمپئنز کے لیے فروخت کے مواقع بڑھ گئے ہیں۔
فعال کسٹمر سروس ایک عملی آپشن ہے۔

نمبرز آپ کو معلومات فراہم کر سکتے ہیں جیسے مارکیٹنگ مہم کی خام کارکردگی، متوقع کال میں مصروفیت کی مقدار، اور کسٹمر سپورٹ میں زیر التواء ٹکٹوں کی تعداد۔

تاہم، یہ آپ کو نہیں بتائے گا کہ کوئی خاص واقعہ کیوں پیش آیا یا اس کی وجہ کیا ہے۔ Google اور Facebook جیسے تجزیاتی ٹولز، مثال کے طور پر، آپ کی مارکیٹنگ کی کوششوں کی کارکردگی کا اندازہ لگانے میں آپ کی مدد کر سکتے ہیں۔

لیکن وہ آپ کو اس بارے میں گہرائی سے معلومات فراہم نہیں کرتے کہ وہ مخصوص مہم کیوں کامیاب ہوئی۔

جذباتی تجزیہ اس سلسلے میں گیم بدلنے کی صلاحیت رکھتا ہے۔

جذبات کا تجزیہ - مسئلہ کا بیان

مقصد اس بات کا تعین کرنا ہے کہ آیا ٹویٹس کی بنیاد پر چھ امریکی ایئر لائنز کے بارے میں ایک ٹویٹ سازگار، منفی یا غیر جانبدارانہ جذبات رکھتا ہے۔

یہ ایک معیاری زیر نگرانی سیکھنے کا کام ہے جس میں ہمیں ٹیکسٹ سٹرنگ کو پہلے سے طے شدہ زمروں میں متنی سٹرنگ کی درجہ بندی کرنی چاہیے۔

حل

ہم اس مسئلے کو حل کرنے کے لیے معیاری مشین لرننگ کا طریقہ استعمال کریں گے۔ ہم ضروری لائبریریوں اور ڈیٹا سیٹس کو درآمد کرکے شروع کریں گے۔

اس کے بعد ہم اس بات کا تعین کرنے کے لیے کچھ تحقیقی ڈیٹا کا تجزیہ کریں گے کہ آیا ڈیٹا میں کوئی نمونہ موجود ہے۔ اس کے بعد، ہم ٹیکسٹ ان پٹ عددی ڈیٹا کو تبدیل کرنے کے لیے ٹیکسٹ پری پروسیسنگ کریں گے جو کہ مشین لرننگ نظام استعمال کر سکتے ہیں۔

آخر میں، ہم مشین لرننگ کے طریقوں کا استعمال کرتے ہوئے اپنے جذباتی تجزیہ کے ماڈلز کی تربیت اور جانچ کریں گے۔

1. لائبریریاں درآمد کرنا

ضروری لائبریریوں کو لوڈ کریں۔

لائبریریاں درآمد کرنا

2. ڈیٹا سیٹ درآمد کریں۔

یہ مضمون ایک ڈیٹاسیٹ پر مبنی ہو گا جس پر پایا جا سکتا ہے۔ Github کے. ڈیٹاسیٹ کو پانڈوں کے پڑھنے والے CSV فنکشن کا استعمال کرتے ہوئے درآمد کیا جائے گا، جیسا کہ ذیل میں دیکھا گیا ہے:

ڈیٹا سیٹ درآمد کرنا

head() فنکشن کا استعمال کرتے ہوئے، ڈیٹاسیٹ کی پہلی پانچ قطاروں کا جائزہ لیں:

ہیڈ ڈیٹاسیٹ

: پیداوار

ہیڈ ڈیٹاسیٹ کا آؤٹ پٹ

3. ڈیٹا کا تجزیہ

آئیے اس بات کا تعین کرنے کے لیے ڈیٹا کا جائزہ لیں کہ آیا کوئی رجحانات موجود ہیں۔ لیکن پہلے، ہم چارٹس کو مزید مرئی بنانے کے لیے پہلے سے طے شدہ پلاٹ کا سائز تبدیل کریں گے۔

پلاٹ کے سائز کو ایڈجسٹ کرنا

آئیے ہم ہر ایئرلائن کو موصول ہونے والی ٹویٹس کی تعداد سے شروع کرتے ہیں۔ ہم اس کے لیے ایک پائی چارٹ استعمال کریں گے:

پائی چارٹ

ہر ایئر لائن کے لیے عوامی ٹویٹس کا فیصد آؤٹ پٹ میں ظاہر ہوتا ہے۔

پائی چارٹ آؤٹ پٹ

آئیے ایک نظر ڈالتے ہیں کہ تمام ٹویٹس پر جذبات کیسے تقسیم ہوتے ہیں۔

سیمنٹک پائی چارٹ

: پیداوار

سیمنٹک پائی چارٹ آؤٹ پٹ

آئیے اب ہر مخصوص ایئر لائن کے لیے جذبات کی تقسیم کا جائزہ لیتے ہیں۔

نتائج کے مطابق، تقریباً تمام ایئرلائنز کے لیے زیادہ تر ٹویٹس ناموافق ہیں، جن میں غیر جانبدار اور اچھی ٹویٹس کی پیروی کی جاتی ہے۔ ورجن امریکہ شاید واحد ایئر لائن ہے جہاں تینوں احساسات کا تناسب موازنہ ہے۔

ہر ایئر لائن کی تقسیم

: پیداوار

ہر ایئر لائن آؤٹ پٹ کی تقسیم

آخر میں، ہم تین جذباتی زمروں سے ٹویٹس کے لیے اوسط اعتماد کی سطح حاصل کرنے کے لیے Seaborn لائبریری کا استعمال کریں گے۔

بار پلاٹ

: پیداوار

بار پلاٹ آؤٹ پٹ

نتیجہ ظاہر کرتا ہے کہ منفی ٹویٹس کے لیے اعتماد کی سطح مثبت یا غیر جانبدار ٹویٹس سے زیادہ ہے۔

4. ڈیٹا کو صاف کرنا

بہت سی بول چال کی اصطلاحات اور اوقاف کے نشانات ٹویٹس میں مل سکتے ہیں۔ اس سے پہلے کہ ہم مشین لرننگ ماڈل کو تربیت دے سکیں، ہمیں اپنے ٹویٹس کو صاف کرنے کی ضرورت ہے۔

تاہم، اس سے پہلے کہ ہم ٹویٹس کو صاف کرنا شروع کریں، ہمیں اپنے ڈیٹا سیٹ کو فیچر اور لیبل سیٹ میں الگ کرنا چاہیے۔

خصوصیات اور لیبلز

ہم ڈیٹا کو ایک بار صاف کر سکتے ہیں جب ہم اسے خصوصیات اور تربیتی سیٹوں میں الگ کر دیں گے۔ ایسا کرنے کے لیے ریگولر ایکسپریشنز استعمال کیے جائیں گے۔

باقاعدہ اظہار

5. متن کی عددی نمائندگی

مشین لرننگ ماڈلز کو تربیت دینے کے لیے، شماریاتی الگورتھم ریاضی کو ملازمت دیتے ہیں۔ دوسری طرف ریاضی صرف اعداد کے ساتھ کام کرتی ہے۔

ہمیں اس سے نمٹنے کے لیے شماریاتی الگورتھم کے لیے پہلے متن کو نمبروں میں تبدیل کرنا چاہیے۔ ایسا کرنے کے تین بنیادی طریقے ہیں: Bag of Words، TF-IDF، اور Word2Vec۔

خوش قسمتی سے، Python کے Scikit-Learn ماڈیول میں TfidfVectorizer کلاس کو ٹیکسٹ فیچرز کو TF-IDF فیچر ویکٹر میں تبدیل کرنے کے لیے استعمال کیا جا سکتا ہے۔

TF IDF

6. ڈیٹا سے چلنے والی ٹریننگ اور ٹیسٹ سیٹ بنانا

آخر میں، ہمیں اپنے الگورتھم کو تربیت دینے سے پہلے اپنے ڈیٹا کو ٹریننگ اور ٹیسٹنگ سیٹ میں تقسیم کرنا چاہیے۔

تربیتی سیٹ الگورتھم کو تربیت دینے کے لیے استعمال کیا جائے گا، اور ٹیسٹ سیٹ کا استعمال مشین لرننگ ماڈل کی کارکردگی کا جائزہ لینے کے لیے کیا جائے گا۔

ٹرین ٹیسٹ

7. ماڈل ڈویلپمنٹ

ڈیٹا کو ٹریننگ اور ٹیسٹ سیٹ میں الگ کرنے کے بعد، ٹریننگ ڈیٹا سے سیکھنے کے لیے مشین لرننگ تکنیک کا استعمال کیا جاتا ہے۔

آپ کوئی بھی مشین لرننگ الگورتھم استعمال کر سکتے ہیں۔ رینڈم فارسٹ اپروچ، تاہم، اس کی غیر معمولی ڈیٹا سے نمٹنے کی صلاحیت کی وجہ سے استعمال کیا جائے گا۔

ماڈل ٹریننگ

8. پیشین گوئیاں اور ماڈل کی تشخیص

ماڈل کی تربیت کے بعد، آخری مرحلہ پیشین گوئیاں کرنا ہے۔ ایسا کرنے کے لیے، ہمیں RandomForestClassifier کلاس آبجیکٹ پر پیشین گوئی کا طریقہ لاگو کرنا چاہیے جسے ہم نے تربیت دی ہے۔

ماڈل کی پیشن گوئی

آخر میں، درجہ بندی کے اقدامات جیسے کنفیوژن میٹرکس، F1 اقدامات، درستگی، وغیرہ کا استعمال مشین لرننگ ماڈلز کی کارکردگی کا جائزہ لینے کے لیے کیا جا سکتا ہے۔

درجہ بندی میٹرکس

: پیداوار

درجہ بندی میٹرکس آؤٹ پٹ

ہمارے الگورتھم نے 75.30 کی درستگی حاصل کی، جیسا کہ نتائج سے دیکھا گیا ہے۔

نتیجہ

جذباتی تجزیہ NLP کے سب سے زیادہ کاموں میں سے ایک ہے کیونکہ یہ کسی خاص مسئلے پر مجموعی رائے عامہ کی شناخت میں مدد کرتا ہے۔

ہم نے دیکھا کہ Python کی متعدد لائبریریاں جذبات کے تجزیہ میں کس طرح مدد کر سکتی ہیں۔

ہم نے چھ امریکی ایئر لائنز کے بارے میں عوامی ٹویٹس کا مطالعہ کیا اور تقریباً 75% کی درستگی تک پہنچ گئے۔

میرا مشورہ ہے کہ آپ کوئی اور مشین لرننگ الگورتھم آزمائیں، جیسے لاجسٹک ریگریشن، SVM، یا KNN، یہ دیکھنے کے لیے کہ آیا آپ بہتر نتائج حاصل کر سکتے ہیں۔

Python کا استعمال کرتے ہوئے NLP جذباتی تجزیہ

جذبات کا تجزیہ کیا ہے؟

جذباتی تجزیہ کے فوائد

جذبات کا تجزیہ - مسئلہ کا بیان