جدول المحتويات[يخفي][يعرض]
ستكون الشركات قد أتقنت اكتساب بيانات تفاعل المستهلك بحلول عام 2021.
من ناحية أخرى ، يؤدي الاعتماد المفرط على نقاط البيانات هذه في كثير من الأحيان إلى تعامل المؤسسات مع مدخلات العملاء كإحصاء - وهو نهج أحادي البعد للاستماع إلى صوت العميل.
لا يمكن وضع شارة على صوت العميل أو تحويله إلى رقم.
يجب قراءتها وتكثيفها وفهمها قبل كل شيء.
الحقيقة هي أن الشركات يجب أن تستمع بفاعلية لما يقوله عملاؤها على كل قناة يتفاعلون من خلالها معهم ، سواء كان ذلك من خلال المكالمات الهاتفية أو رسائل البريد الإلكتروني أو الدردشة الحية.
يجب على كل شركة إعطاء الأولوية لمراقبة وتقييم آراء المستهلكين ، لكن الشركات عانت تقليديًا للتعامل مع هذه البيانات وتحويلها إلى ذكاء مفيد.
لم يعد هذا هو الحال مع تحليل المشاعر.
في هذا البرنامج التعليمي ، سنلقي نظرة فاحصة على تحليل المشاعر ومزاياه وكيفية استخدام نلتك مكتبة للقيام بتحليل المشاعر على البيانات.
ما هو تحليل المشاعر؟
يُعد تحليل المشاعر ، الذي يُعرف غالبًا باسم التنقيب عن المحادثة ، طريقة لتحليل مشاعر الناس وأفكارهم ووجهات نظرهم.
يسمح تحليل المشاعر للشركات باكتساب فهم أفضل لعملائها ، وزيادة الإيرادات ، وتحسين منتجاتهم وخدماتهم بناءً على مدخلات العميل.
الفرق بين نظام برمجي قادر على تحليل معنويات العميل ومندوب مبيعات / مندوب خدمة عملاء يحاول استنتاج أن السابق هو القدرة المطلقة على استخلاص نتائج موضوعية من النص الخام - يتم تحقيق ذلك بشكل أساسي من خلال معالجة اللغة الطبيعية (NLP) و آلة التعلم التقنيات.
من تحديد المشاعر إلى تصنيف النص ، يحتوي تحليل المشاعر على مجموعة واسعة من التطبيقات. نحن نستخدم تحليل المشاعر على البيانات النصية لمساعدة الشركة على مراقبة المشاعر الخاصة بتقييمات المنتج أو ملاحظات المستهلك.
تستخدمه مواقع التواصل الاجتماعي المختلفة لتقييم شعور المنشورات ، وإذا كانت العاطفة قوية جدًا أو عنيفة ، أو كانت أقل من الحد المسموح به ، فسيتم حذف المنشور أو إخفاؤه.
يمكن استخدام تحليل المشاعر في كل شيء بدءًا من تحديد المشاعر وحتى تصنيف النص.
الاستخدام الأكثر شيوعًا لتحليل المشاعر هو البيانات النصية ، حيث يتم استخدامها لمساعدة الشركة في تتبع مشاعر تقييمات المنتج أو تعليقات المستهلكين.
تستخدمه أيضًا مواقع التواصل الاجتماعي المختلفة لتقييم شعور المنشورات ، وإذا كانت العاطفة قوية جدًا أو عنيفة ، أو كانت أقل من الحد الأدنى ، فإنها تحذف المنشور أو تخفيه.
فوائد تحليل المشاعر
فيما يلي بعض أهم فوائد تحليل المشاعر التي لا ينبغي تجاهلها.
- ساعد في تقييم تصور علامتك التجارية بين الديموغرافية المستهدفة.
- يتم توفير ملاحظات العملاء المباشرة لمساعدتك في تطوير منتجك.
- يزيد إيرادات المبيعات والتنقيب.
- زادت فرص البيع لأبطال منتجك.
- خدمة العملاء الاستباقية هي خيار عملي.
يمكن أن تزودك الأرقام بمعلومات مثل الأداء الأولي لحملة تسويقية ، ومقدار المشاركة في مكالمة بحثية ، وعدد التذاكر المعلقة في دعم العملاء.
ومع ذلك ، لن يخبرك عن سبب وقوع حدث معين أو سبب حدوثه. يمكن أن تساعدك أدوات التحليلات مثل Google و Facebook ، على سبيل المثال ، في تقييم أداء جهودك التسويقية.
لكنهم لا يزودونك بمعرفة متعمقة عن سبب نجاح هذه الحملة المحددة.
من المحتمل أن يغير تحليل المشاعر قواعد اللعبة في هذا الصدد.
تحليل المشاعر - بيان المشكلة
الهدف هو تحديد ما إذا كانت تغريدة ما لها عاطفة مواتية أو سلبية أو محايدة فيما يتعلق بست شركات طيران أمريكية بناءً على التغريدات.
هذه وظيفة تعليمية قياسية خاضعة للإشراف حيث يجب علينا تصنيف سلسلة نصية إلى فئات محددة مسبقًا بسلسلة نصية.
الحلول
سنستخدم عملية التعلم الآلي القياسية لمعالجة هذه المشكلة. سنبدأ باستيراد المكتبات ومجموعات البيانات الضرورية.
ثم سنقوم ببعض تحليل البيانات الاستكشافية لتحديد ما إذا كانت هناك أي أنماط في البيانات. بعد ذلك ، سنتولى المعالجة المسبقة للنص لتحويل البيانات الرقمية المدخلة للنص آلة التعلم يمكن للنظام استخدامها.
أخيرًا ، سنقوم بتدريب وتقييم نماذج تحليل المشاعر باستخدام أساليب التعلم الآلي.
1. استيراد المكتبات
قم بتحميل المكتبات اللازمة.
2. استيراد مجموعة البيانات
ستستند هذه المقالة إلى مجموعة بيانات يمكن العثور عليها في جيثب. سيتم استيراد مجموعة البيانات باستخدام وظيفة قراءة CSV من Pandas ، كما هو موضح أدناه:
باستخدام وظيفة head () ، افحص الصفوف الخمسة الأولى لمجموعة البيانات:
الإخراج:
3. تحليل البيانات
دعونا نفحص البيانات لتحديد ما إذا كانت هناك أية اتجاهات. لكن أولاً ، سنقوم بتغيير حجم الرسم الافتراضي لجعل الرسوم البيانية أكثر وضوحًا.
لنبدأ بعدد التغريدات التي تتلقاها كل شركة طيران. سنستخدم مخطط دائري لهذا:
يتم عرض النسبة المئوية للتغريدات العامة لكل شركة طيران في الإخراج.
دعنا نلقي نظرة على كيفية توزيع المشاعر على جميع التغريدات.
الإخراج:
دعونا الآن نفحص توزيع المشاعر لكل شركة طيران محددة.
وفقًا للنتائج ، فإن الجزء الأكبر من التغريدات لجميع شركات الطيران تقريبًا غير مواتٍ ، مع وجود تغريدات محايدة وجيدة. ربما تكون فيرجن أمريكا هي شركة الطيران الوحيدة التي يمكن مقارنة نسبة المشاعر الثلاثة فيها.
الإخراج:
أخيرًا ، سنستخدم مكتبة Seaborn للحصول على متوسط مستوى الثقة للتغريدات من ثلاث فئات للمشاعر.
الإخراج:
تظهر النتيجة أن مستوى الثقة للتغريدات السلبية أكبر من مستوى الثقة في التغريدات الإيجابية أو المحايدة.
4. تنظيف البيانات
يمكن العثور على العديد من المصطلحات العامية وعلامات الترقيم في التغريدات. قبل أن نتمكن من تدريب نموذج التعلم الآلي ، نحتاج إلى تنظيف تغريداتنا.
ومع ذلك ، قبل أن نبدأ في تنظيف التغريدات ، يجب أن نفصل مجموعة البيانات الخاصة بنا إلى مجموعات من الميزات والتسميات.
يمكننا تنظيف البيانات بمجرد فصلها إلى ميزات ومجموعات تدريب. سيتم استخدام التعبيرات العادية للقيام بذلك.
5. التمثيل الرقمي للنص
لتدريب نماذج التعلم الآلي ، تستخدم الخوارزميات الإحصائية الرياضيات. من ناحية أخرى ، تعمل الرياضيات فقط مع الأرقام.
يجب علينا أولاً تحويل النص إلى أرقام لكي تتعامل الخوارزميات الإحصائية معه. هناك ثلاث طرق أساسية للقيام بذلك: Bag of Words و TF-IDF و Word2Vec.
لحسن الحظ ، يمكن استخدام فئة TfidfVectorizer في وحدة Python Scikit-Learn لتحويل ميزات النص إلى متجهات ميزات TF-IDF.
6. تكوين مجموعات تدريب واختبار تعتمد على البيانات
أخيرًا ، يجب أن نقسم بياناتنا إلى مجموعات تدريب واختبار قبل تدريب خوارزمياتنا.
سيتم استخدام مجموعة التدريب لتدريب الخوارزمية ، وسيتم استخدام مجموعة الاختبار لتقييم أداء نموذج التعلم الآلي.
7. تطوير النموذج
بعد فصل البيانات إلى مجموعات تدريب واختبار ، يتم استخدام تقنيات التعلم الآلي للتعلم من بيانات التدريب.
يمكنك استخدام أي خوارزمية تعلم الآلة. ومع ذلك ، سيتم استخدام نهج Random Forest نظرًا لقدرته على التعامل مع البيانات غير الطبيعية.
8. التنبؤات وتقييم النموذج
بعد تدريب النموذج ، تكون المرحلة الأخيرة هي عمل تنبؤات. للقيام بذلك ، يجب علينا تطبيق طريقة التنبؤ على كائن فئة RandomForestClassifier الذي قمنا بتدريبه.
أخيرًا ، يمكن استخدام مقاييس التصنيف مثل مقاييس الارتباك ومقاييس F1 والدقة وما إلى ذلك لتقييم أداء نماذج التعلم الآلي.
الإخراج:
حققت الخوارزمية الخاصة بنا دقة قدرها 75.30 ، كما يتضح من النتائج.
وفي الختام
يعد تحليل المشاعر أحد أكثر وظائف البرمجة اللغوية العصبية شيوعًا لأنه يساعد في تحديد الرأي العام العام حول قضية معينة.
لقد رأينا كيف يمكن للعديد من مكتبات Python المساعدة في تحليل المشاعر.
أجرينا دراسة للتغريدات العامة حول ست شركات طيران أمريكية ووصلنا إلى دقة تصل إلى 75٪ تقريبًا.
أود أن أقترح عليك تجربة خوارزمية أخرى للتعلم الآلي ، مثل الانحدار اللوجستي أو SVM أو KNN ، لمعرفة ما إذا كان بإمكانك تحقيق نتائج أفضل.
اترك تعليق