In-negozji se jkunu ħakmu l-akkwist tad-dejta tal-interazzjoni tal-konsumatur sal-2021.
Id-dipendenza żejda fuq dawn il-punti tad-dejta, min-naħa l-oħra, spiss twassal biex organizzazzjonijiet jittrattaw l-input tal-klijent bħala statistika – approċċ pjuttost unidimensjonali biex jisimgħu l-vuċi tal-klijent.
Il-vuċi tal-klijent ma tistax tiġi badged jew konvertita f'numru.
Għandu jinqara, ikkondensat, u, fuq kollox, jinftiehem.
Il-fatt hu li l-kumpaniji jridu jisimgħu b’mod attiv dak li għandhom xi jgħidu l-konsumaturi tagħhom fuq kull kanal li permezz tiegħu jinteraġixxu magħhom, kemm jekk permezz ta’ telefonati, emails, jew live chat.
Kull kumpanija għandha tipprijoritizza l-monitoraġġ u l-evalwazzjoni tas-sentiment tal-feedback tal-konsumatur, iżda l-kumpaniji tradizzjonalment tħabtu biex jimmaniġġjaw din id-dejta u jibdluha f'intelliġenza sinifikanti.
Dan m'għadux il-każ tal-Analiżi tas-Sentiment.
F'dan it-tutorja, aħna ser nagħtu ħarsa aktar mill-qrib lejn l-analiżi tas-sentiment, il-vantaġġi tagħha, u kif tuża l- NLTK librerija biex tagħmel analiżi tas-sentimenti fuq id-data.
X'inhi l-analiżi tas-sentiment?
L-analiżi tas-sentimenti, ħafna drabi magħrufa bħala t-tħaffir tal-konversazzjoni, hija metodu biex jiġu analizzati s-sentimenti, il-ħsibijiet u l-fehmiet tan-nies.
L-analiżi tas-sentimenti tippermetti lin-negozji jiksbu fehim aħjar tal-konsumaturi tagħhom, iżidu d-dħul, u jtejbu l-prodotti u s-servizzi tagħhom ibbażati fuq l-input tal-klijenti.
Id-differenza bejn sistema ta’ softwer li kapaċi tanalizza s-sentiment tal-klijent u rappreżentant tal-bejgħ/servizz tal-konsumatur li jipprova jiddeduċiha hija l-abbiltà kbira ta’ tal-ewwel li tikseb riżultati oġġettivi mit-test mhux ipproċessat — dan jitwettaq primarjament permezz tal-ipproċessar tal-lingwa naturali (NLP) u tagħlim magna tekniki.
Mill-identifikazzjoni tal-emozzjonijiet għall-kategorizzazzjoni tat-test, l-analiżi tas-sentimenti għandha firxa wiesgħa ta 'applikazzjonijiet. Aħna nużaw analiżi tas-sentimenti fuq data testwali biex ngħinu ditta timmonitorja s-sentiment tal-evalwazzjonijiet tal-prodott jew il-feedback tal-konsumatur.
Siti differenti tal-midja soċjali jużawha biex jevalwaw is-sentiment tal-istazzjonjiet, u jekk l-emozzjoni tkun qawwija wisq jew vjolenti, jew taqa 'taħt il-limitu tagħhom, il-post jew titħassar jew moħbi.
L-analiżi tas-sentimenti tista’ tintuża għal kollox mill-identifikazzjoni tal-emozzjonijiet sal-kategorizzazzjoni tat-test.
L-użu l-aktar popolari tal-analiżi tas-sentiment huwa fuq id-dejta testwali, fejn tintuża biex tgħin kumpanija fit-traċċar tas-sentiment tal-evalwazzjonijiet tal-prodott jew tal-kummenti tal-konsumatur.
Siti tal-midja soċjali differenti jużawha wkoll biex jevalwaw is-sentiment tal-istazzjonjiet, u jekk l-emozzjoni tkun qawwija wisq jew vjolenti, jew taqa 'taħt il-limitu tagħhom, iħassru jew jaħbu l-post.
Benefiċċji ta 'Analiżi Sentiment
Dawn li ġejjin huma wħud mill-aktar benefiċċji importanti tal-analiżi tas-sentiment li m'għandhomx jiġu injorati.
- Għajnuna fil-valutazzjoni tal-perċezzjoni tal-marka tiegħek fost il-mira demografika tiegħek.
- Feedback dirett tal-klijent huwa pprovdut biex jgħinek fl-iżvilupp tal-prodott tiegħek.
- Iżżid id-dħul mill-bejgħ u t-tiftix.
- L-opportunitajiet ta' upsell għaċ-ċampjins tal-prodott tiegħek żdiedu.
- Is-servizz tal-konsumatur proattiv huwa għażla prattika.
In-numri jistgħu jagħtuk informazzjoni bħall-prestazzjoni mhux ipproċessata ta 'kampanja ta' kummerċjalizzazzjoni, l-ammont ta 'ingaġġ f'sejħa ta' prospettar, u n-numru ta 'biljetti pendenti fl-appoġġ tal-klijent.
Madankollu, mhux se jgħidlek għaliex seħħ avveniment speċifiku jew x'ikkawżaha. Għodod analitiċi bħal Google u Facebook, pereżempju, jistgħu jgħinuk tivvaluta l-prestazzjoni tal-isforzi tal-kummerċjalizzazzjoni tiegħek.
Iżda ma jagħtukx għarfien fil-fond ta’ għaliex dik il-kampanja speċifika kienet ta’ suċċess.
L-Analiżi tas-Sentiment għandha l-potenzjal li tbiddel il-logħba f'dan ir-rigward.
Analiżi tas-Sentiment - Dikjarazzjoni tal-Problema
L-għan huwa li jiġi ddeterminat jekk tweet għandux emozzjoni favorevoli, negattiva jew newtrali fir-rigward ta’ sitt linji tal-ajru Amerikani bbażati fuq tweets.
Dan huwa xogħol standard ta' tagħlim sorveljat li fih irridu nikkategorizzaw string ta' test f'kategoriji predeterminati mogħtija string ta' test.
Soluzzjoni
Aħna ser nużaw il-proċess standard tat-tagħlim tal-magni biex nindirizzaw din il-problema. Nibdew billi nimportaw il-libreriji u s-settijiet tad-dejta meħtieġa.
Imbagħad inwettqu xi analiżi esploratorja tad-dejta biex niddeterminaw jekk hemmx mudelli fid-dejta. Wara dan, aħna ser nidħlu preproċessar tat-test biex iddawwar id-data numerika tad-dħul testwali li a tagħlim magna sistema tista tuża.
Fl-aħħarnett, aħna se nħarrġu u nevalwaw il-mudelli tagħna ta 'analiżi tas-sentiment bl-użu ta' metodi ta 'tagħlim tal-magni.
1. L-importazzjoni tal-Libreriji
Tagħbija l-libreriji meħtieġa.
2. Import Dataset
Dan l-artikolu se jkun ibbażat fuq dataset li jista 'jinstab fuq GitHub. Is-sett tad-dejta se jiġi importat bl-użu tal-funzjoni tal-qari CSV ta' Pandas, kif jidher hawn taħt:
Billi tuża l-funzjoni head(), eżamina l-ewwel ħames ringieli tad-dataset:
Riżultat:
3. Analiżi tad-Dejta
Ejja neżaminaw id-dejta biex niddeterminaw jekk hemmx xejriet. Iżda l-ewwel, aħna ser nibdlu d-daqs default tal-plott biex nagħmlu ċ-ċarts aktar viżibbli.
Ejja nibdew bin-numru ta' tweets li rċeviet kull linja tal-ajru. Aħna ser nużaw pie chart għal dan:
Il-perċentwal ta' tweets pubbliċi għal kull linja tal-ajru jintwera fl-output.
Ejja nagħtu ħarsa lejn kif is-sentimenti huma mqassma fuq it-tweets kollha.
Riżultat:
Ejja issa neżaminaw id-distribuzzjoni tas-sentiment għal kull linja tal-ajru speċifika.
Skont ir-riżultati, il-biċċa l-kbira tat-tweets għal kważi l-linji tal-ajru kollha huma sfavorevoli, bi tweets newtrali u tajbin isegwu. Virgin America hija forsi l-unika linja tal-ajru fejn il-proporzjon tat-tliet sentimenti huwa komparabbli.
Riżultat:
Fl-aħħarnett, se nużaw il-librerija Seaborn biex niksbu l-livell medju ta' kunfidenza għal tweets minn tliet kategoriji ta' sentimenti.
Riżultat:
Ir-riżultat juri li l-livell ta 'kunfidenza għal tweets negattivi huwa akbar minn għal tweets pożittivi jew newtrali.
4. Tindif tad-data
Ħafna termini slang u marki tal-punteġġjatura jistgħu jinstabu fit-tweets. Qabel ma nkunu nistgħu nħarrġu l-mudell tat-tagħlim tal-magni, għandna bżonn innaddaf it-tweets tagħna.
Madankollu, qabel ma nibdew inaddfu t-tweets, għandna nisseparaw id-dataset tagħna f'settijiet ta' karatteristiċi u tikketti.
Nistgħu naddaf id-dejta ladarba nkunu sseparajna f'karatteristiċi u settijiet ta 'taħriġ. Se jintużaw espressjonijiet regolari biex jagħmlu dan.
5. Rappreżentazzjoni Numerika tat-Test
Biex iħarrġu mudelli ta 'tagħlim tal-magni, algoritmi statistiċi jimpjegaw il-matematika. Il-matematika, min-naħa l-oħra, taħdem biss bin-numri.
L-ewwel irridu nittrasformaw it-test f'numri għall-algoritmi statistiċi biex jittrattawh. Hemm tliet modi bażiċi kif tagħmel dan: Bag of Words, TF-IDF, u Word2Vec.
Fortunatament, il-klassi TfidfVectorizer fil-modulu Scikit-Learn ta 'Python tista' tintuża biex tittrasforma l-karatteristiċi tat-test f'vettori tal-karatteristiċi TF-IDF.
6. Il-ħolqien ta' Settijiet ta' Taħriġ u Testijiet Mmexxija mid-Data
Fl-aħħarnett, irridu naqsmu d-dejta tagħna f'settijiet ta 'taħriġ u ttestjar qabel it-taħriġ tal-algoritmi tagħna.
Is-sett tat-taħriġ se jintuża biex iħarreġ l-algoritmu, u s-sett tat-test se jintuża biex jevalwa l-prestazzjoni tal-mudell tat-tagħlim tal-magni.
7. Żvilupp tal-Mudell
Wara li d-dejta tkun ġiet isseparata f'settijiet ta 'taħriġ u test, jintużaw tekniki ta' tagħlim bil-magni biex jitgħallmu mid-dejta tat-taħriġ.
Tista 'tuża kwalunkwe algoritmu ta' tagħlim bil-magni. L-approċċ Random Forest, madankollu, se jintuża minħabba l-kapaċità tiegħu li jlaħħaq ma 'dejta mhux normalizzata.
8. Tbassir u Evalwazzjoni tal-Mudell
Wara li l-mudell ikun ġie mħarreġ, l-istadju finali huwa li jsir tbassir. Biex nagħmlu dan, irridu napplikaw il-metodu previd għall-oġġett tal-klassi RandomForestClassifier li aħna mħarrġa.
Fl-aħħarnett, miżuri ta 'klassifikazzjoni bħal metriċi ta' konfużjoni, miżuri F1, preċiżjoni, eċċ jistgħu jintużaw biex jevalwaw il-prestazzjoni ta 'mudelli ta' tagħlim bil-magni.
Riżultat:
L-algoritmu tagħna kiseb preċiżjoni ta '75.30, kif jidher mir-riżultati.
konklużjoni
L-analiżi tas-sentimenti hija waħda mill-impjiegi l-aktar frekwenti tal-NLP peress li tgħin biex tidentifika l-opinjoni pubblika ġenerali dwar kwistjoni speċifika.
Rajna kif diversi libreriji Python jistgħu jgħinu fl-analiżi tas-sentimenti.
Konna wettaqna studju ta’ tweets pubbliċi dwar sitt linji tal-ajru tal-Istati Uniti u lħaqna preċiżjoni ta’ bejn wieħed u ieħor 75%.
Nissuġġerixxi li tipprova algoritmu ieħor tat-tagħlim tal-magni, bħal rigressjoni loġistika, SVM, jew KNN, biex tara jekk tistax tikseb riżultati aħjar.
Ħalli Irrispondi