Analiżi tas-Sentiment NLP bl-użu ta 'Python

Werrej[Aħbi][Uri]

X'inhi l-analiżi tas-sentiment?
Benefiċċji ta 'Analiżi Sentiment
Analiżi tas-Sentiment - Dikjarazzjoni tal-Problema+-
konklużjoni

In-negozji se jkunu ħakmu l-akkwist tad-dejta tal-interazzjoni tal-konsumatur sal-2021.

Id-dipendenza żejda fuq dawn il-punti tad-dejta, min-naħa l-oħra, spiss twassal biex organizzazzjonijiet jittrattaw l-input tal-klijent bħala statistika – approċċ pjuttost unidimensjonali biex jisimgħu l-vuċi tal-klijent.

Il-vuċi tal-klijent ma tistax tiġi badged jew konvertita f'numru.

Għandu jinqara, ikkondensat, u, fuq kollox, jinftiehem.

Il-fatt hu li l-kumpaniji jridu jisimgħu b’mod attiv dak li għandhom xi jgħidu l-konsumaturi tagħhom fuq kull kanal li permezz tiegħu jinteraġixxu magħhom, kemm jekk permezz ta’ telefonati, emails, jew live chat.

Kull kumpanija għandha tipprijoritizza l-monitoraġġ u l-evalwazzjoni tas-sentiment tal-feedback tal-konsumatur, iżda l-kumpaniji tradizzjonalment tħabtu biex jimmaniġġjaw din id-dejta u jibdluha f'intelliġenza sinifikanti.

Dan m'għadux il-każ tal-Analiżi tas-Sentiment.

F'dan it-tutorja, aħna ser nagħtu ħarsa aktar mill-qrib lejn l-analiżi tas-sentiment, il-vantaġġi tagħha, u kif tuża l- NLTK librerija biex tagħmel analiżi tas-sentimenti fuq id-data.

X'inhi l-analiżi tas-sentiment?

L-analiżi tas-sentimenti, ħafna drabi magħrufa bħala t-tħaffir tal-konversazzjoni, hija metodu biex jiġu analizzati s-sentimenti, il-ħsibijiet u l-fehmiet tan-nies.

L-analiżi tas-sentimenti tippermetti lin-negozji jiksbu fehim aħjar tal-konsumaturi tagħhom, iżidu d-dħul, u jtejbu l-prodotti u s-servizzi tagħhom ibbażati fuq l-input tal-klijenti.

Id-differenza bejn sistema ta’ softwer li kapaċi tanalizza s-sentiment tal-klijent u rappreżentant tal-bejgħ/servizz tal-konsumatur li jipprova jiddeduċiha hija l-abbiltà kbira ta’ tal-ewwel li tikseb riżultati oġġettivi mit-test mhux ipproċessat — dan jitwettaq primarjament permezz tal-ipproċessar tal-lingwa naturali (NLP) u tagħlim magna tekniki.

Mill-identifikazzjoni tal-emozzjonijiet għall-kategorizzazzjoni tat-test, l-analiżi tas-sentimenti għandha firxa wiesgħa ta 'applikazzjonijiet. Aħna nużaw analiżi tas-sentimenti fuq data testwali biex ngħinu ditta timmonitorja s-sentiment tal-evalwazzjonijiet tal-prodott jew il-feedback tal-konsumatur.

Siti differenti tal-midja soċjali jużawha biex jevalwaw is-sentiment tal-istazzjonjiet, u jekk l-emozzjoni tkun qawwija wisq jew vjolenti, jew taqa 'taħt il-limitu tagħhom, il-post jew titħassar jew moħbi.

L-analiżi tas-sentimenti tista’ tintuża għal kollox mill-identifikazzjoni tal-emozzjonijiet sal-kategorizzazzjoni tat-test.

L-użu l-aktar popolari tal-analiżi tas-sentiment huwa fuq id-dejta testwali, fejn tintuża biex tgħin kumpanija fit-traċċar tas-sentiment tal-evalwazzjonijiet tal-prodott jew tal-kummenti tal-konsumatur.

Siti tal-midja soċjali differenti jużawha wkoll biex jevalwaw is-sentiment tal-istazzjonjiet, u jekk l-emozzjoni tkun qawwija wisq jew vjolenti, jew taqa 'taħt il-limitu tagħhom, iħassru jew jaħbu l-post.

Benefiċċji ta 'Analiżi Sentiment

Dawn li ġejjin huma wħud mill-aktar benefiċċji importanti tal-analiżi tas-sentiment li m'għandhomx jiġu injorati.

Għajnuna fil-valutazzjoni tal-perċezzjoni tal-marka tiegħek fost il-mira demografika tiegħek.
Feedback dirett tal-klijent huwa pprovdut biex jgħinek fl-iżvilupp tal-prodott tiegħek.
Iżżid id-dħul mill-bejgħ u t-tiftix.
L-opportunitajiet ta' upsell għaċ-ċampjins tal-prodott tiegħek żdiedu.
Is-servizz tal-konsumatur proattiv huwa għażla prattika.

In-numri jistgħu jagħtuk informazzjoni bħall-prestazzjoni mhux ipproċessata ta 'kampanja ta' kummerċjalizzazzjoni, l-ammont ta 'ingaġġ f'sejħa ta' prospettar, u n-numru ta 'biljetti pendenti fl-appoġġ tal-klijent.

Madankollu, mhux se jgħidlek għaliex seħħ avveniment speċifiku jew x'ikkawżaha. Għodod analitiċi bħal Google u Facebook, pereżempju, jistgħu jgħinuk tivvaluta l-prestazzjoni tal-isforzi tal-kummerċjalizzazzjoni tiegħek.

Iżda ma jagħtukx għarfien fil-fond ta’ għaliex dik il-kampanja speċifika kienet ta’ suċċess.

L-Analiżi tas-Sentiment għandha l-potenzjal li tbiddel il-logħba f'dan ir-rigward.

Analiżi tas-Sentiment - Dikjarazzjoni tal-Problema

L-għan huwa li jiġi ddeterminat jekk tweet għandux emozzjoni favorevoli, negattiva jew newtrali fir-rigward ta’ sitt linji tal-ajru Amerikani bbażati fuq tweets.

Dan huwa xogħol standard ta' tagħlim sorveljat li fih irridu nikkategorizzaw string ta' test f'kategoriji predeterminati mogħtija string ta' test.

Soluzzjoni

Aħna ser nużaw il-proċess standard tat-tagħlim tal-magni biex nindirizzaw din il-problema. Nibdew billi nimportaw il-libreriji u s-settijiet tad-dejta meħtieġa.

Imbagħad inwettqu xi analiżi esploratorja tad-dejta biex niddeterminaw jekk hemmx mudelli fid-dejta. Wara dan, aħna ser nidħlu preproċessar tat-test biex iddawwar id-data numerika tad-dħul testwali li a tagħlim magna sistema tista tuża.

Fl-aħħarnett, aħna se nħarrġu u nevalwaw il-mudelli tagħna ta 'analiżi tas-sentiment bl-użu ta' metodi ta 'tagħlim tal-magni.

1. L-importazzjoni tal-Libreriji

Tagħbija l-libreriji meħtieġa.

Libreriji li jimportaw

2. Import Dataset

Dan l-artikolu se jkun ibbażat fuq dataset li jista 'jinstab fuq GitHub. Is-sett tad-dejta se jiġi importat bl-użu tal-funzjoni tal-qari CSV ta' Pandas, kif jidher hawn taħt:

L-importazzjoni tas-Sett tad-Data

Billi tuża l-funzjoni head(), eżamina l-ewwel ħames ringieli tad-dataset:

Head Dataset

Riżultat:

Output Tas-Sett tad-Data Kap

3. Analiżi tad-Dejta

Ejja neżaminaw id-dejta biex niddeterminaw jekk hemmx xejriet. Iżda l-ewwel, aħna ser nibdlu d-daqs default tal-plott biex nagħmlu ċ-ċarts aktar viżibbli.

L-aġġustament tad-Daqs tal-Plot

Ejja nibdew bin-numru ta' tweets li rċeviet kull linja tal-ajru. Aħna ser nużaw pie chart għal dan:

Pie Chart

Il-perċentwal ta' tweets pubbliċi għal kull linja tal-ajru jintwera fl-output.

Output tal-Pie Chart

Ejja nagħtu ħarsa lejn kif is-sentimenti huma mqassma fuq it-tweets kollha.

Pie Chart Semantiku

Riżultat:

Output Semantic Pie Chart

Ejja issa neżaminaw id-distribuzzjoni tas-sentiment għal kull linja tal-ajru speċifika.

Skont ir-riżultati, il-biċċa l-kbira tat-tweets għal kważi l-linji tal-ajru kollha huma sfavorevoli, bi tweets newtrali u tajbin isegwu. Virgin America hija forsi l-unika linja tal-ajru fejn il-proporzjon tat-tliet sentimenti huwa komparabbli.

Distribuzzjoni Ta' Kull Linja tal-Ajru

Riżultat:

Distribuzzjoni Ta' Kull Output tal-Linja tal-Ajru

Fl-aħħarnett, se nużaw il-librerija Seaborn biex niksbu l-livell medju ta' kunfidenza għal tweets minn tliet kategoriji ta' sentimenti.

Bar Plot

Riżultat:

Output Plot Bar

Ir-riżultat juri li l-livell ta 'kunfidenza għal tweets negattivi huwa akbar minn għal tweets pożittivi jew newtrali.

4. Tindif tad-data

Ħafna termini slang u marki tal-punteġġjatura jistgħu jinstabu fit-tweets. Qabel ma nkunu nistgħu nħarrġu l-mudell tat-tagħlim tal-magni, għandna bżonn innaddaf it-tweets tagħna.

Madankollu, qabel ma nibdew inaddfu t-tweets, għandna nisseparaw id-dataset tagħna f'settijiet ta' karatteristiċi u tikketti.

Karatteristiċi U Tikketti

Nistgħu naddaf id-dejta ladarba nkunu sseparajna f'karatteristiċi u settijiet ta 'taħriġ. Se jintużaw espressjonijiet regolari biex jagħmlu dan.

Regolari Espressjoni

5. Rappreżentazzjoni Numerika tat-Test

Biex iħarrġu mudelli ta 'tagħlim tal-magni, algoritmi statistiċi jimpjegaw il-matematika. Il-matematika, min-naħa l-oħra, taħdem biss bin-numri.

L-ewwel irridu nittrasformaw it-test f'numri għall-algoritmi statistiċi biex jittrattawh. Hemm tliet modi bażiċi kif tagħmel dan: Bag of Words, TF-IDF, u Word2Vec.

Fortunatament, il-klassi TfidfVectorizer fil-modulu Scikit-Learn ta 'Python tista' tintuża biex tittrasforma l-karatteristiċi tat-test f'vettori tal-karatteristiċi TF-IDF.

TF IDF

6. Il-ħolqien ta' Settijiet ta' Taħriġ u Testijiet Mmexxija mid-Data

Fl-aħħarnett, irridu naqsmu d-dejta tagħna f'settijiet ta 'taħriġ u ttestjar qabel it-taħriġ tal-algoritmi tagħna.

Is-sett tat-taħriġ se jintuża biex iħarreġ l-algoritmu, u s-sett tat-test se jintuża biex jevalwa l-prestazzjoni tal-mudell tat-tagħlim tal-magni.

Test tal-Ferrovija

7. Żvilupp tal-Mudell

Wara li d-dejta tkun ġiet isseparata f'settijiet ta 'taħriġ u test, jintużaw tekniki ta' tagħlim bil-magni biex jitgħallmu mid-dejta tat-taħriġ.

Tista 'tuża kwalunkwe algoritmu ta' tagħlim bil-magni. L-approċċ Random Forest, madankollu, se jintuża minħabba l-kapaċità tiegħu li jlaħħaq ma 'dejta mhux normalizzata.

Taħriġ Mudell

8. Tbassir u Evalwazzjoni tal-Mudell

Wara li l-mudell ikun ġie mħarreġ, l-istadju finali huwa li jsir tbassir. Biex nagħmlu dan, irridu napplikaw il-metodu previd għall-oġġett tal-klassi RandomForestClassifier li aħna mħarrġa.

Tbassir Mudell

Fl-aħħarnett, miżuri ta 'klassifikazzjoni bħal metriċi ta' konfużjoni, miżuri F1, preċiżjoni, eċċ jistgħu jintużaw biex jevalwaw il-prestazzjoni ta 'mudelli ta' tagħlim bil-magni.

Metriċi tal-Klassifikazzjoni

Riżultat:

Riżultat tal-Metriċi tal-Klassifikazzjoni

L-algoritmu tagħna kiseb preċiżjoni ta '75.30, kif jidher mir-riżultati.

konklużjoni

L-analiżi tas-sentimenti hija waħda mill-impjiegi l-aktar frekwenti tal-NLP peress li tgħin biex tidentifika l-opinjoni pubblika ġenerali dwar kwistjoni speċifika.

Rajna kif diversi libreriji Python jistgħu jgħinu fl-analiżi tas-sentimenti.

Konna wettaqna studju ta’ tweets pubbliċi dwar sitt linji tal-ajru tal-Istati Uniti u lħaqna preċiżjoni ta’ bejn wieħed u ieħor 75%.

Nissuġġerixxi li tipprova algoritmu ieħor tat-tagħlim tal-magni, bħal rigressjoni loġistika, SVM, jew KNN, biex tara jekk tistax tikseb riżultati aħjar.

Analiżi tas-Sentiment NLP bl-użu ta 'Python

X'inhi l-analiżi tas-sentiment?

Benefiċċji ta 'Analiżi Sentiment