Analisi di sentimenti NLP cù Python

Table di cuntinutu[Piattà][Mostra]

Chì ghjè l'analisi di sentimentu?
Beneficii di l'analisi di sentimenti
Analisi di sentimenti - Dichjarazione di u prublema+-
cunchiusioni

L'imprese averanu maestratu l'acquistu di dati di interazzione di i cunsumatori da u 2021.

A fiducia eccessiva di questi punti di dati, invece, porta spessu à l'urganisazioni chì trattanu l'input di u cliente cum'è una statistica - un approcciu piuttostu unidimensionale per sente a voce di u cliente.

A voce di u cliente ùn pò micca esse badge o cunvertita in un numeru.

Deve esse lettu, cundensatu è, sopratuttu, capitu.

U fattu hè chì e cumpagnie anu da sente attivamente ciò chì i so cunsumatori anu da dì nantu à ogni canali per quale interagiscenu cun elli, sia per via di telefonate, email, o chat in diretta.

Ogni cumpagnia duveria prioritizà u monitoraghju è a valutazione di u sentimentu di feedback di i cunsumatori, ma l'imprese anu tradizionalmente luttatu per trattà queste dati è trasfurmà in una intelligenza significativa.

Questu ùn hè più u casu cù l'analisi di sentimenti.

In questu tutoriale, daremu un sguardu più attentu à l'analisi di sentimenti, i so vantaghji, è cumu utilizà NLTK biblioteca per fà analisi di sentimentu nantu à i dati.

Chì ghjè l'analisi di sentimentu?

L'analisi di sentimenti, spessu cunnisciuta cum'è minera di cunversazione, hè un metudu per analizà i sentimenti, i pinsamenti è i punti di vista di e persone.

L'analisi di sentimentu permette à l'imprese di capisce megliu i so cunsumatori, aumentà i rivenuti è rinfurzà i so prudutti è servizii basati nantu à l'input di i clienti.

A diffarenza trà un sistema di software capace di analizà u sentimentu di u cliente è un venditore / rappresentante di u serviziu di u cliente chì prova à deduce hè a capacità pura di u primu di derivà risultati obiettivu da u testu crudu - questu hè principalmente realizatu per u processu di lingua naturale (NLP) è machine learning tecniche.

Da l'identificazione di l'emozioni à a categurizazione di testu, l'analisi di sentimentu hà una larga gamma di applicazioni. Impieghemu l'analisi di sentimentu nantu à e dati testuali per aiutà una firmata à monitorà u sentimentu di e valutazioni di u produttu o feedback di i cunsumatori.

Diversi siti di e social media l'utilizanu per valutà u sentimentu di i posti, è se l'emozione hè troppu forte o viulente, o cade sottu à u so limitu, u postu hè o sguassatu o oculatu.

L'analisi di sentimentu pò esse usata per tuttu, da l'identificazione di l'emozioni à a categurizazione di testu.

L'usu più populari di l'analisi di u sentimentu hè nantu à e dati testuali, induve hè utilizatu per aiutà una cumpagnia in u seguimentu di u sentimentu di e valutazioni di u produttu o cumenti di i cunsumatori.

Diversi siti di e social media l'utilizanu ancu per valutà u sentimentu di i posti, è se l'emozione hè troppu forte o viulente, o cade sottu à u so limitu, sguassate o oculta u postu.

Beneficii di l'analisi di sentimenti

Eccu alcuni di i benefici più impurtanti di l'analisi di sentimentu chì ùn deve esse micca disregarded.

Aiutu à valutà a percepzione di a vostra marca trà u vostru target demograficu.
I feedback diretti di i clienti sò furniti per aiutà à sviluppà u vostru pruduttu.
Aumenta i rivenuti di vendita è a pruspezione.
L'opportunità di upsell per i campioni di u vostru pruduttu sò aumentate.
U serviziu di u cliente proattivu hè una opzione pratica.

I numeri ponu furnisce infurmazioni cum'è u rendiment crudu di una campagna di marketing, a quantità di impegnu in una chjama di prospezione, è u numeru di biglietti pendenti in u supportu di i clienti.

Tuttavia, ùn vi dicerà micca perchè un avvenimentu specificu hè accadutu o ciò chì hà causatu. Strumenti analytics cum'è Google è Facebook, per esempiu, ponu aiutà à valutà u rendiment di i vostri sforzi di marketing.

Ma ùn vi furnisce micca una cunniscenza approfondita di perchè quella campagna specifica hà successu.

Sentiment Analysis hà u putenziale di cambià u ghjocu in questu sensu.

Analisi di sentimenti - Dichjarazione di u prublema

L'obiettivu hè di determinà se un tweet hà emozioni favurevuli, negativi o neutrali in quantu à sei compagnie aeree americane basate nantu à i tweets.

Questu hè un travagliu standard di apprendimentu supervisatu in quale duvemu categurizà una stringa di testu in categurie predeterminate datu una stringa di testu.

Vergogna à tè

Adupremu u prucessu standard di l'apprendimentu di macchina per affruntà stu prublema. Cumincià da impurtà e biblioteche necessarie è datasets.

Allora eseguiremu qualchì analisi di dati esploratori per determinà s'ellu ci sò mudelli in i dati. Dopu à quessa, avemu Mulateri Di L'imprendi preprocessing testu à turnà testu input numèrica dati chì a machine learning sistema pò aduprà.

Infine, entreremu è valuteremu i nostri mudelli di analisi di sentimentu utilizendu metudi d'apprendimentu machine.

1. Impurtà Biblioteche

Caricà e librerie necessarie.

Importazione di Biblioteche

2. Import Dataset

Questu articulu serà basatu annantu à un inseme di dati chì pò esse truvatu Github. U dataset serà impurtatu cù a funzione di lettura CSV di Pandas, cum'è vistu quì sottu:

Importing Dataset

Utilizendu a funzione head(), esaminà e prime cinque fila di u dataset:

Head Dataset

Output:

Output di u Dataset Head

3. Analisi di i Dati

Esaminemu i dati per determinà s'ellu ci sò tendenzi. Ma prima, cambieremu a dimensione predeterminata di a trama per fà i grafici più visibili.

Ajustamentu di a dimensione di a trama

Cuminciamu cù u numeru di tweets ricevuti da ogni compagnia aerea. Adupremu un graficu di torta per questu:

Pie Chart

U percentualità di tweets publichi per ogni compagnia aerea hè visualizata in u output.

Output di u graficu a torta

Fighjemu cumu i sentimenti sò distribuiti nantu à tutti i tweets.

Graficu a torta semantica

Output:

Output Semantic Pie Chart

Esaminemu avà a distribuzione di u sentimentu per ogni linea aerea specifica.

Sicondu i risultati, a maiò parte di i tweets per quasi tutte e compagnie aeree sò sfavorevoli, cù tweets neutrali è boni seguenti. Virgin America hè forse l'unica compagnia aerea induve a proporzione di i trè sentimenti hè paragunabili.

Distribuzione di ogni compagnia aerea

Output:

Distribuzione di ogni Output Airline

Infine, useremu a biblioteca Seaborn per ottene u livellu mediu di fiducia per i tweets da trè categurie di sentimenti.

Bar Plot

Output:

Output Bar Plot

U risultatu mostra chì u livellu di cunfidenza per i tweets negativi hè più grande cà per i tweets pusitivi o neutrali.

4. Pulizia di i dati

Parechji termini di slang è segni di puntuazione ponu esse truvati in tweets. Prima di pudè furmà u mudellu di machine learning, avemu bisognu di pulizziari i nostri tweets.

Tuttavia, prima di cumincià à pulizziari i tweets, duvemu separà u nostru set di dati in setti di funzioni è etichette.

Funzioni è etichette

Pudemu pulisce e dati una volta chì l'avemu separatu in funzioni è setti di furmazione. Espressioni rigulari seranu usati per fà questu.

Spressione Regulare

5. Rappresentazione numerica di u testu

Per furmà mudelli di machine learning, l'algoritmi statistichi impieganu a matematica. A matematica, invece, travaglia solu cù numeri.

Avemu da prima trasfurmà u testu in numeri per l'algoritmi statistichi per trattà cun ellu. Ci hè trè manere basi di fà: Bag of Words, TF-IDF è Word2Vec.

Fortunatamente, a classa TfidfVectorizer in u modulu Scikit-Learn di Python pò esse aduprata per trasfurmà e funzioni di testu in vettori di funzioni TF-IDF.

TF IDF

6. Crià Training Data-Driven è Test Sets

Infine, duvemu dividisce i nostri dati in setti di furmazione è teste prima di furmà i nostri algoritmi.

U set di furmazione serà utilizatu per furmà l'algoritmu, è u set di teste serà utilizatu per valutà u rendiment di u mudellu di apprendimentu di macchina.

Test di trenu

7. Sviluppu di mudelli

Dopu chì i dati sò stati separati in setti di furmazione è di teste, i tecnichi d'apprendimentu di machine sò usati per amparà da i dati di furmazione.

Pudete utilizà qualsiasi algoritmu di apprendimentu di macchina. L'approcciu Random Forest, però, serà utilizatu per via di a so capacità di affruntà i dati micca nurmalizzati.

Formazione di mudelli

8. Previsioni è Valutazione Modelli

Dopu chì u mudellu hè statu furmatu, u stadiu finali hè di fà predizioni. Per fà questu, avemu da applicà u metudu di prediczione à l'ughjettu di classi RandomForestClassifier chì avemu furmatu.

Previsione di mudellu

Infine, misure di classificazione cum'è metrica di cunfusione, misure F1, precisione, è cusì ponu esse aduprate per valutà u rendiment di mudelli di apprendimentu di machine.

Metri di classificazione

Output:

Classificazione Metrics Output

U nostru algoritmu hà ottinutu una precisione di 75.30, cum'è vistu da i risultati.

cunchiusioni

L'analisi di sentimentu hè unu di i travaglii NLP più frequenti postu chì aiuta à identificà l'opinione publica generale nantu à un tema specificu.

Avemu vistu cumu parechje biblioteche Python ponu aiutà cù l'analisi di sentimenti.

Avemu realizatu un studiu di tweets publichi nantu à sei compagnie aeree americane è hà righjuntu una precisione di circa 75%.

Puderaghju suggerisce chì pruvate un altru algoritmu di apprendimentu di macchina, cum'è a regressione logistica, SVM, o KNN, per vede s'ellu pudete ottene risultati megliu.

Analisi di sentimenti NLP cù Python

Chì ghjè l'analisi di sentimentu?

Beneficii di l'analisi di sentimenti