Table di cuntinutu[Piattà][Mostra]
L'imprese averanu maestratu l'acquistu di dati di interazzione di i cunsumatori da u 2021.
A fiducia eccessiva di questi punti di dati, invece, porta spessu à l'urganisazioni chì trattanu l'input di u cliente cum'è una statistica - un approcciu piuttostu unidimensionale per sente a voce di u cliente.
A voce di u cliente ùn pò micca esse badge o cunvertita in un numeru.
Deve esse lettu, cundensatu è, sopratuttu, capitu.
U fattu hè chì e cumpagnie anu da sente attivamente ciò chì i so cunsumatori anu da dì nantu à ogni canali per quale interagiscenu cun elli, sia per via di telefonate, email, o chat in diretta.
Ogni cumpagnia duveria prioritizà u monitoraghju è a valutazione di u sentimentu di feedback di i cunsumatori, ma l'imprese anu tradizionalmente luttatu per trattà queste dati è trasfurmà in una intelligenza significativa.
Questu ùn hè più u casu cù l'analisi di sentimenti.
In questu tutoriale, daremu un sguardu più attentu à l'analisi di sentimenti, i so vantaghji, è cumu utilizà NLTK biblioteca per fà analisi di sentimentu nantu à i dati.
Chì ghjè l'analisi di sentimentu?
L'analisi di sentimenti, spessu cunnisciuta cum'è minera di cunversazione, hè un metudu per analizà i sentimenti, i pinsamenti è i punti di vista di e persone.
L'analisi di sentimentu permette à l'imprese di capisce megliu i so cunsumatori, aumentà i rivenuti è rinfurzà i so prudutti è servizii basati nantu à l'input di i clienti.
A diffarenza trà un sistema di software capace di analizà u sentimentu di u cliente è un venditore / rappresentante di u serviziu di u cliente chì prova à deduce hè a capacità pura di u primu di derivà risultati obiettivu da u testu crudu - questu hè principalmente realizatu per u processu di lingua naturale (NLP) è machine learning tecniche.
Da l'identificazione di l'emozioni à a categurizazione di testu, l'analisi di sentimentu hà una larga gamma di applicazioni. Impieghemu l'analisi di sentimentu nantu à e dati testuali per aiutà una firmata à monitorà u sentimentu di e valutazioni di u produttu o feedback di i cunsumatori.
Diversi siti di e social media l'utilizanu per valutà u sentimentu di i posti, è se l'emozione hè troppu forte o viulente, o cade sottu à u so limitu, u postu hè o sguassatu o oculatu.
L'analisi di sentimentu pò esse usata per tuttu, da l'identificazione di l'emozioni à a categurizazione di testu.
L'usu più populari di l'analisi di u sentimentu hè nantu à e dati testuali, induve hè utilizatu per aiutà una cumpagnia in u seguimentu di u sentimentu di e valutazioni di u produttu o cumenti di i cunsumatori.
Diversi siti di e social media l'utilizanu ancu per valutà u sentimentu di i posti, è se l'emozione hè troppu forte o viulente, o cade sottu à u so limitu, sguassate o oculta u postu.
Beneficii di l'analisi di sentimenti
Eccu alcuni di i benefici più impurtanti di l'analisi di sentimentu chì ùn deve esse micca disregarded.
- Aiutu à valutà a percepzione di a vostra marca trà u vostru target demograficu.
- I feedback diretti di i clienti sò furniti per aiutà à sviluppà u vostru pruduttu.
- Aumenta i rivenuti di vendita è a pruspezione.
- L'opportunità di upsell per i campioni di u vostru pruduttu sò aumentate.
- U serviziu di u cliente proattivu hè una opzione pratica.
I numeri ponu furnisce infurmazioni cum'è u rendiment crudu di una campagna di marketing, a quantità di impegnu in una chjama di prospezione, è u numeru di biglietti pendenti in u supportu di i clienti.
Tuttavia, ùn vi dicerà micca perchè un avvenimentu specificu hè accadutu o ciò chì hà causatu. Strumenti analytics cum'è Google è Facebook, per esempiu, ponu aiutà à valutà u rendiment di i vostri sforzi di marketing.
Ma ùn vi furnisce micca una cunniscenza approfondita di perchè quella campagna specifica hà successu.
Sentiment Analysis hà u putenziale di cambià u ghjocu in questu sensu.
Analisi di sentimenti - Dichjarazione di u prublema
L'obiettivu hè di determinà se un tweet hà emozioni favurevuli, negativi o neutrali in quantu à sei compagnie aeree americane basate nantu à i tweets.
Questu hè un travagliu standard di apprendimentu supervisatu in quale duvemu categurizà una stringa di testu in categurie predeterminate datu una stringa di testu.
Vergogna à tè
Adupremu u prucessu standard di l'apprendimentu di macchina per affruntà stu prublema. Cumincià da impurtà e biblioteche necessarie è datasets.
Allora eseguiremu qualchì analisi di dati esploratori per determinà s'ellu ci sò mudelli in i dati. Dopu à quessa, avemu Mulateri Di L'imprendi preprocessing testu à turnà testu input numèrica dati chì a machine learning sistema pò aduprà.
Infine, entreremu è valuteremu i nostri mudelli di analisi di sentimentu utilizendu metudi d'apprendimentu machine.
1. Impurtà Biblioteche
Caricà e librerie necessarie.
2. Import Dataset
Questu articulu serà basatu annantu à un inseme di dati chì pò esse truvatu Github. U dataset serà impurtatu cù a funzione di lettura CSV di Pandas, cum'è vistu quì sottu:
Utilizendu a funzione head(), esaminà e prime cinque fila di u dataset:
Output:
3. Analisi di i Dati
Esaminemu i dati per determinà s'ellu ci sò tendenzi. Ma prima, cambieremu a dimensione predeterminata di a trama per fà i grafici più visibili.
Cuminciamu cù u numeru di tweets ricevuti da ogni compagnia aerea. Adupremu un graficu di torta per questu:
U percentualità di tweets publichi per ogni compagnia aerea hè visualizata in u output.
Fighjemu cumu i sentimenti sò distribuiti nantu à tutti i tweets.
Output:
Esaminemu avà a distribuzione di u sentimentu per ogni linea aerea specifica.
Sicondu i risultati, a maiò parte di i tweets per quasi tutte e compagnie aeree sò sfavorevoli, cù tweets neutrali è boni seguenti. Virgin America hè forse l'unica compagnia aerea induve a proporzione di i trè sentimenti hè paragunabili.
Output:
Infine, useremu a biblioteca Seaborn per ottene u livellu mediu di fiducia per i tweets da trè categurie di sentimenti.
Output:
U risultatu mostra chì u livellu di cunfidenza per i tweets negativi hè più grande cà per i tweets pusitivi o neutrali.
4. Pulizia di i dati
Parechji termini di slang è segni di puntuazione ponu esse truvati in tweets. Prima di pudè furmà u mudellu di machine learning, avemu bisognu di pulizziari i nostri tweets.
Tuttavia, prima di cumincià à pulizziari i tweets, duvemu separà u nostru set di dati in setti di funzioni è etichette.
Pudemu pulisce e dati una volta chì l'avemu separatu in funzioni è setti di furmazione. Espressioni rigulari seranu usati per fà questu.
5. Rappresentazione numerica di u testu
Per furmà mudelli di machine learning, l'algoritmi statistichi impieganu a matematica. A matematica, invece, travaglia solu cù numeri.
Avemu da prima trasfurmà u testu in numeri per l'algoritmi statistichi per trattà cun ellu. Ci hè trè manere basi di fà: Bag of Words, TF-IDF è Word2Vec.
Fortunatamente, a classa TfidfVectorizer in u modulu Scikit-Learn di Python pò esse aduprata per trasfurmà e funzioni di testu in vettori di funzioni TF-IDF.
6. Crià Training Data-Driven è Test Sets
Infine, duvemu dividisce i nostri dati in setti di furmazione è teste prima di furmà i nostri algoritmi.
U set di furmazione serà utilizatu per furmà l'algoritmu, è u set di teste serà utilizatu per valutà u rendiment di u mudellu di apprendimentu di macchina.
7. Sviluppu di mudelli
Dopu chì i dati sò stati separati in setti di furmazione è di teste, i tecnichi d'apprendimentu di machine sò usati per amparà da i dati di furmazione.
Pudete utilizà qualsiasi algoritmu di apprendimentu di macchina. L'approcciu Random Forest, però, serà utilizatu per via di a so capacità di affruntà i dati micca nurmalizzati.
8. Previsioni è Valutazione Modelli
Dopu chì u mudellu hè statu furmatu, u stadiu finali hè di fà predizioni. Per fà questu, avemu da applicà u metudu di prediczione à l'ughjettu di classi RandomForestClassifier chì avemu furmatu.
Infine, misure di classificazione cum'è metrica di cunfusione, misure F1, precisione, è cusì ponu esse aduprate per valutà u rendiment di mudelli di apprendimentu di machine.
Output:
U nostru algoritmu hà ottinutu una precisione di 75.30, cum'è vistu da i risultati.
cunchiusioni
L'analisi di sentimentu hè unu di i travaglii NLP più frequenti postu chì aiuta à identificà l'opinione publica generale nantu à un tema specificu.
Avemu vistu cumu parechje biblioteche Python ponu aiutà cù l'analisi di sentimenti.
Avemu realizatu un studiu di tweets publichi nantu à sei compagnie aeree americane è hà righjuntu una precisione di circa 75%.
Puderaghju suggerisce chì pruvate un altru algoritmu di apprendimentu di macchina, cum'è a regressione logistica, SVM, o KNN, per vede s'ellu pudete ottene risultati megliu.
Lascia un Audiolibro