Clár na nÁbhar[Folaigh][Taispeáin]
Beidh máistreacht ag gnólachtaí ar shonraí idirghníomhaíochta tomhaltóirí a fháil faoi 2021.
Ar an láimh eile, is minic a bhíonn eagraíochtaí ag déileáil le hionchur custaiméirí mar staitistic de bharr ró-spleáchas ar na pointí sonraí seo – cur chuige aontoiseach chun éisteacht le glór an chustaiméara.
Ní féidir guth an chustaiméara a shuaitheantas nó a thiontú ina uimhir.
Ní mór é a léamh, a chomhdhlúthú, agus, thar aon rud eile, a thuiscint.
Is é an fírinne ná go gcaithfidh cuideachtaí éisteacht go gníomhach lena bhfuil le rá ag a gcuid tomhaltóirí ar gach cainéal trína n-idirghníomhaíonn siad leo, cibé acu trí ghlaonna gutháin, ríomhphoist nó comhrá beo é.
Ba cheart do gach cuideachta tús áite a thabhairt do mhonatóireacht agus measúnú a dhéanamh ar dhearcadh aiseolais na dtomhaltóirí, ach go traidisiúnta bhí deacrachtaí ag cuideachtaí na sonraí seo a láimhseáil agus faisnéis bhríoch a dhéanamh díobh.
Níl sé seo amhlaidh a thuilleadh maidir le hAnailís Mothúchán.
Sa rang teagaisc seo, déanfaimid breathnú níos géire ar anailís meon, ar na buntáistí a bhaineann leis, agus ar an gcaoi le húsáid an NLTK leabharlann le hanailís meon a dhéanamh ar shonraí.
Cad is anailís meon ann?
Is modh é anailís meon, ar a dtugtar mianadóireacht chomhrá go minic, chun mothúcháin, smaointe agus tuairimí daoine a anailísiú.
Ligeann anailís mothúcháin do ghnólachtaí tuiscint níos fearr a fháil ar a gcuid tomhaltóirí, ioncam a mhéadú, agus a gcuid táirgí agus seirbhísí a fheabhsú bunaithe ar ionchur cliant.
Is é an difríocht idir córas bogearraí atá in ann anailís a dhéanamh ar dhearcadh an chustaiméara agus díoltóir/ionadaí seirbhíse custaiméara a dhéanann iarracht é a bhaint amach ná cumas iomlán an chéad cheann acu torthaí oibiachtúla a dhíorthú ón téacs amh — déantar é seo go príomha trí phróiseáil teanga nádúrtha (NLP) agus foghlaim meaisín teicnící.
Ó aithint mothúcháin go catagóiriú téacs, tá raon leathan feidhmchlár ag anailís meon. Bainimid úsáid as anailís mothúcháin ar shonraí téacsúla chun cabhrú le gnólacht monatóireacht a dhéanamh ar mheon na meastóireachtaí táirge nó aiseolas ó thomhaltóirí.
Úsáideann suíomhanna meán sóisialta éagsúla é chun meon na bpostálacha a mheas, agus má tá an mothúchán ró-láidir nó foréigneach, nó má thiteann sé faoi bhun a dtairseach, scriostar an post nó má chuirtear i bhfolach é.
Is féidir anailís meon a úsáid le haghaidh gach rud ó aithint mothúcháin go catagóiriú téacs.
Is ar shonraí téacsúla an úsáid is coitianta a bhaintear as anailís meon, áit a n-úsáidtear é chun cabhrú le cuideachta dearcadh meastóireachtaí táirge nó tuairimí tomhaltóirí a rianú.
Úsáideann suíomhanna meán sóisialta éagsúla é freisin chun meon na bpostálacha a mheas, agus má tá an mothúchán ró-láidir nó foréigneach, nó má thiteann sé faoi bhun a dtairseach, scriosann siad nó ceiltíonn siad an postáil.
Buntáistí Anailís Mothúchán
Seo a leanas cuid de na tairbhí is tábhachtaí a bhaineann le hanailís meoin nár cheart neamhaird a thabhairt orthu.
- Cuidigh le measúnú a dhéanamh ar an dearcadh atá agat ar do bhranda i measc do spriocdhéimeagrafach.
- Cuirtear aiseolas díreach ó chliaint ar fáil chun cabhrú leat do tháirge a fhorbairt.
- Méadaíonn sé ioncam díolacháin agus lorgaireachta.
- Tá méadú tagtha ar dheiseanna upsell do sheaimpíní do tháirge.
- Is rogha phraiticiúil í seirbhís réamhghníomhach do chustaiméirí.
Is féidir le huimhreacha faisnéis a sholáthar duit amhail feidhmíocht amh feachtais mhargaíochta, an méid rannpháirtíochta i nglao cuardaigh, agus líon na dticéad atá ar feitheamh le tacaíocht do chustaiméirí.
Mar sin féin, ní inseoidh sé duit cén fáth ar tharla teagmhas ar leith ná cad ba chúis leis. Is féidir le huirlisí anailíse ar nós Google agus Facebook, mar shampla, cabhrú leat measúnú a dhéanamh ar fheidhmíocht d’iarrachtaí margaíochta.
Ach ní thugann siad mioneolas duit faoin bhfáth ar éirigh leis an bhfeachtas sonrach sin.
Tá an poitéinseal ag Anailís Mothúchán a bheith athraithe go mór ina leith seo.
Anailís Mothúchán – Ráiteas Fadhb
Is í an aidhm ná a chinneadh an bhfuil mothúcháin fhabhracha, dhiúltacha nó neodracha ag tweet maidir le sé aerlíne SAM bunaithe ar thweets.
Is post caighdeánach foghlama maoirsithe é seo ina gcaithfidh muid teaghrán téacs a chatagóiriú i gcatagóirí réamhshocraithe nuair a chuirtear teaghrán téacs i bhfeidhm.
réiteach
Úsáidfimid an próiseas caighdeánach meaisínfhoghlama chun aghaidh a thabhairt ar an bhfadhb seo. Tosóimid trí na leabharlanna agus na tacair shonraí riachtanacha a iompórtáil.
Ansin déanfaimid roinnt anailísiú sonraí taiscéalaíoch chun a fháil amach an bhfuil patrúin ar bith sna sonraí. Ina dhiaidh sin, déanfaimid réamhphróiseáil téacs chun sonraí uimhriúla ionchuir téacs a iompú a foghlaim meaisín is féidir córas a úsáid.
Ar deireadh, cuirfimid oiliúint agus luacháil ar ár múnlaí anailíse meon agus úsáid á baint as modhanna meaisínfhoghlama.
1. Leabharlanna a Iompórtáil
Íoslódáil na leabharlanna riachtanacha.
2. Iompórtáil Tacar Sonraí
Beidh an t-alt seo bunaithe ar thacar sonraí is féidir a fháil ar Github. Déanfar an tacar sonraí a iompórtáil trí fheidhm CSV léite Pandas a úsáid, mar a fheictear thíos:
Bain úsáid as an bhfeidhm ceann() agus scrúdaigh na chéad chúig shraith den tacar sonraí:
aschur:
3. Anailís ar na Sonraí
Lig dúinn scrúdú a dhéanamh ar na sonraí chun a chinneadh an bhfuil aon treochtaí. Ach ar dtús, athróimid méid réamhshocraithe an phlota chun na cairteacha a dhéanamh níos infheicthe.
Tosaímid le líon na dtvuíteanna a fhaigheann gach aerlíne. Úsáidfimid píchairt chuige seo:
Taispeántar céatadán na dtvuíteanna poiblí do gach aerlíne san aschur.
Breathnaímid ar an gcaoi a scaiptear na mothúcháin ar na tvuíteanna ar fad.
aschur:
Déanaimis scrúdú anois ar dháileadh na meon do gach aerlíne ar leith.
De réir na dtorthaí, tá formhór na dtvuíteanna do bheagnach gach aerlíne neamhfhabhrach, agus tá tvuíteanna neodracha agus maithe á leanúint. Is dócha gurb í Maighdean Meiriceá an t-aon aerlíne ina bhfuil comhréir na dtrí mhothúchán inchomparáide.
aschur:
Ar deireadh, úsáidfimid leabharlann Seaborn chun an meánleibhéal muiníne a fháil le haghaidh tweets ó thrí chatagóir meon.
aschur:
Léiríonn an toradh go bhfuil an leibhéal muiníne do tweets diúltacha níos mó ná do tweets dearfach nó neodrach.
4. Na sonraí a ghlanadh
Is féidir go leor téarmaí cainte agus poncaíochta a fháil i dtvuíteanna. Sular féidir linn an múnla meaisínfhoghlama a oiliúint, ní mór dúinn ár gcuid tweets a ghlanadh.
Sula dtosaímid ar na tvuíteanna a ghlanadh, áfach, ba cheart dúinn ár dtacar sonraí a scaradh ina thacair gné agus lipéad.
Is féidir linn na sonraí a ghlanadh tar éis dúinn iad a dheighilt ina ngnéithe agus ina dtacair oiliúna. Bainfear úsáid as nathanna cainte rialta chun é seo a dhéanamh.
5. Léiriú Uimhriúil an Téacs
Chun samhlacha meaisínfhoghlama a oiliúint, úsáideann algartaim staidrimh an mhatamaitic. Ar an láimh eile, oibríonn an mhatamaitic le huimhreacha amháin.
Ní mór dúinn an téacs a thiontú ina uimhreacha ar dtús le haghaidh algartaim staidrimh chun déileáil leis. Tá trí bhealach bhunúsacha ann chun é sin a dhéanamh: Bag of Words, TF-IDF, agus Word2Vec.
Ar ámharaí an tsaoil, is féidir an rang TfidfVectorizer i modúl Scikit-Learn Python a úsáid chun gnéithe téacs a athrú go veicteoirí gné TF-IDF.
6. Traenála Sonraí-tiomáinte agus Tacair Tástála a Chruthú
Ar deireadh, ní mór dúinn ár sonraí a roinnt ina thacair oiliúna agus tástála sula ndéantar ár n-halgartaim a oiliúint.
Úsáidfear an tacar oiliúna chun an algartam a oiliúint, agus úsáidfear an tacar tástála chun feidhmíocht an mhúnla meaisínfhoghlama a mheas.
7. Forbairt Múnla
Tar éis na sonraí a dheighilt i dtacair oiliúna agus tástála, úsáidtear teicnící meaisínfhoghlama chun foghlaim ó na sonraí oiliúna.
Is féidir leat aon algartam meaisínfhoghlama a úsáid. Bainfear úsáid as an gcur chuige Random Forest, áfach, mar gheall ar a cumas déileáil le sonraí neamh-normalaithe.
8. Tuartha agus Meastóireacht Mhúnla
Tar éis don mhúnla a bheith oilte, is é an chéim dheireanach ná tuar a dhéanamh. Chun seo a dhéanamh, ní mór dúinn an modh tuar a chur i bhfeidhm ar an réad ranga RandomForestClassifier a d'oilíomar.
Ar deireadh, is féidir bearta aicmithe cosúil le méadracht mearbhall, bearta F1, cruinneas, agus mar sin de a úsáid chun feidhmíocht na múnlaí meaisínfhoghlama a mheas.
aschur:
Bhain ár n-algartam cruinneas 75.30 amach, mar a fheictear sna torthaí.
Conclúid
Tá anailís meon ar cheann de na poist NLP is minice mar go gcabhraíonn sé le tuairim an phobail i gcoitinne ar shaincheist shonrach a aithint.
Chonaic muid conas is féidir le roinnt leabharlann Python cabhrú le hanailís meon.
Rinneamar staidéar ar thíoga poiblí thart ar shé aerlíne SAM agus shroicheamar cruinneas tuairim is 75%.
Mholfainn duit triail a bhaint as algartam meaisínfhoghlama eile, mar aischéimniú lóistíochta, SVM, nó KNN, féachaint an féidir leat torthaí níos fearr a bhaint amach.
Leave a Reply