Teburin Abubuwan Ciki[Boye][Nuna]
Kasuwanci za su ƙware wajen siyan bayanan hulɗar mabukaci nan da 2021.
Dogaro da yawa akan waɗannan wuraren bayanai, a gefe guda, akai-akai yana haifar da ƙungiyoyi waɗanda ke ɗaukar shigarwar abokin ciniki azaman ƙididdiga - hanya mai ma'ana guda ɗaya don sauraron muryar abokin ciniki.
Muryar abokin ciniki ba za a iya yin lamba ko canza shi zuwa lamba ba.
Dole ne a karanta shi, a tattara shi, kuma, sama da duka, fahimta.
Gaskiyar ita ce, dole ne kamfanoni su saurari abin da masu amfani da su za su ce a kowace tashar da suke mu'amala da su, ta hanyar kiran waya, imel, ko taɗi kai tsaye.
Kowane kamfani ya kamata ya ba da fifikon saka idanu da kimanta ra'ayin masu amfani, amma kamfanoni a al'ada sun yi gwagwarmaya don sarrafa wannan bayanan da canza shi zuwa hankali mai ma'ana.
Wannan ba haka lamarin yake ba tare da Binciken Hankali.
A cikin wannan koyawa, za mu yi nazari sosai kan nazarin jin daɗi, fa'idodinsa, da yadda ake amfani da shi NLTK ɗakin karatu don yin nazarin ra'ayi akan bayanai.
Menene bincike na tunani?
Binciken ra'ayi, wanda aka fi sani da hakar ma'adinai, hanya ce don nazarin ji, tunani, da ra'ayoyin mutane.
Binciken ra'ayi yana bawa 'yan kasuwa damar samun kyakkyawar fahimta game da masu amfani da su, haɓaka kudaden shiga, da haɓaka samfuransu da ayyukansu bisa shigar da abokin ciniki.
Bambanci tsakanin tsarin software wanda ke da ikon yin nazarin tunanin abokin ciniki da mai siyarwa / wakilin sabis na abokin ciniki yana ƙoƙarin cire shi shine ikon tsohon na iya samun sakamako na haƙiƙa daga ɗan rubutu - wannan ana samunsa da farko ta hanyar sarrafa harshe na halitta (NLP) kuma injin inji dabaru.
Daga gano motsin rai zuwa rarrabuwar rubutu, nazarin jin daɗi yana da aikace-aikace da yawa. Muna amfani da bincike na jin daɗi akan bayanan rubutu don taimakawa kamfani saka idanu akan ra'ayin kimanta samfur ko ra'ayin mabukaci.
Shafukan sada zumunta daban-daban na amfani da shi wajen tantance yadda ake wallafawa, kuma idan motsin ya yi karfi ko tashin hankali, ko kuma ya fadi kasa da bakinsu, sai a goge sakon ko a boye.
Ana iya amfani da nazarin jin daɗi don komai daga gano motsin rai zuwa rarraba rubutu.
Shahararriyar amfani da nazarin jin daɗi shine akan bayanan rubutu, inda ake amfani da shi don taimakawa kamfani wajen bin diddigin ra'ayin kimanta samfuran ko sharhin mabukaci.
Hakazalika shafukan sada zumunta daban-daban na amfani da shi wajen tantance yadda ake wallafawa, kuma idan abin ya yi karfi ko tashin hankali, ko kuma ya fadi kasa, sai su goge ko boye sakon.
Fa'idodin Nazari Na Ji
Wadannan su ne wasu mahimman fa'idodin nazarin tunani waɗanda bai kamata a yi watsi da su ba.
- Taimaka wajen tantance ma'anar alamar ku a tsakanin alƙaluman da aka yi niyya.
- Ana ba da amsawar abokin ciniki kai tsaye don taimaka muku wajen haɓaka samfuran ku.
- Yana haɓaka kudaden shiga tallace-tallace da sa ido.
- Damar haɓakawa ga zakarun samfuran ku sun ƙaru.
- Sabis na abokin ciniki mai fa'ida zaɓi ne mai amfani.
Lambobi zasu iya samar muku da bayanai kamar ɗanyen aikin yaƙin neman zaɓe, adadin haɗin kai a cikin kiran da ake nema, da adadin tikitin da ke jiran goyon bayan abokin ciniki.
Koyaya, ba zai gaya muku dalilin da ya sa wani takamaiman abin ya faru ko abin da ya haifar da shi ba. Kayan aikin bincike kamar Google da Facebook, alal misali, na iya taimaka maka tantance aikin ƙoƙarin tallan ku.
Amma ba su ba ku zurfin sanin dalilin da ya sa takamaiman yakin ya yi nasara ba.
Binciken Hankali yana da yuwuwar zama mai canza wasa ta wannan fanni.
Binciken Hankali - Maganar Matsala
Manufar ita ce tantance idan tweet yana da dadi, mara kyau, ko tsaka tsaki game da kamfanonin jiragen sama na Amurka guda shida dangane da tweets.
Wannan daidaitaccen aikin koyo ne da ake kulawa wanda a ciki dole ne mu karkasa saƙon rubutu zuwa ƙayyadaddun ƙayyadaddun da aka ba da kirtan rubutu.
Magani
Za mu yi amfani da daidaitaccen tsarin koyon injin don magance wannan matsalar. Za mu fara da shigo da laburaren da ake bukata da bayanan bayanai.
Sa'an nan za mu yi wasu bincike na bayanai don sanin ko akwai wasu alamu a cikin bayanan. Bayan haka, za mu gudanar da aikin aiwatar da rubutu don juya bayanan shigar da rubutu wanda a injin inji tsarin iya amfani.
A ƙarshe, za mu horar da kuma kimanta tsarin nazarin tunanin mu ta amfani da hanyoyin koyon inji.
1. Shigo da Dakunan karatu
Loda dakunan karatu da suka dace.
2. Shigo Dataset
Wannan labarin zai dogara ne akan tsarin bayanai wanda za'a iya samunsa akai Github. Za a shigo da saitin bayanan ta amfani da aikin Pandas' karanta CSV, kamar yadda aka gani a ƙasa:
Yin amfani da aikin kai(), bincika layuka biyar na farko na dataset:
fitarwa:
3. Binciken Bayanai
Bari mu bincika bayanan don sanin ko akwai wani yanayi. Amma da farko, za mu canza girman maƙalli na tsoho don sa ginshiƙi mafi bayyane.
Bari mu fara da adadin tweets da kowane jirgin sama ya karɓa. Za mu yi amfani da ginshiƙi don wannan:
Ana nuna yawan adadin tweets na jama'a na kowane jirgin sama a cikin fitarwa.
Bari mu kalli yadda ake rarraba ji a kan duk tweets.
fitarwa:
Yanzu bari mu bincika rarraba ra'ayi ga kowane takamaiman jirgin sama.
Dangane da sakamakon, yawancin tweets na kusan dukkanin kamfanonin jiragen sama ba su da kyau, tare da tsaka tsaki da kyawawan tweets suna biye. Budurwar Amurka ita ce kawai kamfanin jirgin sama inda rabon ji uku ya yi daidai.
fitarwa:
A ƙarshe, za mu yi amfani da ɗakin karatu na Seaborn don samun matsakaicin matakin amincewa don tweets daga nau'ikan jin daɗi guda uku.
fitarwa:
Sakamakon ya nuna cewa matakin amincewa don tweets mara kyau ya fi girma fiye da tweets masu kyau ko tsaka tsaki.
4. Tsabtace bayanai
Ana iya samun kalmomi da yawa da alamun rubutu a cikin tweets. Kafin mu iya horar da samfurin koyon injin, muna buƙatar tsaftace tweets.
Koyaya, kafin mu fara tsaftace tweets, yakamata mu ware saitin bayanan mu cikin fasali da saitin lakabi.
Za mu iya tsaftace bayanan da zarar mun raba su zuwa fasali da tsarin horo. Za a yi amfani da maganganu na yau da kullum don yin haka.
5. Yawan Wakiltar Rubutu
Don horar da ƙirar injuna, algorithms na ƙididdiga suna amfani da lissafi. Lissafi, a gefe guda, yana aiki da lambobi kawai.
Dole ne mu fara canza rubutu zuwa lambobi don ƙididdiga algorithms don magance shi. Akwai manyan hanyoyi guda uku na yin haka: Bag of Words, TF-IDF, da Word2Vec.
Abin farin ciki, ana iya amfani da ajin TfidfVectorizer a cikin Python's Scikit-Learn module don canza fasalin rubutu zuwa fasalin fasalin TF-IDF.
6. Ƙirƙirar Horarwar Bayanai da Saitunan Gwaji
A ƙarshe, dole ne mu raba bayananmu zuwa tsarin horo da gwaji kafin horar da algorithms ɗin mu.
Za a yi amfani da tsarin horon don horar da algorithm, kuma za a yi amfani da tsarin gwajin don tantance aikin ƙirar na'ura.
7. Samfuran Ci gaba
Bayan an raba bayanan zuwa horo da tsarin gwaji, ana amfani da dabarun koyan na'ura don koyo daga bayanan horo.
Kuna iya amfani da kowane algorithm koyo na inji. Hanyar Random Forest, duk da haka, za a yi amfani da shi saboda ikonsa na jure bayanan da ba na al'ada ba.
8. Hasashe da Ƙimar Samfura
Bayan an horar da samfurin, mataki na ƙarshe shine yin tsinkaya. Don yin wannan, dole ne mu yi amfani da hanyar tsinkaya zuwa abin aji na RandomForestClassifier wanda muka horar.
A ƙarshe, ana iya amfani da matakan rarrabuwa kamar ma'aunin ruɗani, ma'aunin F1, daidaito, da sauransu don kimanta aikin ƙirar koyan na'ura.
fitarwa:
Algorithm ɗin mu ya sami daidaito na 75.30, kamar yadda aka gani ta sakamakon.
Kammalawa
Binciken ji yana ɗaya daga cikin ayyukan NLP akai-akai tunda yana taimakawa gano ra'ayin jama'a gabaɗaya akan takamaiman batun.
Mun ga yadda dakunan karatu na Python da yawa za su iya taimakawa tare da nazarin tunani.
Mun gudanar da binciken tweets na jama'a kusan kamfanonin jiragen sama na Amurka shida kuma mun kai daidaito kusan 75%.
Ina ba da shawarar ku gwada wani algorithm na koyon injin, kamar jujjuyawar dabaru, SVM, ko KNN, don ganin ko za ku iya samun kyakkyawan sakamako.
Leave a Reply