Table of Contents[Qari][muuji]
Ganacsiyadu waxay ku guulaysteen helitaanka xogta isdhexgalka macaamiisha 2021.
Ku-tiirsanaanta xad dhaafka ah ee dhibcahan xogta ah, dhanka kale, waxay si joogta ah u horseedaa ururadu inay ula dhaqmaan talooyinka macmiilka sidii tira-koob ahaan - hab hal-geesood ah oo lagu dhageysto codka macmiilka.
Codka macmiilka lama calaamadin karo lamana beddeli karo lambar.
Waa in la akhriyaa, la isku ururiyaa, oo, ka sarreeya, la fahmo.
Xaqiiqdu waxay tahay in shirkaduhu ay tahay inay si firfircoon u dhagaystaan waxa macaamiishooda ay ku leeyihiin kanaal kasta oo ay la falgalaan, hadday tahay wicitaanno telefoon, iimaylo, ama wada sheekaysi toos ah.
Shirkad kastaa waa inay mudnaan siiso la socodka iyo qiimaynta dareenka jawaab celinta macaamiisha, laakiin shirkaduhu waxay dhaqan ahaan ku dhibtooday inay xakameeyaan xogtan oo ay u beddelaan sirdoon macno leh.
Tani maahan kiiskii falanqaynta dareenka.
Casharradan, waxaan si dhow u eegi doonaa falanqaynta dareenka, faa'iidooyinka, iyo sida loo isticmaalo NLTK maktabad si ay u sameeyaan falanqaynta dareenka xogta.
Waa maxay falanqaynta dareenka?
Falanqaynta dareenka, oo inta badan loo yaqaan macdanta wada sheekaysiga, waa hab lagu falanqeeyo dareenka, fikradaha, iyo aragtida dadka.
Falanqaynta dareenka waxay u ogolaataa ganacsiyada inay si fiican u fahmaan macaamiishooda, kordhiyaan dakhliga, oo ay xoojiyaan alaabadooda iyo adeegyadooda iyadoo lagu saleynayo talooyinka macmiilka.
Farqiga u dhexeeya nidaamka softiweerka ah ee awood u leh inuu falanqeeyo dareenka macaamiisha iyo iibiyaha / wakiilka adeegga macaamiisha isku dayaya inuu soo saaro waa kartidii hore ee awoodiisa inuu ka soo saaro natiijooyin ujeedo leh qoraalka cayriin - tan waxaa ugu horrayn lagu dhammeeyaa habaynta luqadda dabiiciga ah (NLP) iyo barashada mashiinka farsamooyinka.
Laga soo bilaabo aqoonsiga dareenka ilaa kala soocida qoraalka, falanqaynta dareenka waxay leedahay codsiyo kala duwan oo kala duwan. Waxaanu ku shaqaynaa falanqaynta dareenka xogta qoraalka si aanu uga caawino shirkad la socota dareenka qiimaynta alaabta ama jawaab celinta macaamiisha.
Baraha bulshada ee kala duwan ayaa u isticmaala si ay u qiimeeyaan dareenka la soo dhejiyo, haddii shucuurtu ay aad u xoog badan tahay ama rabshado, ama ay ka hoos baxdo heerkooda, boostada waa la tirtiraa ama la qariyaa.
Falanqaynta dareenka waxaa loo isticmaali karaa wax kasta laga bilaabo aqoonsiga dareenka ilaa kala soocidda qoraalka.
Isticmaalka ugu caansan ee falanqaynta dareenka waa xogta qoraalka, halkaas oo loo isticmaalo in lagu caawiyo shirkad si ay ula socoto dareenka qiimaynta alaabta ama faallooyinka macaamiisha.
Baraha bulshada ee kala duwan ayaa sidoo kale u isticmaala si ay u qiimeeyaan dareenka la soo dhejiyo, iyo haddii shucuurtu ay aad u xoogan tahay ama rabshado, ama ay ka hooseyso heerkooda, way tirtiraan ama qariyaan boostada.
Faa'iidooyinka Falanqaynta Dareenka
Kuwa soo socda ayaa ah qaar ka mid ah faa'iidooyinka ugu muhiimsan ee falanqaynta dareenka ee ay tahay inaan la iska indho-tirin.
- Ka caawi qiimaynta aragtida summadaada ee ka mid ah tirakoobka bartilmaameedkaaga.
- Jawaab celinta tooska ah ee macmiilka ayaa la bixiyaa si ay kaaga caawiso horumarinta alaabtaada.
- Waxay kordhisaa dakhliga iibka iyo rajada.
- Fursadaha qaaliga ah ee horyaalada alaabtaada ayaa kordhay.
- Adeegga macaamiisha firfircooni waa ikhtiyaar wax ku ool ah.
Nambaradu waxay ku siin karaan macluumaadka sida waxqabadka cayriinka ah ee ololaha suuq-geynta, qadarka ka-qaybgalka wicitaanka rajada, iyo tirada tigidhada sugaya taageerada macaamiisha.
Si kastaba ha ahaatee, kuuma sheegi doonto sababta ay dhacdo gaar ah u dhacday ama waxa sababay. Qalabka falanqaynta sida Google iyo Facebook, tusaale ahaan, ayaa kaa caawin kara inaad qiimeyso waxqabadka dadaalkaaga suuqgeyneed.
Laakin kuma siiyaan aqoon qoto dheer oo ku saabsan sababta ololahaas gaarka ah uu u guulaystay.
Falanqaynta dareenka ayaa awood u leh in ay ciyaarta wax ka beddesho arrintan.
Falanqaynta Dareenka - Hadalka Dhibaatada
Ujeeddadu waa in la go'aamiyo haddii tweet-ku leeyahay dareen wanaagsan, taban, ama dhexdhexaad ah oo ku saabsan lix shirkadood oo diyaaradeed oo Maraykan ah oo ku salaysan tweets.
Tani waa shaqo barasho oo la kormeerayo oo heerkeedu yahay in aan u kala saarno xargaha qoraalka qaybo hore loo sii go'aamiyay oo la siiyay xadhig qoraal ah.
Solution
Waxaan u isticmaali doonaa habka barashada mashiinka caadiga ah si aan wax uga qabto dhibaatadan. Waxaan ku bilaabaynaa soo dejinta maktabadaha lagama maarmaanka ah iyo kaydinta xogta.
Markaa waxaanu samayn doonaa falanqayn xog sahamin ah si loo go'aamiyo haddii ay jiraan qaabab xogta ku jira. Taas ka dib, waxaanu samayn doonaa diyaarinta qoraalka si aanu u beddelno xogta tirada qoraalka ee a barashada mashiinka nidaamka isticmaali karaa.
Ugu dambayntii, waxaanu tababari doonaa oo aanu qiimayn doonaa moodelladayada falanqaynta dareenka anagoo adeegsanayna hababka barashada mishiinada.
1. Maktabadaha soo dejinta
Rar maktabadaha lagama maarmaanka ah.
2. Soo dejinta Xogta
Maqaalkani waxa uu ku salaysnaan doonaa xog-ururin laga heli karo Github. Xogta waxa lagu soo dejin doonaa iyadoo la isticmaalayo Pandas 'akhrinta CSV, sida hoos lagu arkay:
Adigoo isticmaalaya shaqada madaxa() , eeg xogta xogta shanta saf ee ugu horeeya:
Output:
3. Falanqaynta Xogta
Aan baaro xogta si aan u go'aamino haddii ay jiraan wax isbeddello ah. Laakiin marka hore, waxaanu bedeli doonaa cabbirka goobta caadiga ah si aanu jaantusyada uga dhigo kuwo muuqda.
Aan ku bilowno tirada tweets ee ay heshay diyaarad kasta. Waxaan tan u isticmaali doonaa shaxda pie:
Boqolkiiba tweets-ka guud ee shirkad kasta waxa lagu muujiyay wax-soo-saarka.
Aan eegno sida dareenka loogu qaybiyay dhammaan tweets-yada.
Output:
Aynu hadda eegno qaybinta dareenka shirkad kasta oo gaar ah.
Marka loo eego natiijooyinka, tirada ugu badan ee tweets ee ku dhawaad dhammaan shirkadaha diyaaradaha ayaa ah kuwa aan wanaagsanayn, oo leh dhexdhexaad iyo tweets wanaagsan soo socda. Virgin America waa laga yaabaa inay tahay diyaaradda kaliya ee saamiga saddexda dareemo la barbar dhigo.
Output:
Ugu dambeyntii, waxaan u isticmaali doonaa maktabadda Seaborn si aan u helno celceliska heerka kalsoonida tweets ee saddex qaybood oo dareen ah.
Output:
Natiijadu waxay muujinaysaa in heerka kalsoonida tweets taban ay ka weyn tahay tweets togan ama dhexdhexaad ah.
4. Nadiifinta xogta
Erayada halqabsiga badan iyo calamadaha xarakaynta ayaa laga heli karaa tweets. Ka hor inta aanan u tababarin qaabka barashada mashiinka, waxaan u baahanahay inaan nadiifino tweets our.
Si kastaba ha ahaatee, ka hor inta aynaan bilaabin nadiifinta tweets, waa in aan u kala saarno xogtayada qaab iyo calaamado.
Waxaan nadiifin karnaa xogta marka aan u kala saarno qaababka iyo tababarka. Tibaaxo joogto ah ayaa loo isticmaali doonaa si tan loo sameeyo.
5. Matalaadda Tirada ee Qoraalka
Si loo tababaro moodooyinka barashada mashiinka, algorithms-yada tirakoobka waxay adeegsadaan xisaab. Xisaabtu, dhanka kale, waxay ku shaqaysaa tirooyinka oo keliya.
Marka hore waa in aan qoraalka u beddelnaa tirooyin si loo helo algorithms xisaabeed si aan wax uga qabanno. Waxaa jira saddex siyaabood oo aasaasi ah oo sidaas loo sameeyo: Bag of Words, TF-IDF, iyo Word2Vec.
Nasiib wanaag, fasalka TfidfVectorizer ee Python's Scikit-Module waxa loo isticmaali karaa in lagu beddelo astaamaha qoraalka ee TF-IDF.
6. Abuuritaanka Tababarka Xogta-Kormeeray iyo Hababka Imtixaanka
Ugu dambayntii, waa in aan xogtayada u qaybinnaa tababar iyo tijaabo ka hor inta aan la tababarin algoorithmsyadayada.
Qalabka tababarka waxaa loo isticmaali doonaa in lagu tababaro algorithm, iyo tijaabada tijaabada waxaa loo isticmaali doonaa si loo qiimeeyo waxqabadka qaabka barashada mashiinka.
7. Horumarinta Model
Ka dib marka xogta loo kala saaro tababarka iyo imtixaanada, farsamooyinka barashada mashiinka ayaa loo isticmaalaa in lagu barto xogta tababarka.
Waxaad isticmaali kartaa algorithm kasta oo barashada mashiinka. Habka Random Forest, si kastaba ha ahaatee, waxaa loo isticmaali doonaa sababtoo ah awoodda ay u leedahay in ay la qabsato xogta aan caadiga ahayn.
8. Saadaasha iyo Qaabka Qiimaynta
Ka dib marka qaabka la tababaro, heerka ugu dambeeya waa in la saadaaliyo. Si tan loo sameeyo, waa inaan ku dabaqno habka saadaalinta shayga fasalka RandomForestClassifier ee aanu tababarnay.
Ugu dambeyntii, cabbirada kala soocida sida jaantusyada jaahwareerka, cabbirada F1, saxnaanta, iyo wixii la mid ah ayaa loo isticmaali karaa si loo qiimeeyo waxqabadka moodooyinka barashada mashiinka.
Output:
Algorithmistu waxay gaadhay saxnaanta 75.30, sida lagu arkay natiijooyinka.
Ugu Dambeyn
Falanqaynta dareenka waa mid ka mid ah shaqooyinka NLP ee soo noqnoqda maadaama ay gacan ka geysato aqoonsiga guud ahaan ra'yiga dadweynaha ee arrin gaar ah.
Waxaan aragnay sida dhowr maktabadood oo Python ah ay uga caawin karaan falanqaynta dareenka.
Waxaan samaynay daraasad ku saabsan tweets-ka dadweynaha ilaa lix shirkadood oo diyaaradeed oo Maraykan ah waxaanan gaarnay sax ahaan qiyaastii 75%.
Waxaan soo jeedin lahaa inaad isku daydo algorithm-ka barashada mashiinka kale, sida dib-u-celinta saadka, SVM, ama KNN, si aad u aragto haddii aad ku guuleysan karto natiijooyin wanaagsan.
Leave a Reply