Table of Contents[Qari][muuji]
- 1. Sharax farqiga u dhexeeya barashada mashiinka, sirdoonka macmal, iyo barashada qoto dheer.
- 2. Fadlan sharax noocyada kala duwan ee barashada mashiinka.
- 3. Waa maxay eexda iyo isdhaafsiga kala duwanaanshiyaha?
- 4. Algorithms barashada mashiinka ayaa si weyn u kobcay waqti ka dib. Sidee buu qofku u dooranayaa algorithm saxda ah si uu uga faa'iidaysto xogta la siiyay?
- 5. Sidee ayay ku kala duwan yihiin wada jirka iyo isku xidhnaanta?
- 6. Barashada mashiinka, maxay ka dhigan tahay kooxdu?
- 7. Waa maxay algorithm barashada mashiinka aad doorbidayso?
- 8. Dib u noqoshada toosan ee Barashada Mashiinka: Waa maxay?
- 9. Sharaxaad ka bixi faraqa u dhexeeya KNN iyo k-macnaha ururinta.
- 10. Waa maxay macnaha "eexda doorashada" adiga?
- 11. Waa maxay dhab ahaan Bayes' Theorem?
- 12. Qaabka Barashada Mashiinka, waa maxay 'Set training' iyo 'Set Test'?
- 13. Waa maxay mala-awaalka ku jira Barashada Mashiinka?
- 14. Maxay ka dhigan tahay barashada mashiinka ku habboonaanta, sideese looga hortagi karaa?
- 15. Maxay yihiin kalasaarayaasha Naive Bayes?
- 16. Waa maxay macnaha Hawlaha Kharashka iyo Hawlaha Luminta?
- 17. Maxaa ka sooca tusaalaha wax-soo-saarka iyo qaabka takoorka?
- 18. Sharaxaad ka bixi kala duwanaanshaha u dhexeeya nooca I iyo nooca II.
- 19. Barashada mashiinka, waa maxay farsamada barashada Isku-dhafka?
- 20. Maxay yihiin moodooyinka parametrics? Tusaale ahaan.
- 21. Sharaxaad ka bixi shaandhaynta wada shaqaynta leh. Sidoo kale shaandhaynta nuxurka ku salaysan?
- 22. Maxaad uga jeeddaa taxanaha wakhtiga?
- 23. Sharaxaad ka bixi kala duwanaanshaha u dhexeeya Kobcinta Gradient iyo Algorithms Forest Random.
- 24. Maxaad ugu baahan tahay matrix jahawareer? Waa maxay?
- 25. Waa maxay dhabta ah ee falanqaynta qaybta mabda'a?
- 26. Waa maxay sababta wareejinta qaybtu ay aad muhiim ugu tahay PCA
- 27. Sidee joogtaynta iyo habaynta u kala duwan yihiin midba midka kale?
- 28. Sidee bay caadiyaynta iyo habaynta uga duwan yihiin midba midka kale?
- 29. Waa maxay macnaha dhabta ah ee "cunsurka sicir bararka"?
- 30. Iyada oo ku saleysan xajmiga goobta tababarka, sidee ayaad u dooran kartaa kala-soocida?
- 31. Waa maxay algorithm ee barashada mashiinka waxaa loogu yeeraa "barte caajis ah" iyo sababta?
- 32. Waa maxay ROC Curve iyo AUC?
- 33. Waa maxay hyperparameters? Maxaa ka dhigaya kuwo ka duwan cabbirada moodeelka?
- 34. Waa maxay dhibcaha F1, xasuusinta, iyo saxnaanta macnaheedu?
- 35. Waa maxay xaqiiqadu tahay iskutallaabtu?
- 36. Aynu nidhaahno waxaad ogaatay in moodelkaaga uu leeyahay farqi weyn. Waa maxay algorithm, sidaad u malaynayso, ee ugu habboon in lagu xalliyo xaaladdan?
- 37. Maxaa ka sooca dib u noqoshada Ridge iyo dib u noqoshada Lasso?
- 38. Keebaa ka muhiimsan: waxqabadka moodeelka ama saxnaanta moodeelka? Midkee iyo maxaad u eexan doontaa?
- 39. Sideed u maareyn lahayd xog-ururin leh sinnaan la'aan?
- 40. Sideed u kala saari kartaa kor u qaadida iyo boorsada?
- 41. Sharax farqiga u dhexeeya barashada firfircoonida iyo ka-goynta.
- Ugu Dambeyn
Ganacsiyadu waxay isticmaalayaan tignoolajiyada casriga ah, sida sirdoonka macmalka ah (AI) iyo barashada mashiinka, si loo kordhiyo helitaanka macluumaadka iyo adeegyada shaqsiyaadka.
Farsamooyinkan waxaa qaatay warshado kala duwan, oo ay ku jiraan bangiyada, maaliyadda, tafaariiqda, wax soo saarka, iyo daryeelka caafimaadka.
Mid ka mid ah doorarka urureed ee aadka loo raadsado ee adeegsiga AI waa saynisyahannada xogta, injineerada sirta macmalka ah, injineerada barashada mashiinka, iyo falanqeeyayaasha xogta.
Boostada ayaa kugu hogaamin doonta noocyo kala duwan barashada mashiinka su'aalaha waraysiga, laga bilaabo aasaasiga ilaa kuwa adag, si ay kaaga caawiyaan inaad u diyaargarowdo su'aalo kasta oo lagu waydiin karo markaad raadinayso shaqadaada ugu fiican.
1. Sharax farqiga u dhexeeya barashada mashiinka, sirdoonka macmal, iyo barashada qoto dheer.
Sirdoonka macmalka ah waxay shaqaaleeyaan noocyo kala duwan oo ah barashada mashiinka iyo habab barasho qoto dheer oo u oggolaanaya nidaamyada kombuyuutarku inay fuliyaan hawlo ka faa'iidaysanaya sirdoon u eg bini'aadamka oo leh caqli-gal iyo xeerar.
Barashada mishiinku waxay isticmaashaa tirokoobyo kala duwan iyo habab barasho qoto dheer si ay ugu suurtogasho mishiinada inay wax ka bartaan wax qabadkoodii hore oo ay u noqdaan kuwo aad ugu karti badan inay qabtaan hawlaha qaarkood iyaga oo aan ilaalin bini'aadmi.
Learning Deep waa ururinta algorithms ee u oggolaanaya software-ku inuu wax ka barto naftiisa oo uu fuliyo hawlo ganacsi oo kala duwan, sida aqoonsiga codka iyo sawirka.
Nidaamyada soo bandhigaya muuqaalkooda badan shabakadaha neerfaha tiro aad u badan oo xog ah oo wax lagu baranayo ayaa awood u leh inay sameeyaan barasho qoto dheer.
2. Fadlan sharax noocyada kala duwan ee barashada mashiinka.
Barashada mishiinku waxay u jirtaa saddex nooc oo kala duwan si guud:
- Barashada La Kormeero: Qaabku wuxuu abuuraa saadaal ama xukunno isagoo isticmaalaya xogta ama xogta taariikhiga ah ee barashada mashiinka la kormeero. Xogta la calaamadeeyay ama la calaamadeeyay si macnahooda loo kordhiyo waxaa loo tixraacaa xog la sumadeeyay.
- Waxbarashada Aan La Ilaalin Lahayn: Ma hayno xog sumaysan waxbarashada aan la ilaalin. Xogta soo socota, moodeelku wuxuu heli karaa qaabab, khayaali, iyo isku xidhid.
- Xoojinta Waxbarashada: Qaabku wuu awoodaa baro adigoo isticmaalaya xoojinta barashada iyo abaalgudka ay ku heshay dhaqankeedii hore.
3. Waa maxay eexda iyo isdhaafsiga kala duwanaanshiyaha?
Ku-habboonaanta xad dhaafka ah waa natiijada eex, taas oo ah heerka uu moodalku ku habboon yahay xogta. Eexda waxaa sababa malo-awaal khaldan ama aad fudud oo adiga kugu jira algorithm barashada mashiinka.
Kala duwanaanshuhu waxa uu tilmaamayaa khaladaadka ay sababto kakanaanta ML-gaaga algorithm, kaas oo soo saara dareenka heerar waaweyn oo kala duwanaansho xogta tababarka iyo xad dhaafka ah.
Kala duwanaanshuhu waa inta moodalku u kala duwan yahay iyadoo ku xidhan agabka.
Si kale haddii loo dhigo, moodooyinka aasaasiga ahi aad bay u eexsan yihiin haddana deggan yihiin (kala duwanaansho hoose). Ku-habboonaanta xad dhaafka ah waa dhibaato moodooyinka kakan, in kasta oo ay si kastaba ha ahaatee qabtaan xaqiiqada moodeelka (eex hoose).
Si looga hortago kala duwanaanshaha sare iyo eexda labadaba, is-dhaafsiga u dhexeeya eexda iyo kala-duwanaanta ayaa lagama maarmaan u ah dhimista qaladka ugu fiican.
4. Algorithms barashada mashiinka ayaa si weyn u kobcay waqti ka dib. Sidee buu qofku u dooranayaa algorithm saxda ah si uu uga faa'iidaysto xogta la siiyay?
Farsamada barashada mashiinka ee ay tahay in la isticmaalo kaliya waxay kuxirantahay nooca xogta ku jirta xog gaar ah.
Marka xogtu tahay mid toosan, dib u noqoshada toosan ayaa la isticmaalaa. Habka boorsooyinka ayaa si fiican u fiicnaan lahaa haddii xogta ay muujiso mid aan toos ahayn. Waxaan u isticmaali karnaa geedaha go'aanka ama SVM haddii xogta ay tahay in la qiimeeyo ama loo fasiro ujeedooyin ganacsi.
Shabakadaha neerfaha ayaa laga yaabaa inay faa'iido u yeeshaan helitaanka jawaab sax ah haddii xogta xogta ay ku jirto sawiro, fiidiyowyo, iyo maqal.
Doorashada algorithm ee xaalad gaar ah ama xog ururin laguma samayn karo hal cabbir.
Hadafka lagu horumarinayo habka ugu habboon, waa in aan marka hore baarno xogta annaga oo adeegsanayna falanqaynta xogta sahaminta (EDA) oo aan fahanno yoolka ka faa'iidaysiga xogta.
5. Sidee ayay ku kala duwan yihiin wada jirka iyo isku xidhnaanta?
Isbahaysigu waxa uu qiimeeyaa sida ay labada doorsoome isugu xidhan yihiin midba midka kale iyo sida uu midba midka kale u bedeli karo jawaabta isbeddelada kan kale.
Haddii natiijadu noqoto mid togan, waxay muujinaysaa in xidhiidh toos ah ka dhexeeyo doorsoomayaasha iyo in mid ka mid ah kor u kici doono ama hoos u dhigi doono korodhka ama hoos u dhigista doorsoomaha saldhiga, iyada oo loo maleynayo in dhammaan xaaladaha kale ay joogto yihiin.
Xidhiidhku waxa uu cabbiraa xidhiidhka ka dhexeeya laba doorsoomeyaal random waxana uu leeyahay saddex qiyam oo kala duwan: 1, 0, iyo -1.
6. Barashada mashiinka, maxay ka dhigan tahay kooxdu?
Hababka wax barasho ee aan la kormeerin ee xogta kooxuhu isku daraan waxaa loo yaqaan koox-kooxeed. Marka la ururiyo dhibcaha xogta, farsamada kooxaynta ayaa lagu dabaqi karaa.
Waxaad u ururin kartaa dhammaan dhibcaha xogta sida ay u shaqeeyaan adiga oo isticmaalaya xeeladdan.
Tilmaamaha iyo tayada dhibcaha xogta ee isku qayb ah ayaa isku mid ah, halka kuwa dhibcaha xogta u dhacaya kooxo kala duwan ay kala duwan yihiin.
Habkan waxaa loo isticmaali karaa in lagu falanqeeyo xogta tirakoobka.
7. Waa maxay algorithm barashada mashiinka aad doorbidayso?
Su'aashan waxaad haysataa fursad aad ku muujiso dookhaaga iyo kartidaada gaarka ah, iyo sidoo kale aqoontaada dhamaystiran ee farsamooyinka barashada mashiinka.
Waa kuwan dhowr algorithms-barashada mashiinka caadiga ah si aad uga fikirto:
- Dib u noqosho toosan
- Dib-u-noqoshada saadka
- Bayeelo aan caqli lahayn
- Dhirta Go'aanka
- K macnaheedu waa
- Algorithm kaynta random
- Deriska K-ugu dhow (KNN)
8. Dib u noqoshada toosan ee Barashada Mashiinka: Waa maxay?
Algorithm barashada mashiinka la kormeero waa dib u noqoshada toosan.
Waxaa lagu shaqeeyaa falanqaynta saadaalinta si loo go'aamiyo xidhiidhka tooska ah ee ka dhexeeya doorsoomayaasha ku tiirsan iyo kuwa madaxbannaan.
Isla'egta regression toosan waa sida soo socota:
Y = A + BX
meesha:
- Wax gelinta ama doorsoome madax banaan waxa loo yaqaan X.
- Doorsoomaha ku-tiirsanaanta ama wax-soo-saarka waa Y.
- Iskuxidhka X waa b, dhexgalkeeduna waa a.
9. Sharaxaad ka bixi faraqa u dhexeeya KNN iyo k-macnaha ururinta.
Farqiga aasaasiga ah ayaa ah in KNN (hab kala saarid, barasho la kormeero) ay u baahan tahay dhibco calaamadeysan halka k-macnaheedu aysan ahayn (kulanka algorithm, barasho aan la ilaalin).
Waxaad u kala saari kartaa xogta calaamadeysan meel aan calaamadeyn adiga oo isticmaalaya K-Neighbors. K-macneheedu waa kooxi waxay isticmaashaa celceliska masaafada u dhaxaysa dhibcaha si ay u bartaan sida loo ururiyo dhibcaha aan la calaamadin.
10. Waa maxay macnaha "eexda doorashada" adiga?
Eexda ku jirta marxaladda muunada ee tijaabada waxa sabab u ah khaladka tirakoobka.
Hal koox oo muunad ah ayaa si joogta ah loo doortaa kooxaha kale ee tijaabada ah natiijada khaladka.
Haddii eexda xulashada aan la aqoonsan, waxay keeni kartaa gabagabo khaldan.
11. Waa maxay dhab ahaan Bayes' Theorem?
Markaan ka warqabno itimaalka kale, waxaan go'aamin karnaa itimaalka anagoo adeegsanayna Bayes' Theorem. Waxay bixisaa suurtogalnimada dambe ee dhacdo ku salaysan xog hore, si kale haddii loo dhigo.
Habka dhawaaqa ee lagu qiyaasi karo ixtimaalka shuruudaysan waxa bixiyay aragtidan.
Marka la samaynayo kala soocidda dhibaatooyinka qaabaynta saadaalinta iyo ku habboonaanta tusaalaha tababarka xogta ku jirta barashada mashiinka, Bayes 'aragtida waa la dabaqay (ie Naive Bayes, Bayes Best Classifier).
12. Qaabka Barashada Mashiinka, waa maxay 'Set training' iyo 'Set Test'?
Qaabka tababarka:
- Qaabka tababarku waxa uu ka kooban yahay tusaaleyaal loo soo diro tusaalaha si loo falanqeeyo loona barto.
- Tani waa xogta calaamadeysan ee loo isticmaali doono in lagu tababaro qaabka.
- Caadi ahaan, 70% wadarta xogta waxa loo isticmaalaa sida xogta tababarka.
Qaabka Tijaabada:
- Qalabka tijaabada waxaa loo isticmaalaa in lagu qiimeeyo saxnaanta jiilka moodeelka.
- Waxaan tijaabineynaa iyada oo aan la calaamadin xogta ka dibna isticmaal calaamadaha si aan u xaqiijino natiijooyinka.
- 30% soo hartay waxa loo istcimaalayaa xog-ururin ahaan.
13. Waa maxay mala-awaalka ku jira Barashada Mashiinka?
Barashada Mashiinku waxay awood u siisaa isticmaalka kaydka xogta ee jira si ay si fiican u fahmaan shaqada la bixiyay ee isku xidha wax soo saarka. Tan waxaa loo yaqaana qiyaasida shaqada.
Xaaladdan oo kale, qiyaasid waa in loo shaqeeyaa shaqada bartilmaameedka aan la garanayn si loo wareejiyo dhammaan indha-indheynta la fahmi karo oo ku salaysan xaaladda la bixiyay sida ugu wanaagsan ee suurtogalka ah.
Barashada mashiinka, mala-awaalku waa nooc ka caawiya qiimaynta shaqada la hiigsanayo iyo dhamaystirka khariidadaha wax-soo-saarka ku habboon.
Xulashada iyo naqshadeynta algorithms waxay u oggolaanayaan qeexida booska malo awaalka suurtagalka ah ee lagu matali karo qaab.
Hal mala awaal, xaraf yar oo h (h) ayaa la isticmaalayaa, laakiin raasamaal h (H) ayaa loo isticmaalaa dhamaan goobta mala awaalka ee la baarayo. Waxaan si kooban u eegi doonaa qoraaladan:
- Mala-awaal (h) waa nooc gaar ah oo fududeeya khariidaynta wax-soo-saarka, kaas oo ka dib loo isticmaali karo qiimaynta iyo saadaalinta.
- Qaabka mala-awaalka ah (H) waa meel la raadin karo oo mala awaal ah oo loo isticmaali karo in lagu sawiro wax-soo-saarka. Samaynta arrinta, moodeelka, iyo qaabaynta moodeelku waa dhawr tusaale oo xaddidaadyo guud ah.
14. Maxay ka dhigan tahay barashada mashiinka ku habboonaanta, sideese looga hortagi karaa?
Marka mishiinku isku dayo inuu wax ka barto xog-ururin aan ku filnayn, xad-dhaafku wuu dhacaa.
Natiijo ahaan, ku-habboonaanta xad-dhaafka ah waxay si liddi ku ah ugu xidhan tahay mugga xogta. Habka xaqiijinta-isku-tallaabta waxay u oggolaanaysaa ku-habboonaanta in laga fogaado kaydinta xogta yaryar. Dabeecadda xogta waxa loo kala qaybiyaa laba qaybood habkan.
Xogta imtixaanada iyo tababarka ayaa ka koobnaan doona labadan qaybood. Xogta tababarka waxaa loo isticmaalaa in lagu abuuro qaab, halka xogta tijaabada loo isticmaalo in lagu qiimeeyo qaabka iyadoo la isticmaalayo qalabyo kala duwan.
Tani waa sida looga hortagayo ku-xidhnaanta xad-dhaafka ah.
15. Maxay yihiin kalasaarayaasha Naive Bayes?
Hababka kala soocida ee kala duwan ayaa ka kooban kalasaarayaasha Naive Bayes. Algorithms-yada loo yaqaan kala-saarayaashan dhammaantood waxay ku shaqeeyaan fikrad isku mid ah.
Malaha ay sameeyeen kalasaarayaasha Bayes naive ayaa ah in hal sifo joogitaankiisa ama maqnaanshihiisa uusan raad ku lahayn joogitaanka ama maqnaanshaha sifo kale.
Si kale haddii loo dhigo, tani waa waxa aan u tixraacno "naive" maaddaama ay ka dhigayso malo ah in sifo kasta oo xog-ururin ah ay si siman muhiim u tahay oo madaxbannaan tahay.
Kala soocida waxaa lagu sameeyaa iyadoo la isticmaalayo kalasaarayaasha Bayes naive. Way fududahay in la isticmaalo oo waxay soo saaraan natiijooyin ka wanaagsan saadaasha kakan marka la eego go'aanka madax-bannaanida waa run.
Falanqaynta qoraalka, shaandhaynta spamka, iyo nidaamyada talada, waa la shaqeeyaa.
16. Waa maxay macnaha Hawlaha Kharashka iyo Hawlaha Luminta?
Weedha "shaqada lumis" waxay tilmaamaysaa habka xisaabinta luminta marka hal qayb oo xog ah la tixgeliyo.
Taa lidkeeda, waxaan u isticmaalnaa shaqada kharashka si aan u go'aamino wadarta guud ee khaladaadka xogta badan. Ma jiro farqi weyn oo jira.
Si kale haddii loo dhigo, halka hawlaha kharashku ay isu geeyaan faraqa u dhexeeya xogta tababarka oo dhan, hawlaha khasaaraha waxaa loogu talagalay inay qabtaan faraqa u dhexeeya qiimaha dhabta ah iyo kuwa la saadaaliyay ee hal diiwaan.
17. Maxaa ka sooca tusaalaha wax-soo-saarka iyo qaabka takoorka?
Qaabka takoorku waxa uu bartaa faraqa u dhexeeya dhawr qaybood oo xog ah. Moodeelka wax-soo-saarka ah wuxuu soo qaadaa noocyo kala duwan oo xog ah.
Dhibaatooyinka kala soocida, moodooyinka takoorku waxay inta badan ka sarreeyaan moodooyinka kale.
18. Sharaxaad ka bixi kala duwanaanshaha u dhexeeya nooca I iyo nooca II.
Dabeecadda beenta ah waxay hoos timaadaa qaybta khaladaadka Nooca I, halka khaladaadka beenta ah ay hoos yimaadaan khaladaadka Nooca II (iyaga oo sheeganaya waxba ma dhicin markii ay dhab ahaantii dhacday).
19. Barashada mashiinka, waa maxay farsamada barashada Isku-dhafka?
Farsamo loo yaqaan barashada isku-dhafka ah waxay isku daraysaa noocyo badan oo barashada mashiinka si ay u soo saaraan noocyo awood leh.
Qaabka waxaa lagu kala duwanaan karaa sababo kala duwan. Sababo dhowr ah ayaa ah:
- Dadweynaha Kala duwan
- Malo awaal kala duwan
- Hababka kala duwan ee moodaynta
Waxaan la kulmi doonaa arrin inta aan isticmaaleyno xogta tababarka iyo tijaabinta tusaalaha. Eexda, kala duwanaanshaha, iyo khaladka aan la soo koobi karin ayaa ah noocyada suurtagalka ah ee khaladkan.
Hadda, waxaan ugu yeernaa dheelitirka u dhexeeya eexda iyo kala duwanaanshiyaha tusaalaha ah ganacsiga eexda-kala duwanaanshaha, waana inuu had iyo jeer jiraa. Ganacsigan waxaa lagu dhammeeyaa adeegsiga barashada isku-dhafka ah.
Inkasta oo ay jiraan habab isku dhafan oo kala duwan oo la heli karo, waxaa jira laba xeeladood oo caadi ah oo la isku daro noocyo badan:
- Habka waddaniga ah ee loo yaqaan bagging waxay isticmaashaa shaxda tababarka si ay u soo saarto tababaro dheeraad ah.
- Kobcinta, farsamo aad u casrisan: Si la mid ah boorsooyinka, kobcinta ayaa loo isticmaalaa in lagu helo qaacidada miisaanka ugu habboon ee tababarka.
20. Maxay yihiin moodooyinka parametrics? Tusaale ahaan.
Waxaa jira qiyaas xadidan oo ku jira moodooyinka parametric. Si loo saadaaliyo xogta, waxa kaliya ee aad u baahan tahay inaad ogaato waa cabbirada moodeelka.
Kuwa soo socdaa waa tusaalayaal caadi ah: dib-u-celinta saadka, dib-u-celinta tooska ah, iyo SVM-yada toosan. Moodooyinka aan parametric-ka ahayn waa dabacsanaan maadaama ay ka koobnaan karaan tiro aan xadidnayn oo cabbirro ah.
Qiyaasta qaabka iyo heerka xogta la arkay ayaa looga baahan yahay saadaasha xogta. Waa kuwan tusaalooyin caadi ah: moodooyinka mawduuca, geedo go'aan, iyo k-dariska ugu dhow.
21. Sharaxaad ka bixi shaandhaynta wada shaqaynta leh. Sidoo kale shaandhaynta nuxurka ku salaysan?
Habka la isku dayay oo run ah ee lagu abuurayo soo jeedinta nuxurka ku habboon waa shaandhayn wada shaqayneed.
Nooc ka mid ah nidaamka talo bixinta ee loo yaqaan shaandhaynta wada shaqaynta ayaa saadaalisa walxo cusub iyadoo la isku dheelitirayo dookhyada isticmaalaha iyo danaha la wadaago.
Dookhyada isticmaaleyaashu waa shayga kaliya ee nidaamyada la-talinta ku salaysan nuxurku ay tixgeliyaan. Iyada oo la eegayo doorashadi hore ee isticmaaluhu, talooyinka cusub ayaa laga bixiyaa walxaha la xidhiidha.
22. Maxaad uga jeeddaa taxanaha wakhtiga?
Taxane wakhtigu waa ururin tirooyin u kala horreeyaan. Muddo wakhti go'an lagu jiro, waxay la socotaa dhaqdhaqaaqa dhibcaha xogta ee la doortay waxayna si joogto ah u qabataa dhibcaha xogta.
Ma jiro wax galin ugu yar ama ugu badnaan wakhtiga taxanaha wakhtiga.
Taxanaha wakhtiga waxaa inta badan isticmaala falanqeeyayaasha si ay u falanqeeyaan xogta si waafaqsan shuruudahooda gaarka ah.
23. Sharaxaad ka bixi kala duwanaanshaha u dhexeeya Kobcinta Gradient iyo Algorithms Forest Random.
Kaymaha Random
- Tiro badan oo geedo go'aan ah ayaa la isku geeyaa dhamaadka waxaana loo yaqaan kaymo random.
- Halka kor u qaadista gradient-ku ay u soo saarto geed kasta si ka madax bannaan kuwa kale, kaynta random kaynta ayaa dhista geed kasta hal mar.
- Multiclass ogaanshaha shay si fiican ula shaqeeya kaymaha random.
Kobcinta si tartiib tartiib ah:
- Halka kaymaha random-ka ay ku biiraan geedaha go'aanka dhamaadka habka, Mishiinada Kobcinta Gradient waxay isku daraan iyaga bilowga.
- Haddii cabbirada si habboon loo hagaajiyo, kor u qaadista gradient waxay ka sarraysaa kaymaha random marka la eego natiijooyinka, laakiin maaha doorasho caqli badan haddii xogta xogta ay leedahay wax badan oo ka baxsan, cillado, ama buuq maadaama ay keeni karto in moodalku noqdo mid aad u fiican.
- Marka ay jirto xog aan dheeli tirneyn, maadaama ay jirto qiimeynta halista waqtiga-dhabta ah, kor u qaadida tartiib tartiib ayaa si fiican u shaqeysa.
24. Maxaad ugu baahan tahay matrix jahawareer? Waa maxay?
Jadwalka loo yaqaan matrix-ka wareerka, mararka qaarkood loo yaqaan matrix qaladka, ayaa si weyn loo isticmaalaa si loo muujiyo sida ugu wanaagsan ee qaabka kala soocida, ama kala soocida, uu u qabto xog tijaabo ah oo qiyamka dhabta ah loo yaqaan.
Waxay awood noo siinaysaa inaan aragno sida model ama algorithm u shaqeeyo. Waxay noo fududaynaysaa inaan ogaano isfaham la'aanta koorsooyinka kala duwan.
Waxay u adeegtaa sidii hab lagu qiimeeyo sida ugu wanaagsan ee model ama algorithm loo sameeyay.
Qaabka kala soocida saadaasha waxa lagu soo ururiyay matrix jahawareer ah. Calaamad kasta qiimaheeda tirinta ayaa loo isticmaalay in lagu kala saaro tirada guud ee saadaasha saxda ah iyo kuwa khaldan.
Waxay faahfaahin ka bixisa khaladaadka uu sameeyay kalasaaruhu iyo sidoo kale noocyada kala duwan ee khaladaadka ay keenaan kalasaarayaashu.
25. Waa maxay dhabta ah ee falanqaynta qaybta mabda'a?
Iyadoo la yareynayo tirada doorsoomayaasha ee isku xiran, ujeedadu waa in la yareeyo cabbirka xog ururinta. Laakiin waxaa muhiim ah in la ilaaliyo kala duwanaanshaha inta ugu badan ee suurtogalka ah.
Doorsoomayaasha waxa loo beddelaa qayb cusub oo doorsoomayaal ah oo loo yaqaan qaybaha aasaasiga ah.
Kumbuyuutarradani waa kuwo orthogonal ah maadaama ay yihiin eigenvectors matrix isku-dhafan.
26. Waa maxay sababta wareejinta qaybtu ay aad muhiim ugu tahay PCA
Wareega ayaa muhiim u ah PCA-ga sababtoo ah waxay wanaajisaa kala soocida kala duwanaanshaha ay heleen qayb kasta, taasoo ka dhigaysa tarjumaada qaybaha mid fudud.
Waxaan u baahannahay qaybo la dheereeyey si aan u muujinno kala duwanaanshiyaha qaybaha haddii qaybaha aan la beddelin.
27. Sidee joogtaynta iyo habaynta u kala duwan yihiin midba midka kale?
Caadiyan
Xogta waa la beddelaa inta lagu jiro caadi. Waa inaad caadi ka dhigtaa xogta haddii ay leedahay miisaan aad u kala duwan, gaar ahaan kuwa hoose ilaa kuwa sare. Hagaajin tiir kasta si tirakoobyada aasaasiga ah ay u wada socdaan.
Si loo hubiyo in aysan jirin lumin saxnaanta, tani waxay noqon kartaa mid waxtar leh. Ogaanshaha calaamadda iyadoo la iska indhatirayo buuqa waa mid ka mid ah ujeedooyinka tababarka moodeelka.
Waxaa jirta fursad ah in si xad dhaaf ah loo rakibo haddii qaabka la siiyo koontarool dhamaystiran si loo yareeyo khaladka.
Joogteynta:
Joogteynta, shaqada saadaasha waa la beddelaa. Tani waxay ku xiran tahay xoogaa xakameyn ah iyada oo loo marayo habayn, kaas oo door bidaaya hawlaha ku habboon ee fudud kuwa adag.
28. Sidee bay caadiyaynta iyo habaynta uga duwan yihiin midba midka kale?
Labada farsamo ee aadka loo isticmaalo ee lagu cabiro muuqaalku waa caadiyaynta iyo jaangooynta.
Caadiyan
- Dib-u-habaynta xogta si ay ugu habboonaato baaxadda [0,1] waxaa loo yaqaannaa caadi.
- Marka dhammaan cabbirada ay tahay inay lahaadaan miisaan togan oo isku mid ah, caadiyeyntu way caawinaysaa, laakiin xog-ururinta xogta ayaa lumaya.
Joogteynta:
- Xogta ayaa dib loo miisaamay si ay u yeelato celceliska 0 iyo weecashada caadiga ah ee 1 taas oo qayb ka ah habka jaangooyooyinka (kala duwanaanshaha cutub)
29. Waa maxay macnaha dhabta ah ee "cunsurka sicir bararka"?
Saamiga kala duwanaanshaha moodeelka iyo kala duwanaanshaha moodeelka oo leh hal doorsoome madaxbannaan oo keliya ayaa loo yaqaan 'variation inflation factor (VIF).
VIF waxay qiyaastay tirada collinearity-ka badan ee ku jira doorsoomayaal badan oo dib u noqosho ah.
Kala duwanaanshaha moodeelka (VIF) ee leh Hal Kala duwanaansho Madaxbanaan
30. Iyada oo ku saleysan xajmiga goobta tababarka, sidee ayaad u dooran kartaa kala-soocida?
Eexda sare, qaabka kala duwanaanshiyaha hooseeya ayaa si fiican uga shaqeeya tababarka gaaban maadaama ay aad u yar tahay. Naive Bayes waa hal tusaale.
Si loo matalo isdhexgalka ka adag ee tababarka ballaaran, qaab leh eex yar iyo kala duwanaansho sare ayaa la door bidaa. Dib u noqoshada saadka ayaa tusaale wanaagsan ah.
31. Waa maxay algorithm ee barashada mashiinka waxaa loogu yeeraa "barte caajis ah" iyo sababta?
Barte caajis ah, KNN waa algorithm barashada mashiinka. Sababtoo ah K-NN waxay si firfircoon u xisaabisaa masaafada mar kasta oo ay rabto inay kala saarto halkii ay ka baran lahayd wax kasta oo mashiinku bartay qiyamka ama doorsoomayaasha xogta tababarka, waxay xafiddaa xogta tababarka.
Tani waxay K-NN ka dhigaysaa arday caajis ah.
32. Waa maxay ROC Curve iyo AUC?
Waxqabadka qaabka kala-soocidda ee dhammaan marinnada waxaa u taagan garaaf ahaan qalooca ROC. Waxay leedahay qiime togan oo run ah iyo shuruudo qiime togan oo been ah.
Si fudud loo dhigo, aagga ka hooseeya qalooca ROC waxaa loo yaqaan AUC (Aagga Hoosta ROC Curve). Aagga laba-geesoodka ah ee qalooca ROC laga bilaabo (0,0) ilaa AUC waa la cabbiraa (1,1). Qiimaynta moodooyinka kala-soocidda binary-ga, waxa loo shaqeeyaa sidii tirakoob hawleed.
33. Waa maxay hyperparameters? Maxaa ka dhigaya kuwo ka duwan cabbirada moodeelka?
Doorsoomayaasha gudaha ee moodeelka waxa loo yaqaan cabbirka moodeelka. Isticmaalka xogta tababarka, qiimaha halbeeggu waa la qiyaasaa.
Aan la garanayn qaabka, hyperparameter waa doorsoome. Qiimaha laguma go'aamin karo xogta, sidaas awgeed inta badan waxaa loo shaqeeyaa si loo xisaabiyo cabbirrada moodeelka.
34. Waa maxay dhibcaha F1, xasuusinta, iyo saxnaanta macnaheedu?
Cabbirka jaahwareerka ayaa ah cabbirka la isticmaalo si loo cabbiro waxtarka qaabka kala soocidda. Weedhahan soo socda ayaa loo isticmaali karaa in si wanaagsan loo sharaxo mitirka wareerka:
TP: Wanaagsanaanta Dhabta ah - Kuwani waa qiyamka togan ee sida saxda ah loo saadaaliyay. Waxay soo jeedinaysaa in qiyamka fasalka la saadaaliyay iyo fasalka dhabta ah labaduba ay yihiin kuwo wanaagsan.
TN: Negatives Run- Kuwani waa qiyamka xun ee sida saxda ah loo saadaaliyay. Waxay soo jeedinaysaa in qiimaha fasalka dhabta ah iyo fasalka la filayo labadaba ay yihiin kuwo taban.
Qiyamyadan—waxyaalahan beenta ah iyo xumaanta beenta ah—waxay dhacaan marka fasalkaaga dhabta ahi uu ka duwan yahay fasalka la filayo.
Hadda,
Saamiga heerka togan ee dhabta ah (TP) ee dhammaan indha-indhaynta lagu sameeyay fasalka dhabta ah waxa loo yaqaan dib-u-eegis, oo sidoo kale loo yaqaano xasaasiga.
Soo celinta waa TP/(TP+FN).
Saxnaanta waa cabbirka qiimaha saadaasha togan, kaas oo isbarbar dhigaya tirada togan ee moodelku runtii saadaaliyo inta saxan ee saxda ah ee uu si sax ah u saadaaliyo.
Saxnimadu waa TP/(TP + FP)
Halbeegga waxqabadka ugu fudud ee la fahmi karo waa saxsanaanta, taas oo ah kaliya saamiga sida saxda ah loo saadaaliyay ee dhammaan indha-indheynta.
Saxnimadu waxay la mid tahay (TP+TN)/(TP+FP+FN+TN).
Saxnaanta iyo dib u yeerinta ayaa la miisaamay oo la isku celceliyay si loo bixiyo buundada F1. Natiijo ahaan, dhibcahani waxay tixgelinayaan labadaba wanaagga beenta ah iyo kuwa beenta ah labadaba.
F1 inta badan aad ayuu uga qiimo badan yahay saxsanaanta, gaar ahaan haddii aad leedahay qayb qaybin aan sinnayn, xitaa haddii dareen ahaan aysan u fududayn in la fahmo sida saxda ah.
Saxnimada ugu wanagsan waxaa la helaa marka qiimaha been abuurka iyo xumaanta beenta ah la is barbar dhigo. Way fiicantahay in lagu daro Precision iyo Recall labadaba haddii kharashyada la xiriira wanaagga beenta ah iyo xumaanta beenta ah ay si weyn u kala duwan yihiin.
35. Waa maxay xaqiiqadu tahay iskutallaabtu?
Habka dib-u-qaabaynta tira-koobka ee loo yaqaan iskutallaabta-xaqiijinta ee barashada mashiinka ayaa shaqaalaysa dhowr qaybood oo xog-hoosaad ah si ay u tababaraan oo ay u qiimeeyaan algorithm barashada mashiinka tiro wareegyo ah.
Dufc cusub oo xog ah oo aan loo isticmaalin in lagu tababaro moodeelka ayaa la tijaabiyay iyada oo la isticmaalayo iskutallaabta si loo arko sida uu qaabku u saadaaliyay. Ku-habboonaanta xogta waxaa looga hortagayaa hubinta.
K- laab Habka dib-u-qaadista ee inta badan la isticmaalo ayaa u kala qaybisa kaydka xogta oo dhan K oo cabbir siman ah. Waxa loo yaqaan isku-tallaabta.
36. Aynu nidhaahno waxaad ogaatay in moodelkaaga uu leeyahay farqi weyn. Waa maxay algorithm, sidaad u malaynayso, ee ugu habboon in lagu xalliyo xaaladdan?
Maareynta kala duwanaanshiyaha sare
Waa inaan u isticmaalnaa farsamada boorsada dhibaatooyinka leh kala duwanaansho weyn.
Tusaalaha soo noqnoqda ee xogta random-ka waxa isticmaali doona algorithmamka bagging si ay xogta ugu qaybiyaan kooxo-hoosaadyo. Marka xogta la qaybsado, waxaan isticmaali karnaa xogta aan tooska ahayn iyo hab tababar gaar ah si loo soo saaro xeerar.
Intaa ka dib, codbixinta waxaa loo isticmaali karaa in la isku daro saadaasha moodeelka.
37. Maxaa ka sooca dib u noqoshada Ridge iyo dib u noqoshada Lasso?
Laba hab oo si weyn loo isticmaalo waa Lasso (oo sidoo kale loo yaqaan L1) iyo Ridge (mararka qaarkood loo yaqaan L2) dib u noqoshada. Waxaa loo isticmaalaa si looga hortago xad dhaafka xogta.
Si loo ogaado xalka ugu fiican oo loo yareeyo kakanaanta, farsamooyinkan ayaa la adeegsadaa si loo ciqaabo isku-dhafka. Iyadoo la ciqaabayo wadarta qiimaha saxda ah ee iskuxirayaasha, dib u noqoshada Lasso ayaa shaqeysa.
Shaqada ciqaabta ee Ridge ama L2 regression waxaa laga soo qaatay wadarta labajibbaaran ee iskuxirayaasha.
38. Keebaa ka muhiimsan: waxqabadka moodeelka ama saxnaanta moodeelka? Midkee iyo maxaad u eexan doontaa?
Tani waa su'aal khiyaano leh, markaa waa in marka hore la fahmo waxa waxqabadka Model yahay. Haddii waxqabadka lagu qeexo xawaaraha, markaa waxay ku tiirsan tahay nooca codsiga; codsi kasta oo ku lug leh xaalad-waqtiga dhabta ah waxay u baahan doontaa xawaare sare oo ah qayb muhiim ah.
Tusaale ahaan, Natiijooyinka Raadinta ee ugu fiican waxay noqon doonaan kuwo aan qiimo lahayn haddii natiijadu ay qaadato wakhti dheer si ay u timaado.
Haddii Waxqabadka loo isticmaalo sabab caddayn ah sababta saxda ah iyo dib-u-celinta waa in la kala hormariyaa saxnaanta sare, markaa dhibcaha F1 ayaa ka faa'iido badan doona saxnaanta muujinta kiiska ganacsiga ee xog kasta oo aan dheellitirnayn.
39. Sideed u maareyn lahayd xog-ururin leh sinnaan la'aan?
Xog ururin aan dheeli tirnayn ayaa ka faa'iidaysan kara farsamooyinka muunadeynta. Muunad-samaynta waxa loo samayn karaa qaab hoosaysan ama qaab ka badan.
Marka la eego muunada ayaa noo ogolaanaysa inaan yareyno xajmiga fasalka intiisa badan si uu u dhigmo fasalka laga tirada badan yahay, kaas oo gacan ka geysanaya kor u kaca xawaaraha marka la eego kaydinta iyo fulinta waqtiga-waqtiga laakiin sidoo kale waxay keeni kartaa luminta xogta qiimaha leh.
Si loo xaliyo arrinta luminta macluumaadka ee ay sababtay saami-qaybsiga xad-dhaafka ah, waxaanu kor u qaadaynaa fasalka dadka laga tirada badan yahay; si kastaba ha ahaatee, tani waxay nagu keentaa in aan u gudubno arrimo xad dhaaf ah.
Xeelado dheeri ah waxaa ka mid ah:
- Ku-saleysan Koox-kooxeedka- Tusaalooyinka fasalka laga tirada badan yahay iyo inta badan waxaa si gaar ah loogu sammeeyaa K-macnaha farsamada ururinta xaaladdan. Tan waxaa loo sameeyaa si loo helo kutlada xogta. Kadibna, koox kastaa waa la miisaamayaa si ay dhammaan fasaladu u yeeshaan cabbir isku mid ah oo dhammaan kooxaha ku jira fasalka ay leeyihiin tiro isleeg oo tusaale ah.
- SMOTE: Farsamada Saamaynta Saamaynta Badan ee Dadka Laga Tirada Badan Yahay- Qayb ka mid ah xogta fasalka laga tirada badan yahay ayaa loo adeegsadaa tusaale ahaan, ka dib waxaa la soo saaraa tusaaleyaal dheeraad ah oo macmal ah oo u dhigma oo lagu daro xogta asalka ah. Habkani wuxuu si fiican ula shaqeeyaa dhibcaha xogta tirada.
40. Sideed u kala saari kartaa kor u qaadida iyo boorsada?
Farsamooyinka Isku-dhafka ah waxay leeyihiin noocyo loo yaqaan boorsooyinka iyo xoojinta.
Boorsooyin -
Algorithms ee leh kala duwanaansho sare, boorsadu waa farsamo loo isticmaalo hoos u dhigista kala duwanaanshaha. Mid ka mid ah qoyska caynkaas ah ee u nugul eexda waa qoyska geedka go'aanka ah.
Nooca xogta ee go'aannada geedaha lagu tababaro ayaa saameyn weyn ku leh waxqabadkooda. Sababtan awgeed, xitaa haddii si fiican loo hagaajiyo, guud ahaan natiijooyinka ayaa mararka qaarkood aad u adag in la helo.
Haddii xogta tababarka geedaha go'aanka la beddelo, natiijadu aad bay u kala duwan tahay.
Natiijo ahaan, bacaha ayaa la isticmaalaa, kaas oo la abuurayo geedo go'aano badan, mid kasta oo ka mid ah waxaa lagu tababaray muunad xogta asalka ah, natiijada ugu dambeysana waa celceliska dhammaan noocyada kala duwan.
Kobcinta:
Kobcinta waa farsamada samaynta odoroska ee nidaamka n-taciifka ah kaas oo kalasaar kasta oo daciif ah uu ka dhigayo cilladaha kalasaarayaasheeda xooggan. Waxaan tixraacaynaa kalasaareeyaha si xun ugu shaqeeya xogta la bixiyay sida "classifier daciif ah."
Kobcinta sida cad waa hab aan ahayn algorithm. Dib-u-noqoshada saadka iyo geedaha go'aan-gacmeedku waa tusaalayaal caadi ah oo kala soocida daciifka ah.
Adaboost, Kordhinta Gradient, iyo XGBoost ayaa ah labada algorithm ee kobcinta ugu caansan, si kastaba ha ahaatee, waxaa jira qaar kaloo badan.
41. Sharax farqiga u dhexeeya barashada firfircoonida iyo ka-goynta.
Marka wax laga baranayo tusaale tusaaleyaal la arkay, moodalku waxa uu adeegsadaa barasho firfircooni ah si uu u gaadho gunaanad guud. Dhanka kale, barashada wax-ka-goynta, moodalku wuxuu isticmaalaa natiijada ka hor inta uusan samaysan tiisa.
Barashada firfircoonidu waa habka gunaanadka laga soo saaro indho-indheynta.
Barashada ka go'a waa habka abuurista indho-indheyn ku salaysan fikrado.
Ugu Dambeyn
Hambalyo! Kuwani waa 40-ka su'aalood ee ugu sarreeya iyo wixii ka sarreeya ee su'aalaha waraysiga ee barashada mashiinka oo aad hadda garanayso jawaabaha. Cilmiga xogta iyo sirdoonka macmal Shaqooyinku waxay sii ahaan doonaan baahida loo qabo marka tignoolajiyadu horumarto.
Musharixiinta cusboonaysiiya aqoontooda teknooloojiyadan casriga ah oo horumariya jaangooyooyinkooda xirfadeed waxay heli karaan fursado shaqo oo kala duwan oo leh lacag tartan ah.
Waxaad sii wadi kartaa ka jawaabista waraysiyada hadda oo aad si adag u fahantay sida looga jawaabo qaar ka mid ah su'aalaha waraysiga barashada mashiinka la isweyddiiyo.
Iyadoo ku xiran yoolalkaaga, qaado tillaabada soo socota. Isku diyaari waraysiyada adoo booqanaya Hashdork's Taxanaha Wareysiga.
Leave a Reply