Tafole ea likateng[Pata][Bontša]
- 1. Hlalosa phapang lipakeng tsa ho ithuta ka mochini, bohlale ba maiketsetso, le thuto e tebileng.
- 2. Ka kopo hlalosa mefuta e fapaneng ea ho ithuta ka mochine.
- 3. Ho na le tebello efe khahlanong le phapang ea khoebo?
- 4. Mekhoa ea ho ithuta ka mochine e fetohile haholo ha nako e ntse e ea. Ke joang motho a khethang algorithm e nepahetseng eo a ka e sebelisang ha a fuoa sete ea data?
- 5. Covariance le khokahano li fapana joang?
- 6. Thutong ea mochini, ho kopanya ho bolela eng?
- 7. Ke algorithm efe eo u e ratang ea ho ithuta ka mochini?
- 8. Ho fokotseha ha Linear ho Thuto ea Mochini: Ke Eng?
- 9. Hlalosa phapang lipakeng tsa KNN le k-means clustering.
- 10. "Khetho ea khetho" e bolela'ng ho uena?
- 11. Hantle-ntle Khopolo ea Bayes ke eng?
- 12. Ka Moetsong oa ho Ithuta oa Mochini, 'Set ea koetliso' le 'test Set' ke eng?
- 13. Khopolo-taba ea ho Ithuta ka Mechini ke Eng?
- 14. Ho sebelisa mochine ho feta tekano ho bolela eng, hona ho ka thibeloa joang?
- 15. Hantle-ntle lihlopha tsa Naive Bayes ke eng?
- 16. Mesebetsi ea Litšenyehelo le Mesebetsi ea Tahlehelo e bolela'ng?
- 17. Ke eng e khethollang mohlala oa tlhahiso ho mofuta oa khethollo?
- 18. Hlalosa phapang lipakeng tsa liphoso tsa Mofuta oa I le oa Mofuta oa II.
- 19. Thutong ea mochini, mokhoa oa ho ithuta oa Ensemble ke ofe?
- 20. Hantle-ntle mehlala ea parametric ke eng? Fana ka mohlala.
- 21. Hlalosa ho sefa ho kopanetsoeng. Hammoho le ho sefa ho latela litaba?
- 22. Hantle-ntle u bolela’ng ka letoto la Nako?
- 23. Hlalosa liphapang pakeng tsa likhakanyo tsa Gradient Boosting le Random Forest.
- 24. Ke hobane'ng ha u hloka matrix a pherekano? Ke eng?
- 25. Hantle-ntle tlhahlobo ea karolo ea molao-motheo ke eng?
- 26. Ke hobane'ng ha ho potoloha ha likarolo ho le bohlokoa haholo ho PCA (tlhahlobo ea karolo ea sehlooho)?
- 27. Ho tloaeleha le ho tloaeleha ho fapana joang?
- 28. Ho tloaeleha le ho etsa maemo ho fapane joang ho tse ling?
- 29. Hantle-ntle "variance inflation factor" e bolela'ng?
- 30. Ho latela boholo ba sete ea koetliso, u khetha motho ea khethollang lihlopha joang?
- 31. Ke algorithm efe thutong ea mochine e bitsoang "moithuti ea botsoa" hona hobane'ng?
- 32. ROC Curve le AUC ke eng?
- 33. Li-hyperparameter ke eng? Ke eng e etsang hore e be e ikhethang ho li-parameter tsa mohlala?
- 34. Lintlha tsa F1, hopola, le ho nepahala li bolela'ng?
- 35. Hantle-ntle netefatso ea sefapano ke eng?
- 36. Ha re re u fumane hore mohlala oa hau o na le phapang e kholo. Ke algorithm efe, ka maikutlo a hau, e loketseng haholo ho sebetsana le boemo bona?
- 37. Ke eng e khethollang ho fokotseha ha Ridge le ho fokotseha ha Lasso?
- 38. Ke efe ea bohlokoa ho feta: ts'ebetso ea mohlala kapa ho nepahala ha mohlala? Ke efe mme hobaneng o tla e rata?
- 39. U ka laola dataset joang ka ho se lekane?
- 40. U ka khetholla joang pakeng tsa boosting le bagging?
- 41. Hlalosa phapang lipakeng tsa thuto ea ho inductive (inductive) le thuto e fokolang.
- fihlela qeto e
Likhoebo li sebelisa theknoloji e tsoetseng pele, joalo ka bohlale ba maiketsetso (AI) le ho ithuta ka mochini, ho eketsa phihlello ea tlhahisoleseling le lits'ebeletso ho batho ka bomong.
Mahlale ana a ntse a amoheloa ke liindasteri tse fapaneng, ho kenyeletsoa libanka, lichelete, mabenkele, tlhahiso le tlhokomelo ea bophelo bo botle.
E 'ngoe ea mesebetsi e batloang ka ho fetesisa ea mokhatlo e sebelisang AI ke ea bo-ramahlale ba data, baenjiniere ba bohlale ba maiketsetso, baenjiniere ba ho ithuta ka mochini, le bahlahlobisisi ba data.
Poso ena e tla u etella pele ka mefuta e fapaneng ea ho ithuta mochine lipotso tsa lipuisano, ho tloha ho tsa motheo ho isa ho tse rarahaneng, ho u thusa ho itokisetsa lipotso leha e le life tseo u ka li botsoang ha u batla mosebetsi oa hau o loketseng.
1. Hlalosa phapang lipakeng tsa ho ithuta ka mochini, bohlale ba maiketsetso, le thuto e tebileng.
Bohlale ba Maiketsetso bo sebelisa mekhoa e fapaneng ea ho ithuta ka mochini le mekhoa e tebileng ea ho ithuta e lumellang litsamaiso tsa likhomphutha ho etsa mesebetsi e sebelisang bohlale bo kang ba motho ka mabaka le melao.
Ho ithuta ka mochini ho sebelisa lipalo-palo tse fapaneng le mekhoa ea ho Ithuta ho Tebileng ho thusa mechini ho ithuta ho tsoa ho ts'ebetso ea eona ea pele le ho ba le tsebo ea ho iketsetsa mesebetsi e itseng ntle le taolo ea motho.
Boithuto bo tebileng ke pokello ea li-algorithms tse lumellang software ho ithuta ho tsoa ho eona le ho etsa mesebetsi e fapaneng ea khoebo, joalo ka ho tseba lentsoe le litšoantšo.
Litsamaiso tse pepesang li-multilayered tsa tsona marangrang a neural ho bongata bo boholo ba data bakeng sa ho ithuta ba khona ho ithuta ka botebo.
2. Ka kopo hlalosa mefuta e fapaneng ea ho ithuta ka mochine.
Ho ithuta ka mochini ho teng ka mefuta e meraro e fapaneng ka bophara:
- Thuto e Laolehileng: Moetso o etsa likhakanyo kapa likahlolo ka ho sebelisa boitsebiso bo ngotsoeng kapa ba histori ho ithuta ka mochine. Lisebelisoa tsa data tse tšoailoeng kapa tse tšoailoeng ho eketsa moelelo oa tsona li bitsoa data e ngolisitsoeng.
- Ho Ithuta ho sa Lebelloa: Ha re na lintlha tse ngoliloeng bakeng sa thuto e sa laoleheng. Ho data e kenang, mohlala o ka fumana lipaterone, lintho tse sa tloaelehang, le likamano.
- Ho Ithuta ka Matlafatso: Mohlala o ka ithute ka ho sebedisa matlafatso ho ithuta le meputso eo e e fumaneng bakeng sa boitšoaro ba eona ba pele.
3. Ho na le tebello efe khahlanong le phapang ea khoebo?
Overfitting ke phello ea leeme, e leng tekanyo eo mohlala o lumellanang le data ka eona. Leeme le bakoa ke menahano e fosahetseng kapa e bonolo haholo ho uena algorithm ea ho ithuta mochini.
Phapang e bua ka liphoso tse bakoang ke ho rarahana ho algorithm ea hau ea ML, e hlahisang kutloisiso ho likhato tse kholo tsa phapang ea data ea koetliso le ho feta.
Phapang ke hore na mohlala o fapana hakae ho itšetlehile ka lisebelisoa.
Ka mantsoe a mang, mehlala ea mantlha e leeme haholo empa e tsitsitse (phapang e tlase). Overfitting ke bothata ka mehlala e rarahaneng, leha ba ntse ba hapa 'nete ea mohlala (leeme le tlase).
E le ho thibela ho fapana ho phahameng le leeme le phahameng, khoebo pakeng tsa leeme le phapang ea hlokahala bakeng sa phokotso e ntle ka ho fetisisa ea liphoso.
4. Mekhoa ea ho ithuta ka mochine e fetohile haholo ha nako e ntse e ea. Ke joang motho a khethang algorithm e nepahetseng eo a ka e sebelisang ha a fuoa sete ea data?
Mokhoa oa ho ithuta oa mochini o lokelang ho sebelisoa o ipapisitse le mofuta oa data ho dataset e itseng.
Ha data e le linear, ho sebelisoa linear regression. Mokhoa oa ho kenya mokotla o tla sebetsa hantle haeba data e bontša hore ha e lumellane. Re ka sebelisa lifate tsa liqeto kapa SVM haeba data e tlameha ho hlahlojoa kapa ho hlalosoa molemong oa khoebo.
Marang-rang a Neural a ka thusa ho fumana karabo e nepahetseng haeba dataset e kenyelletsa linepe, livideo le molumo.
Khetho ea algorithm bakeng sa boemo bo itseng kapa pokello ea data e ke ke ea etsoa ka tekanyo e le 'ngoe feela.
Bakeng sa sepheo sa ho theha mokhoa o nepahetseng ka ho fetesisa, re tlameha ho qala ka ho hlahloba data re sebelisa tlhahlobo ea data ea tlhahlobo (EDA) le ho utloisisa sepheo sa ho sebelisa dataset.
5. Covariance le khokahano li fapana joang?
Covariance e lekola hore na mefuta e 'meli e hokahane joang le hore na motho a ka fetoha joang ho latela liphetoho ho tse ling.
Haeba sephetho se le ntle, se bontša hore ho na le kamano e tobileng pakeng tsa mefuta-futa le hore motho o ne a tla phahama kapa a fokotsehe ka ho eketseha kapa ho fokotseha ha motheo oa motheo, ho nka hore maemo a mang kaofela a lula a le teng.
Kamano e lekanya kamano pakeng tsa mefuta e 'meli e sa tloaelehang 'me e na le litekanyetso tse tharo feela tse fapaneng: 1, 0, le -1.
6. Thutong ea mochini, ho kopanya ho bolela eng?
Mekhoa ea ho ithuta e sa behoang leihlo e kopanyang lintlha tsa data e bitsoa clustering. Ka pokello ea lintlha tsa data, mokhoa oa ho kopanya o ka sebelisoa.
U ka hlophisa lintlha tsohle tsa data ho latela mesebetsi ea tsona u sebelisa leano lena.
Likarolo le litšoaneleho tsa lintlha tsa data tse oelang sehlopheng se le seng li tšoana, athe tsa lintlha tsa data tse oelang ka lihlopha tse arohaneng li fapane.
Mokhoa ona o ka sebelisoa ho hlahloba lintlha tsa lipalo-palo.
7. Ke algorithm efe eo u e ratang ea ho ithuta ka mochini?
U na le monyetla oa ho bonts'a lintho tseo u li ratang le litalenta tse ikhethang potsong ena, hammoho le tsebo ea hau e felletseng ea mekhoa e mengata ea ho ithuta ka mochini.
Mona ke li-algorithms tse 'maloa tse tloaelehileng tsa ho ithuta mochini tseo u ka nahanang ka tsona:
- Phetoho e nyane
- Phetoho ea thepa
- Naïve Bayes
- Lifate tsa liqeto
- K e bolela
- Algorithm ea meru e sa reroang
- Moahelani oa K-haufi (KNN)
8. Ho fokotseha ha Linear ho Thuto ea Mochini: Ke Eng?
Algorithm e hlokometsoeng ea ho ithuta ka mochini ke ho fokotseha ha mela.
E sebelisoa ha ho hlahlojoa esale pele ho fumana hore na ho na le kamano pakeng tsa mefuta e itšetlehileng ka eona le e ikemetseng.
Linear regression equation e tjena:
Y = A + BX
moo:
- Phapang e kenang kapa e ikemetseng e bitsoa X.
- Phapang e itšetlehileng kapa e hlahisoang ke Y.
- Coefficient ea X ke b, 'me moeli oa eona ke a.
9. Hlalosa phapang lipakeng tsa KNN le k-means clustering.
Phapang ea mantlha ke hore KNN (mokhoa oa ho arola, thuto e hlokometsoeng) e hloka lintlha tse ngoliloeng athe k-means ha e (clustering algorithm, thuto e sa laoleheng).
U ka hlophisa data e ngolisitsoeng sebakeng se sa ngolisoang ka ho sebelisa K-Nearest Neighbors. K-means clustering e sebelisa sebaka se mahareng lipakeng tsa lintlha ho ithuta ho hlophisa lintlha tse sa ngoloang.
10. "Khetho ea khetho" e bolela'ng ho uena?
Leeme mokhahlelong oa lisampole oa liteko ke ka lebaka la ho se nepahale ha lipalo.
Sehlopha se le seng sa mohlala se khethoa hangata ho feta lihlopha tse ling tekong ka lebaka la ho se nepahale.
Haeba leeme la khetho le sa amoheloe, ho ka fella ka qeto e fosahetseng.
11. Hantle-ntle Khopolo ea Bayes ke eng?
Ha re tseba ka menyetla e meng, re ka tseba monyetla oa ho sebelisa Theorem ea Bayes. E fana ka monyetla oa morao-rao oa ketsahalo o ipapisitseng le litaba tsa pejana, ka mantsoe a mang.
Mokhoa o utloahalang oa ho hakanya menyetla ea maemo o fanoe ke khopolo ena.
Ha o ntse o theha mathata a ho etsa mohlala oa maemo a holimo le ho lokisa mohlala ho koetliso dataset ho ithuta ka mochini, ho sebelisoa theorem ea Bayes (e leng Naive Bayes, Bayes Optimal Classifier).
12. Ka Moetsong oa ho Ithuta oa Mochini, 'Set ea koetliso' le 'test Set' ke eng?
Sehlopha sa koetliso:
- Sehlopha sa lithupelo se na le maemo a romelloang ho mohlala bakeng sa ho hlahlojoa le ho ithuta.
- Ena ke data e ngotsoeng e tla sebelisoa ho koetlisa mohlala.
- Ka tloaelo, 70% ea kakaretso ea data e sebelisoa e le dataset ea koetliso.
Sehlopha sa Teko:
- Sete ea liteko e sebelisetsoa ho lekola bonnete ba tlhahiso ea moetso oa khopolo-taba.
- Re etsa liteko ntle le lintlha tse ngotsoeng ebe re sebelisa lileibole ho netefatsa liphetho.
- 30% e setseng e sebelisoa e le dataset ea liteko.
13. Khopolo-taba ea ho Ithuta ka Mechini ke Eng?
Ho Ithuta ka Mechini ho nolofalletsa tšebeliso ea li-dataset tse teng ho utloisisa hamolemo mosebetsi o itseng o hokahanyang tlhahiso le tlhahiso. Sena se tsejoa e le khakanyo ea tšebetso.
Tabeng ena, khakanyo e tlameha ho sebelisoa bakeng sa ts'ebetso e sa tsejoeng ea sepheo ho fetisa maikutlo ohle a ka nahanoang a ipapisitse le boemo bo fanoeng ka tsela e molemohali e ka khonehang.
Thutong ea mochine, khopolo-taba ke mohlala o thusang ho hakanya mosebetsi o lebeletsoeng le ho phethela 'mapa o nepahetseng oa ho kenya le ho tsoa.
Khetho le moralo oa li-algorithms li lumella tlhaloso ea sebaka sa menahano e ka khonehang e ka emeloa ke mohlala.
Bakeng sa khopolo-taba e le 'ngoe, ho sebelisoa litlhaku tse nyenyane h (h), empa capital h (H) e sebelisoa bakeng sa sebaka sohle sa khopolo-taba se ntseng se phenyekolloa. Re tla hlahloba lintlha tsena ka bokhutšoanyane:
- Khopolo-taba (h) ke mohlala o ikhethileng o thusang ho etsa 'mapa oa tlhahiso ho isa tlhahiso, e ka sebelisoang bakeng sa tlhahlobo le bonohe.
- Hypothesis set (H) ke sebaka se ka batlisisoang sa menahano e ka sebelisoang ho etsa 'mapa oa lintho tse hlahisoang. Moralo oa litaba, mohlala, le tlhophiso ea mohlala ke mehlala e seng mekae ea mefokolo e akaretsang.
14. Ho sebelisa mochine ho feta tekano ho bolela eng, hona ho ka thibeloa joang?
Ha mochine o leka ho ithuta ho tswa ho dataset e sa lekaneng, ho feta tekano ho etsahala.
Ka lebaka leo, overfitting e amana ka tsela e fapaneng le bophahamo ba data. Mokhoa oa ho netefatsa o lumella ho qojoa ho fetelletseng bakeng sa li-dataset tse nyane. Dataset e arotsoe likarolo tse peli ka mokhoa ona.
Lintlha tsa tlhahlobo le koetliso li tla ba le likarolo tsena tse peli. Lethathamo la data la koetliso le sebelisetsoa ho etsa mohlala, ha dataset ea liteko e sebelisetsoa ho lekola mohlala ho sebelisa lintlha tse fapaneng.
Ena ke mokhoa oa ho thibela ho feta tekano.
15. Hantle-ntle lihlopha tsa Naive Bayes ke eng?
Mekhoa e fapaneng ea ho arola e etsa lihlopha tsa Naive Bayes. Sehlopha sa li-algorithms tse tsejoang e le lihlopha tsena kaofela li sebetsa mohopolong o le mong oa mantlha.
Maikutlo a entsoeng ke li-classifiers tse se nang kelello tsa Bayes ke hore ho ba teng kapa ho ba sieo ha karolo e le 'ngoe ha ho ame boteng kapa ho ba sieo ha tšobotsi e' ngoe.
Ka mantsoe a mang, sena ke seo re se bitsang "naive" kaha se fana ka maikutlo a hore tšobotsi e 'ngoe le e' ngoe ea dataset e bohlokoa ka ho lekana ebile e ikemetse.
Khethollo e etsoa ho sebelisoa li-classifiers tse se nang kelello tsa Bayes. Li bonolo ho li sebelisa le ho hlahisa liphello tse molemo ho feta li-predictors tse rarahaneng ha motheo oa boipuso e le 'nete.
Litlhahlobong tsa mongolo, ho sefa spam, le litsamaiso tsa likhothaletso, lia sebelisoa.
16. Mesebetsi ea Litšenyehelo le Mesebetsi ea Tahlehelo e bolela'ng?
Poleloana "tahlehelo ea ts'ebetso" e bolela mokhoa oa ho lahleheloa ke komporo ha karolo e le 'ngoe feela ea data e eloa hloko.
Ka lehlakoreng le leng, re sebelisa mokhoa oa litšenyehelo ho fumana palo eohle ea liphoso bakeng sa lintlha tse ngata. Ha ho na phapang ea bohlokoa.
Ka mantsoe a mang, athe lits'ebetso tsa litšenyehelo li kopanya phapang bakeng sa dataset eohle ea koetliso, mesebetsi ea tahlehelo e etselitsoe ho fumana phapang lipakeng tsa boleng ba nnete le bo boletsoeng esale pele bakeng sa rekoto e le 'ngoe.
17. Ke eng e khethollang mohlala oa tlhahiso ho mofuta oa khethollo?
Mohlala oa khethollo o ithuta phapang pakeng tsa lihlopha tse 'maloa tsa data. Mofuta o ikhethileng o khetha mefuta e fapaneng ea data.
Mathateng a lihlopha, mefuta e khethollang hangata e feta mefuta e meng.
18. Hlalosa phapang lipakeng tsa liphoso tsa Mofuta oa I le oa Mofuta oa II.
Liphoso tsa bohata li oela tlas'a mofuta oa liphoso tsa Mofuta oa I, athe li-negatives tsa bohata li kena tlas'a liphoso tsa Mofuta oa II (ho bolela hore ha ho letho le etsahetseng ha e hlile e etsahetse).
19. Thutong ea mochini, mokhoa oa ho ithuta oa Ensemble ke ofe?
Mokhoa o bitsoang ensemble learning o kopanya mefuta e mengata ea ho ithuta ka mochini ho hlahisa mefuta e matla haholoanyane.
Mohlala o ka fapana ka mabaka a fapaneng. Mabaka a 'maloa ke:
- Baahi ba fapaneng
- Likhopolo Tse fapa-fapaneng
- Mekhoa e fapaneng ea mohlala
Re tla tobana le bothata ha re ntse re sebelisa lintlha tsa koetliso le liteko tsa mohlala. Leeme, phapang, le phoso e ke keng ea rarolloa ke mefuta e ka bang teng ea phoso ena.
Joale, re bitsa ho leka-lekana hona pakeng tsa leeme le ho se tšoane ka mokhoa oo e leng khoebo ea leeme, 'me e lokela ho lula e le teng. Khokahano ena e etsoa ka tšebeliso ea lithupelo tse kopaneng.
Le hoja ho na le mekhoa e fapaneng ea ho kopanya e fumanehang, ho na le mekhoa e 'meli e tloaelehileng ea ho kopanya mefuta e mengata:
- Mokhoa oa tlhaho o bitsoang bagging o sebelisa setsi sa koetliso ho hlahisa lihlopha tse eketsehileng tsa koetliso.
- Ho matlafatsa, mokhoa o tsoetseng pele haholoanyane: Joalo ka ho kenya mokotla, ho matlafatsa ho sebelisoa ho fumana mokhoa o nepahetseng oa boima bakeng sa sete ea boikoetliso.
20. Hantle-ntle mehlala ea parametric ke eng? Fana ka mohlala.
Ho na le palo e lekanyelitsoeng ea li-parameter mefuteng ea parametric. Ho bolela esale pele data, sohle seo u hlokang ho se tseba ke li-parameter tsa mohlala.
E latelang ke mehlala e tloaelehileng: ho fokotseha ha lintho, ho fokotseha ha linear, le li-SVM tsa mela. Mefuta e seng ea parametric e fetoha habonolo kaha e ka ba le palo e sa lekanyetsoang ea liparamente.
Litekanyetso tsa mohlala le boemo ba data e hlokometsoeng lia hlokahala bakeng sa likhakanyo tsa data. Mehlala e meng e tloaelehileng ke ena: mehlala ea sehlooho, lifate tsa liqeto, le baahelani ba k-haufi.
21. Hlalosa ho sefa ho kopanetsoeng. Hammoho le ho sefa ho latela litaba?
Mokhoa o lekiloeng le oa 'nete oa ho theha litlhahiso tse tsamaellanang le litaba ke ho sefa ka kopanelo.
Mokhoa oa likhothaletso o bitsoang collaborative filtering o bolela esale pele lisebelisoa tse ncha ka ho leka-lekanya likhetho tsa basebelisi le lithahasello tse arolelanoang.
Likhetho tsa basebelisi ke tsona feela tseo litsamaiso tse thehiloeng ho litaba li nahanang. Ka lebaka la likhetho tsa pele tsa mosebelisi, likhothaletso tse ncha li fanoa ho tsoa ho lisebelisoa tse amanang.
22. Hantle-ntle u bolela’ng ka letoto la Nako?
Letoto la nako ke pokello ea linomoro ka tatellano e nyolohang. Ka nako e behiloeng esale pele, e beha leihlo motsamao oa lintlha tse khethiloeng tsa data mme nako le nako e hapa lintlha tsa data.
Ha ho na bonyane kapa boholo ba nako e kenyellelitsoeng lethathamong la nako.
Hangata letoto la nako le sebelisoa ke bahlahlobisisi ho sekaseka lintlha ho latela litlhoko tsa bona tse ikhethang.
23. Hlalosa liphapang pakeng tsa likhakanyo tsa Gradient Boosting le Random Forest.
Random Forest:
- Palo e kholo ea lifate tsa liqeto li kopantsoe hammoho qetellong 'me li tsejoa e le meru e sa reroang.
- Le hoja ho eketseha ha gradient ho hlahisa sefate se seng le se seng ntle le tse ling, moru o sa reroang o haha sefate se seng le se seng ka nako.
- Multiclass ho lemoha ntho e sebetsa hantle ka meru e sa reroang.
Ho eketsa Gradient:
- Ha meru e sa reroang e kopanya lifate tsa liqeto qetellong ea ts'ebetso, Mechini ea Gradient Boosting e li kopanya ho tloha qalong.
- Haeba li-parameter li ka lokisoa ka nepo, ho phahama ho hoholo ho feta meru e sa reroang ho latela liphetho, empa ha se khetho e bohlale haeba sete ea data e na le lintho tse ngata tse kantle, tse sa hlakang, kapa lerata kaha e ka etsa hore mohlala o fete.
- Ha ho na le data e sa leka-lekaneng, joalo ka ha ho na le tlhahlobo ea kotsi ea nako ea nnete, ho nyolla ha gradient ho sebetsa hantle.
24. Ke hobane'ng ha u hloka matrix a pherekano? Ke eng?
Tafole e tsejoang e le confusion matrix, eo ka linako tse ling e tsejoang e le matrix ea liphoso, e sebelisoa haholo ho bonts'a hore na mofuta oa lihlopha, kapa classifier, o sebetsa hantle hakae ho sete ea data ea liteko eo boleng ba 'nete bo tsejoang ka bona.
E re thusa ho bona hore na mohlala kapa algorithm e sebetsa joang. Ho etsa hore ho be bonolo ho rona ho bona ho se utloisisane har'a lithuto tse fapaneng.
E sebetsa e le mokhoa oa ho lekola hore na mohlala kapa algorithm e etsoa hantle hakae.
Likhakanyo tsa mofuta oa sehlopha li bokelloa ho ba matrix a pherekano. Lipalo tsa palo tsa sehlopha ka seng li ile tsa sebelisoa ho arola kakaretso ea likhakanyo tse nepahetseng le tse fosahetseng.
E fana ka lintlha tse mabapi le liphoso tse entsoeng ke mohlophisi hammoho le mefuta e fapaneng ea liphoso tse bakoang ke lihlopha.
25. Hantle-ntle tlhahlobo ea karolo ea molao-motheo ke eng?
Ka ho fokotsa palo ea lintho tse fapaneng tse amanang le tse ling, sepheo ke ho fokotsa boholo ba pokello ea data. Empa ke habohlokoa ho boloka mefuta-futa ka hohle kamoo ho ka khonehang.
Liphetoho li fetoloa ho ba sete e ncha ka ho feletseng ea mefuta e bitsoang principal components.
Li-PC tsena li na le li-orthogonal kaha ke li-eigenvector tsa covariance matrix.
26. Ke hobane'ng ha ho potoloha ha likarolo ho le bohlokoa haholo ho PCA (tlhahlobo ea karolo ea sehlooho)?
Ho potoloha ho bohlokoa ho PCA hobane e ntlafatsa karohano lipakeng tsa liphapang tse fumanoang ke karolo ka 'ngoe, ho etsa hore tlhaloso ea karolo e be bonolo.
Re hloka likarolo tse atolositsoeng ho hlahisa phapang ea likarolo haeba likarolo li sa fetoloe.
27. Ho tloaeleha le ho tloaeleha ho fapana joang?
Tloaelo:
Lintlha li fetoloa nakong ea ho tloaeleha. U lokela ho etsa hore data e tloaelehe haeba e na le litekanyo tse fapaneng haholo, haholo-holo ho tloha tlaase ho ea holimo. Fetola kholomo ka 'ngoe e le hore lipalo-palo tsa mantlha li tsamaisane.
Ho netefatsa hore ha ho na tahlehelo ea ho nepahala, sena se ka ba molemo. Ho lemoha pontšo ha u ntse u hlokomoloha lerata ke e 'ngoe ea merero ea koetliso ea mohlala.
Ho na le monyetla oa ho fetela holimo haeba mohlala o fuoa taolo e feletseng ho fokotsa phoso.
Regularization:
Ka tloaelo, mosebetsi oa ho bolela esale pele oa fetoloa. Sena se tlas'a taolo e itseng ka ho etsa maemo a tloaelehileng, a ratang mesebetsi e bonolo ho feta e rarahaneng.
28. Ho tloaeleha le ho etsa maemo ho fapane joang ho tse ling?
Mekhoa e 'meli e sebelisoang haholo bakeng sa ho lekanya likarolo ke ho tloaeleha le ho etsa maemo.
Tloaelo:
- Ho khutlisa data ho lumellana le [0,1] ho tsejoa e le ho tloaeleha.
- Ha liparamente tsohle li tlameha ho ba le sekala se ts'oanang se nepahetseng, ho tloaeleha hoa thusa, empa li-outliers tsa data set li lahlehile.
Regularization:
- Lintlha li khutlisetsoa ho ba le moelelo oa 0 le ho kheloha ho tloaelehileng ha 1 e le karolo ea ts'ebetso ea maemo (ho fapana ha likarolo)
29. Hantle-ntle "variance inflation factor" e bolela'ng?
Karo-karolelano ea phapang ea mohlala ho phapang ea mohlala o nang le phapang e le 'ngoe feela e ikemetseng e tsejoa e le variation inflation factor (VIF).
VIF e hakanya palo ea multicollinearity e teng ka har'a sehlopha sa mefuta e mengata ea regression.
Phapang ea Moetso (VIF) e nang le Phapang e le 'ngoe e Ikemetseng
30. Ho latela boholo ba sete ea koetliso, u khetha motho ea khethollang lihlopha joang?
Mokhoa o phahameng oa leeme, oa phapang o tlase o sebetsa hantle bakeng sa koetliso e khutšoane kaha ho fetella ho sa khonehe. Naive Bayes ke mohlala o mong.
E le ho emela litšebelisano tse rarahaneng bakeng sa sete e kholo ea koetliso, mohlala o nang le khethollo e tlaase le phapang e phahameng e molemo. Logistic regression ke mohlala o motle.
31. Ke algorithm efe thutong ea mochine e bitsoang "moithuti ea botsoa" hona hobane'ng?
Moithuti ea botsoa, KNN ke algorithm ea ho ithuta mochini. Hobane K-NN e bala sebaka ka matla nako le nako ha e batla ho arola ho fapana le ho ithuta boleng kapa mefuta e meng e ithutoang ka mochini ho tsoa ho data ea koetliso, e tšoara ka hlooho pokello ea lintlha tsa koetliso.
Sena se etsa hore K-NN e be moithuti ea botsoa.
32. ROC Curve le AUC ke eng?
Ts'ebetso ea mofuta oa lihlopha maemong ohle e emeloa ka mokhoa o hlakileng ke ROC curve. E na le sekhahla sa 'nete se nepahetseng le maemo a fosahetseng.
Ka mantsoe a bonolo feela, sebaka se tlas'a ROC curve se tsejoa e le AUC (Area Under the ROC Curve). Sebaka sa ROC curve ea mahlakore a mabeli ho tloha (0,0) ho ea ho AUC e lekantsoe (1,1). Bakeng sa ho hlahloba mefuta ea lihlopha tsa binary, e sebelisoa e le lipalo-palo tsa tshebetso.
33. Li-hyperparameter ke eng? Ke eng e etsang hore e be e ikhethang ho li-parameter tsa mohlala?
Phapang e ka hare ea mohlala e tsejoa e le parameter ea mohlala. Ho sebelisoa lintlha tsa koetliso, boleng ba parameter bo hakanngoa.
Ha e tsejoe ke mohlala, hyperparameter ke phetoho. Boleng bo ke ke ba khethoa ho tsoa ho data, kahoo hangata ba sebelisoa ho bala liparamente tsa mohlala.
34. Lintlha tsa F1, hopola, le ho nepahala li bolela'ng?
Pherekano Measure ke metric e sebelisoang ho lekanya katleho ea mofuta oa likarolo. Lipoleloana tse latelang li ka sebelisoa ho hlalosa metric ea pherekano hamolemo:
TP: Maikutlo a 'Nete - Tsena ke litekanyetso tse ntle tse neng li lebelletsoe ka nepo. E fana ka maikutlo a hore litekanyetso tsa sehlopha se reriloeng le sehlopha sa 'nete li ntle.
TN: Mathata a 'Nete- Tsena ke litekanyetso tse mpe tse ileng tsa boleloa esale pele ka nepo. E fana ka maikutlo a hore boleng ba sehlopha sa 'nete le sehlopha se lebelletsoeng ke bobe.
Litekanyetso tsena - tse fosahetseng le tse fosahetseng - li etsahala ha sehlopha sa hau sa 'nete se fapana le sehlopha se lebelletsoeng.
Hona joale,
Karo-karolelano ea sekhahla sa 'nete se nepahetseng (TP) ho litebello tsohle tse entsoeng sehlopheng sa' nete se bitsoa recall, e tsejoang hape e le sensitivity.
Khopotso ke TP/(TP+FN).
Ho nepahala ke tekanyo ea boleng bo nepahetseng ba ho bolela esale pele, e bapisang palo ea lintho tse ntle tseo mohlala o hlileng o li bolelang esale pele hore na ke tse kae tse nepahetseng tseo o li bolelang esale pele ka nepo.
Precision ke TP/(TP + FP)
Metric ea ts'ebetso e bonolo ho e utloisisa ke ho nepahala, e leng karolo feela ea litebello tse boletsoeng esale pele ka nepo ho litebello tsohle.
Ho nepahala ho lekana le (TP+TN)/(TP+FP+FN+TN).
Precision le Recall li lekantsoe ebile li lekantsoe ho fana ka lintlha tsa F1. Ka lebaka leo, lintlha tsena li na le maikutlo a fosahetseng le a fosahetseng.
Hangata F1 e bohlokoa ho feta ho nepahala, haholo-holo haeba u na le kabo e sa lekanang ea sehlopha, le haeba ka mokhoa o hlakileng ho se bonolo ho utloisisa joalo ka ho nepahala.
Ho nepahala ho molemo ka ho fetisisa ho finyelloa ha litšenyehelo tsa lintlha tse fosahetseng le tse fosahetseng li bapisoa. Ho molemo ho kenyelletsa Precision le Recall ka bobeli haeba litšenyehelo tse amanang le lintlha tse fosahetseng le tse fosahetseng li fapana haholo.
35. Hantle-ntle netefatso ea sefapano ke eng?
Mokhoa oa ho etsa mohlala oa lipalo-palo o bitsoang "cross-validation" thutong ea mochini o sebelisa li-dataset tse 'maloa ho koetlisa le ho lekola algorithm ea ho ithuta ka mochini ho potoloha mekhahlelo e mengata.
Sehlopha se secha sa data se sa kang sa sebelisoa ho koetlisa mohlala se lekoa ka ho netefatsa hore na mohlala o bolela esale pele hakae. Data overfitting e thibetsoe ka cross-validation.
K-Fold Mokhoa oa ho etsa mohlala o sebelisoang hangata o arola dataset kaofela ka lihlopha tsa K tsa boholo bo lekanang. E bitsoa cross-validation.
36. Ha re re u fumane hore mohlala oa hau o na le phapang e kholo. Ke algorithm efe, ka maikutlo a hau, e loketseng haholo ho sebetsana le boemo bona?
Ho laola phapang e phahameng
Re lokela ho sebelisa mokhoa oa ho kenya mekotla bakeng sa mathata a nang le phapang e kholo.
Mehlala e phetoang ea data e sa reroang e tla sebelisoa ke algorithm ea mekotla ho arola lintlha ka lihlopha tse nyane. Ha data e se e arotsoe, re ka sebelisa data e sa reroang le mokhoa o ikhethileng oa koetliso ho hlahisa melao.
Ka mor'a moo, likhetho li ka sebelisoa ho kopanya likhakanyo tsa mohlala.
37. Ke eng e khethollang ho fokotseha ha Ridge le ho fokotseha ha Lasso?
Mekhoa e 'meli e sebelisoang haholo ea tloaelo ke Lasso (eo hape e bitsoang L1) le Ridge (eo ka linako tse ling e bitsoang L2) regression. Li sebelisetsoa ho thibela ho fetella ha data.
E le ho fumana tharollo e molemo ka ho fetisisa le ho fokotsa ho rarahana, mekhoa ena e sebelisoa ho otla li-coefficients. Ka ho otla kakaretso ea litekanyetso tse feletseng tsa coefficients, ho fokotseha ha Lasso ho sebetsa.
Mosebetsi oa kotlo ho Ridge kapa L2 regression e tsoa kakaretsong ea lisekoere tsa coefficients.
38. Ke efe ea bohlokoa ho feta: ts'ebetso ea mohlala kapa ho nepahala ha mohlala? Ke efe mme hobaneng o tla e rata?
Ena ke potso e thetsang, kahoo motho o lokela ho qala ho utloisisa hore na Model Performance ke eng. Haeba tshebetso e hlalosoa e le lebelo, joale e itšetlehile ka mofuta oa kopo; ts'ebeliso efe kapa efe e amang boemo ba nako ea nnete e ka hloka lebelo le phahameng joalo ka karolo ea bohlokoa.
Mohlala, Liphetho tse ntle ka ho fetisisa tsa ho Batla li tla fokotseha haeba liphetho tsa Potso li nka nako e telele ho fihla.
Haeba Ts'ebetso e sebelisoa e le lebaka la hore na ke hobane'ng ha ho nepahala le ho hopola ho lokela ho behoa pele ka holim'a ho nepahala, joale lintlha tsa F1 li tla ba molemo ho feta ho nepahala ha ho bonts'a nyeoe ea khoebo bakeng sa sete leha e le sefe sa data se sa leka-lekaneng.
39. U ka laola dataset joang ka ho se lekane?
Dataset e sa leka-lekanang e ka rua molemo mekhoeng ea ho etsa mohlala. Sampling e ka etsoa ka mokhoa o tlase kapa o fetelletseng.
Tlas'a Sampling e re lumella ho fokotsa boholo ba sehlopha sa bongata ho bapisa sehlopha sa batho ba fokolang, se thusang ho eketsa lebelo mabapi le polokelo le ts'ebetso ea nako ea nako empa hape se ka fella ka tahlehelo ea data ea bohlokoa.
E le ho lokisa taba ea tahlehelo ea tlhahisoleseling e bakiloeng ke ho etsa sampole e fetelletseng, re etsa mohlala oa sehlopha sa Minority; leha ho le joalo, sena se etsa hore re kopane le mathata a feteletseng.
Maano a mang a kenyelletsa:
- Cluster-Based Over Sampling- Maemo a maemo a fokolang le a bongata a ipapisitse le mokhoa oa ho kopanya oa K-means boemong bona. Sena se etsoa ho fumana lihlopha tsa dataset. Joale, sehlopha se seng le se seng se fetisitsoe ka bongata e le hore lihlopha tsohle li be le boholo bo lekanang 'me lihlopha tsohle ka har'a sehlopha li be le palo e lekanang ea liketsahalo.
- SMOTE: Synthetic Minority Over-sampling Technique- Selae sa data se tsoang sehlopheng sa batho ba fokolang se sebelisoa e le mohlala, ka mor'a moo ho hlahisoa liketsahalo tse ling tsa maiketsetso tse bapisoang le tsona 'me li kenngoa ho dataset ea pele. Mokhoa ona o sebetsa hantle le lintlha tsa lintlha tsa linomoro.
40. U ka khetholla joang pakeng tsa boosting le bagging?
Ensemble Techniques e na le liphetolelo tse tsejoang e le ho kenya mokotla le ho matlafatsa.
Ho roala-
Bakeng sa li-algorithms tse nang le phapang e phahameng, mokotla ke mokhoa o sebelisoang ho fokotsa phapang. Lelapa le leng le joalo la lihlopha tse sekametseng leeme ke lelapa la sefate sa liqeto.
Mofuta oa data oo lifate tsa liqeto li koetlisetsoang ka oona o na le phello e kholo mosebetsing oa bona. Ka lebaka lena, leha ho na le tokiso e phahameng haholo, ka linako tse ling ho thata haholo ho fumana liphetho ho tsona.
Haeba data ea koetliso ea lifate tsa liqeto e fetoloa, liphetho li fapana haholo.
Ka lebaka leo, ho sebelisoa mekotla, eo ho eona ho entsoeng lifate tse ngata tsa liqeto, e 'ngoe le e' ngoe e koetlisitsoeng ka mohlala oa data ea pele, 'me sephetho ke karolelano ea mefuta ena eohle e fapaneng.
Ho matlafatsa:
Boosting ke mokhoa oa ho etsa likhakanyo ka mokhoa o fokolang oa sehlopha sa n-foko moo mohlophisi e mong le e mong ea fokolang a etsang mefokolo ea lihlopha tsa eona tse matla. Re bua ka mohlophisi ea sebetsang hampe ho sete ea data e fanoeng e le "sehlopha se fokolang."
Ho matlafatsa ho hlakile hore ke ts'ebetso eseng algorithm. Ho fokotseha ha lintho le lifate tsa liqeto tse sa tebang ke mehlala e tloaelehileng ea lihlopha tse fokolang.
Adaboost, Gradient Boosting, le XGBoost ke li-algorithms tse peli tse tsebahalang haholo, leha ho le joalo, ho na le tse ling tse ngata.
41. Hlalosa phapang lipakeng tsa thuto ea ho inductive (inductive) le thuto e fokolang.
Ha o ithuta ka mohlala ho tsoa ho sehlopha sa mehlala e hlokometsoeng, mohlala o sebelisa thuto e matla ho fihlela qeto e akaretsang. Ka lehlakoreng le leng, ka thuto e fokolang, mohlala o sebelisa sephetho pele o iketsetsa oa oona.
Ho ithuta ka matla ke mokhoa oa ho etsa liqeto ho tsoa ho tse shebiloeng.
Ho ithuta ka mokhoa o fokolang ke mokhoa oa ho theha maikutlo a itšetlehileng ka maikutlo.
fihlela qeto e
Kea leboha! Tsena ke lipotso tse 40 le ka holimo tsa tlhahlobo ea ho ithuta ka mochini tseo joale u tsebang likarabo tsa tsona. Mahlale a data le bohlale ba maiketsetso mesebetsi e tla tsoela pele ho hlokahala ha theknoloji e ntse e tsoela pele.
Bakhethoa ba ntlafatsang tsebo ea bona ea mahlale ana a tsoetseng pele le ho ntlafatsa sete ea bona ea litsebo ba ka fumana menyetla e mengata ea mesebetsi ka moputso oa tlholisano.
U ka tsoela pele ka ho araba lipuisano kaha joale u na le kutloisiso e tiileng ea ho araba tse ling tsa lipotso tse botsoang haholo tsa ho ithuta mochini.
Ho itšetlehile ka lipakane tsa hao, nka mohato o latelang. Itokisetse lipuisano ka ho etela Hashdork's Letoto la Lipuisano.
Leave a Reply