Table of Contents[Hide][Show]
- 1. Piav qhov sib txawv ntawm kev kawm tshuab, kev txawj ntse txawj ntse, thiab kev kawm tob.
- 2. Thov piav qhia txog ntau hom kev kawm tshuab.
- 3. Dab tsi yog qhov kev tsis ncaj ncees rau kev sib pauv hloov pauv?
- 4. Tshuab kev kawm algorithms tau hloov zuj zus zuj zus mus. Yuav ua li cas ib tug xaiv txoj cai algorithm los siv muab cov ntaub ntawv teev?
- 5. Qhov sib txawv thiab kev sib raug zoo sib txawv li cas?
- 6. Hauv kev kawm tshuab, pawg neeg txhais li cas?
- 7. Dab tsi yog qhov koj nyiam tshuab kev kawm algorithm?
- 8. Linear Regression hauv Machine Learning: Nws yog dab tsi?
- 9. Piav txog qhov sib txawv ntawm KNN thiab k- txhais tau hais tias pawg.
- 10. “Kev xaiv tsis ncaj” txhais li cas rau koj?
- 11. Dab tsi yog Bayes' Theorem?
- 12. Nyob rau hauv Machine Learning Model, 'Training Set' thiab 'test Set' yog dab tsi?
- 13. Dab tsi yog qhov kev xav hauv Machine Learning?
- 14. Kev kawm tshuab overfitting txhais li cas, thiab yuav tiv thaiv nws li cas?
- 15. Dab tsi yog Naive Bayes classifiers?
- 16. Tus Nqi Ua Haujlwm thiab Kev Ua Haujlwm Loss txhais li cas?
- 17. Dab tsi yog qhov txawv ntawm tus qauv tsim los ntawm tus qauv kev ntxub ntxaug?
- 18. Piav qhia qhov txawv ntawm hom I thiab Hom II yuam kev.
- 19. Hauv kev kawm tshuab, kev kawm Ensemble yog dab tsi?
- 20. Dab tsi yog cov qauv parametric? Muab piv txwv.
- 21. Piav txog kev sib koom tes lim dej. Raws li cov ntsiab lus raws li kev lim dej?
- 22. Koj txhais li cas los ntawm Time series?
- 23. Piav txog qhov sib txawv ntawm Gradient Boosting thiab Random Forest algorithms.
- 24. Vim li cas koj thiaj li xav tau qhov tsis meej pem matrix? Nws yog dab tsi?
- 25. Lub hauv paus ntsiab lus tsom xam yog dab tsi?
- 26. Vim li cas qhov kev sib hloov ntawm cov khoom tseem ceeb heev rau PCA (kev tsom xam cov ntsiab lus tseem ceeb)?
- 27. Yuav ua li cas kom normalization thiab normalization ntawm ib leeg?
- 28. normalization thiab standardization txawv ntawm ib leeg li cas?
- 29. Dab tsi yog "variance inflation factor" txhais li cas?
- 30. Raws li qhov loj ntawm cov txheej txheem kev cob qhia, koj yuav xaiv tus cais li cas?
- 31. Dab tsi algorithm hauv kev kawm tshuab hu ua "tus tub kawm tub nkeeg" thiab vim li cas?
- 32. ROC Curve thiab AUC yog dab tsi?
- 33. Dab tsi yog hyperparameters? Dab tsi ua rau lawv tshwj xeeb los ntawm cov qauv ntsuas?
- 34. F1 Score, nco qab, thiab precision txhais li cas?
- 35. Qhov kev lees paub tseeb yog dab tsi?
- 36. Cia peb hais tias koj pom tias koj tus qauv muaj qhov sib txawv tseem ceeb. Dab tsi algorithm, hauv koj lub tswv yim, yog qhov tsim nyog tshaj los daws qhov teeb meem no?
- 37. Qhov txawv ntawm Ridge regression los ntawm Lasso regression?
- 38. Qhov twg yog qhov tseem ceeb tshaj: tus qauv kev ua tau zoo lossis tus qauv raug? Qhov twg thiab vim li cas koj thiaj nyiam nws?
- 39. Koj yuav tswj hwm cov ntaub ntawv nrog qhov tsis sib xws li cas?
- 40. Koj tuaj yeem paub qhov txawv ntawm kev txhawb nqa thiab ntim khoom li cas?
- 41. Piav qhov sib txawv ntawm kev kawm inductive thiab deductive.
- xaus
Cov lag luam tau siv cov cuab yeej siv thev naus laus zis, xws li kev txawj ntse txawj ntse (AI) thiab kev kawm tshuab, txhawm rau txhim kho kev nkag mus tau ntawm cov ntaub ntawv thiab kev pabcuam rau tib neeg.
Cov thev naus laus zis no tau txais los ntawm ntau yam kev lag luam, suav nrog tuam txhab nyiaj, nyiaj txiag, khw muag khoom, tsim khoom, thiab kev kho mob.
Ib qho ntawm feem ntau nrhiav-tom qab lub koom haum lub luag hauj lwm siv AI yog rau cov ntaub ntawv kws tshawb fawb, txawj ntse engineers, tshuab kawm engineers, thiab cov ntaub ntawv soj ntsuam.
Cov ncej no yuav coj koj mus rau ntau yam tshuab kev kawm Kev xam phaj cov lus nug, los ntawm qhov pib mus rau qhov nyuaj, los pab koj npaj txhij rau cov lus nug uas koj tuaj yeem nug thaum nrhiav koj txoj haujlwm zoo.
1. Piav qhov sib txawv ntawm kev kawm tshuab, kev txawj ntse txawj ntse, thiab kev kawm tob.
Artificial txawj ntse siv ntau yam kev kawm tshuab thiab kev kawm tob uas tso cai rau cov tshuab computer los ua cov haujlwm uas siv tib neeg zoo li kev txawj ntse nrog cov laj thawj thiab cov cai.
Kev kawm tshuab siv ntau yam kev txheeb cais thiab Deep Learning txoj hauv kev kom cov tshuab kawm los ntawm lawv qhov kev ua tau zoo ua ntej thiab ua tau zoo dua ntawm kev ua qee yam dej num ntawm lawv tus kheej yam tsis muaj tib neeg saib xyuas.
Deep Learning yog ib phau ntawm cov algorithms uas tso cai rau cov software kawm los ntawm nws tus kheej thiab ua ntau yam kev lag luam, xws li lub suab thiab cov duab pom.
Cov txheej txheem uas nthuav tawm lawv cov multilayered neural networks rau ntau cov ntaub ntawv rau kev kawm muaj peev xwm ua tau kev kawm tob.
2. Thov piav qhia txog ntau hom kev kawm tshuab.
Kev kawm tshuab muaj nyob rau hauv peb hom sib txawv:
- Kev Saib Xyuas Kev Kawm: Ib tus qauv tsim kev kwv yees lossis kev txiav txim siab siv cov ntawv sau los yog cov ntaub ntawv keeb kwm hauv kev saib xyuas tshuab. Cov ntaub ntawv teev tseg uas tau tagged lossis sau npe txhawm rau txhawm rau nce lawv lub ntsiab lus raug xa mus rau cov ntaub ntawv sau npe.
- Unsupervised Learning: Peb tsis muaj cov ntaub ntawv sau npe rau kev kawm tsis tau saib xyuas. Hauv cov ntaub ntawv tuaj, tus qauv tuaj yeem pom cov qauv, qhov tsis zoo, thiab kev sib raug zoo.
- Kev Txhim Kho Kev Kawm: Tus qauv tuaj yeem kawm los ntawm kev siv dag zog kev kawm thiab cov khoom plig uas nws tau txais rau nws tus cwj pwm ua ntej.
3. Dab tsi yog qhov kev tsis ncaj ncees rau kev sib pauv hloov pauv?
Overfitting yog qhov tshwm sim ntawm kev tsis ncaj ncees, uas yog qib uas tus qauv haum rau cov ntaub ntawv. Kev tsis ncaj ncees yog tshwm sim los ntawm qhov tsis raug lossis qhov kev xav yooj yim dhau ntawm koj tshuab kawm algorithm.
Variance yog hais txog kev ua yuam kev los ntawm qhov nyuaj hauv koj lub ML algorithm, uas ua rau muaj kev nkag siab zoo rau ntau qib ntawm kev sib txawv hauv cov ntaub ntawv kev cob qhia thiab overfitting.
Variance yog ntau npaum li cas tus qauv sib txawv nyob ntawm cov khoom siv.
Hauv lwm lo lus, cov qauv yooj yim tsis tshua muaj siab tsis tau ruaj khov (tsis tshua muaj qhov sib txawv). Overfitting yog ib qho teeb meem nrog cov qauv nyuaj, txawm hais tias lawv txawm li cas los ntes tus qauv qhov tseeb (tsis tshua muaj siab).
Txhawm rau tiv thaiv ob qho tib si kev hloov pauv siab thiab kev tsis ncaj ncees siab, kev lag luam tawm ntawm kev tsis ncaj ncees thiab kev sib txawv yog qhov tsim nyog rau kev txo qhov yuam kev zoo tshaj.
4. Tshuab kev kawm algorithms tau hloov zuj zus zuj zus mus. Yuav ua li cas ib tug xaiv txoj cai algorithm los siv muab cov ntaub ntawv teev?
Cov txheej txheem kev kawm tshuab uas yuav tsum tau siv tsuas yog nyob ntawm hom ntaub ntawv hauv cov ntaub ntawv tshwj xeeb.
Thaum cov ntaub ntawv yog linear, linear regression yog siv. Txoj kev ntim khoom yuav ua tau zoo dua yog tias cov ntaub ntawv qhia tias tsis yog-linearity. Peb tuaj yeem siv cov ntoo txiav txim siab lossis SVM yog tias cov ntaub ntawv yuav tsum raug ntsuas lossis txhais ua lag luam.
Neural tes hauj lwm yuav muaj txiaj ntsig kom tau txais cov lus teb raug yog tias cov ntaub ntawv suav nrog cov duab, yeeb yaj kiab, thiab suab.
Kev xaiv ntawm algorithm rau ib qho xwm txheej tshwj xeeb lossis sau cov ntaub ntawv tsis tuaj yeem ua rau ntawm ib qho kev ntsuas.
Rau lub hom phiaj ntawm kev txhim kho txoj kev haum zoo tshaj plaws, peb yuav tsum xub xyuas cov ntaub ntawv uas siv cov ntaub ntawv tshawb fawb (EDA) thiab nkag siab txog lub hom phiaj ntawm kev siv cov ntaub ntawv.
5. Qhov sib txawv thiab kev sib raug zoo sib txawv li cas?
Covariance ntsuas seb ob qhov sib txawv li cas txuas rau ib leeg thiab yuav ua li cas ib tus tuaj yeem hloov pauv hauv cov lus teb rau kev hloov pauv ntawm lwm tus.
Yog tias qhov tshwm sim zoo, nws qhia tau hais tias muaj kev sib txuas ncaj qha ntawm qhov sib txawv thiab qhov yuav nce lossis txo nrog qhov nce lossis txo qis hauv qhov sib txawv, piv txwv tias tag nrho lwm yam kev mob nyob tas li.
Kev sib txheeb ntsuas qhov sib txuas ntawm ob qhov sib txawv ntawm qhov sib txawv thiab tsuas muaj peb qhov sib txawv: 1, 0, thiab -1.
6. Hauv kev kawm tshuab, pawg neeg txhais li cas?
Txoj kev kawm tsis muaj kev saib xyuas uas pab pawg cov ntaub ntawv taw qhia ua ke yog hu ua pawg. Nrog rau kev sau cov ntaub ntawv cov ntsiab lus, cov txheej txheem kev sib koom ua ke tuaj yeem siv tau.
Koj tuaj yeem pab pawg tag nrho cov ntaub ntawv cov ntsiab lus raws li lawv txoj haujlwm siv lub tswv yim no.
Cov yam ntxwv thiab qhov zoo ntawm cov ntaub ntawv cov ntsiab lus uas poob rau hauv tib qeb yog qhov zoo sib xws, thaum cov ntaub ntawv cov ntsiab lus uas poob rau hauv cov pab pawg sib txawv.
Txoj kev no tuaj yeem siv los txheeb xyuas cov ntaub ntawv txheeb xyuas.
7. Dab tsi yog qhov koj nyiam tshuab kev kawm algorithm?
Koj muaj sijhawm los ua kom pom qhov koj nyiam thiab cov txuj ci tshwj xeeb hauv cov lus nug no, nrog rau koj cov kev paub txog ntau yam kev kawm tshuab.
Nov yog ob peb yam kev kawm tshuab algorithms los xav txog:
- Tawm tshiab regression
- Logistic regression
- Naive Bayes: XNUMX Lab tus kiv cua tos koj rau Webtalk!
- Kev txiav txim siab ntoo
- K txhais tau tias
- Random hav zoov algorithm
- K-nyob ze ze (KNN)
8. Linear Regression hauv Machine Learning: Nws yog dab tsi?
Ib tug saib xyuas tshuab kawm algorithm yog linear regression.
Nws yog ua hauj lwm nyob rau hauv kev kwv yees tsom xam los txiav txim qhov linear kev twb kev txuas ntawm cov dependent thiab ywj siab variables.
Linear regression's equation yog raws li nram no:
Y = A + BX
qhov twg:
- Lub tswv yim lossis tus hloov pauv ywj pheej hu ua X.
- Lub dependent los yog tso zis sib txawv yog Y.
- X tus coefficient yog b, thiab nws qhov cuam tshuam yog a.
9. Piav txog qhov sib txawv ntawm KNN thiab k- txhais tau hais tias pawg.
Qhov tseem ceeb sib txawv yog tias KNN (ib hom kev faib tawm, kev saib xyuas kev kawm) xav tau cov ntsiab lus sau npe thaum k-txhais tsis tau (clustering algorithm, unsupervised learning).
Koj tuaj yeem faib cov ntaub ntawv sau rau hauv qhov chaw tsis muaj npe los ntawm kev siv K-Neeg Neighbors. K-txhais tau tias kev sib koom ua ke siv qhov nruab nrab ntawm qhov sib nrug ntawm cov ntsiab lus los kawm yuav ua li cas pab pawg cov ntsiab lus tsis muaj npe.
10. “Kev xaiv tsis ncaj” txhais li cas rau koj?
Qhov kev tsis ncaj ncees nyob rau hauv qhov kev sim qhov kev sim theem yog vim qhov tseeb tsis tseeb.
Ib pawg qauv raug xaiv ntau dua li lwm pab pawg hauv qhov kev sim vim qhov tsis raug.
Yog tias qhov kev xaiv tsis raug lees paub, nws tuaj yeem ua rau qhov tsis raug.
11. Dab tsi yog Bayes' Theorem?
Thaum peb paub txog lwm qhov tshwm sim, peb tuaj yeem txiav txim siab qhov tshwm sim siv Bayes 'Theorem. Nws muaj qhov tshwm sim tom qab qhov tshwm sim raws li cov ntaub ntawv ua ntej, hauv lwm lo lus.
Ib txoj hauv kev zoo rau kev kwv yees qhov muaj feem yuav tshwm sim yog muab los ntawm qhov theorem no.
Thaum txhim kho kev faib tawm kwv yees cov qauv teeb meem thiab haum tus qauv rau kev cob qhia dataset hauv machine learning, Bayes 'theorem yog siv (ie Naive Bayes, Bayes Optimal Classifier).
12. Nyob rau hauv Machine Learning Model, 'Training Set' thiab 'test Set' yog dab tsi?
Kev cob qhia teeb:
- Cov txheej txheem kev cob qhia muaj cov piv txwv uas raug xa mus rau tus qauv rau kev tshuaj xyuas thiab kev kawm.
- Qhov no yog cov ntaub ntawv sau npe uas yuav siv los cob qhia tus qauv.
- Feem ntau, 70% ntawm tag nrho cov ntaub ntawv yog siv raws li kev cob qhia dataset.
Test Set:
- Cov txheej txheem xeem yog siv los ntsuas tus qauv qhov kev xav txog qhov tseeb.
- Peb kuaj yam tsis muaj cov ntaub ntawv sau npe thiab tom qab ntawd siv cov ntawv lo kom paub meej cov txiaj ntsig.
- Qhov seem 30% yog siv los ua cov ntaub ntawv xeem.
13. Dab tsi yog qhov kev xav hauv Machine Learning?
Machine Learning enables siv cov datasets uas twb muaj lawm kom nkag siab zoo dua ib tug muaj nuj nqi uas txuas input rau cov zis. Qhov no yog hu ua function approximation.
Hauv qhov no, kwv yees yuav tsum tau ua haujlwm rau qhov tsis paub lub hom phiaj ua haujlwm kom hloov tag nrho cov kev xav pom raws li qhov xwm txheej tau muab rau hauv txoj hauv kev zoo tshaj plaws.
Hauv kev kawm tshuab, ib qho kev xav yog ib qho qauv uas pab rau kev kwv yees lub hom phiaj ua haujlwm thiab ua kom tiav cov tswv yim tsim nyog-rau-tso daim ntawv qhia.
Kev xaiv thiab tsim cov algorithms tso cai rau lub ntsiab lus ntawm qhov chaw ntawm qhov kev xav tau uas tuaj yeem sawv cev los ntawm tus qauv.
Rau ib qho kev xav, tus lej h (h) yog siv, tab sis lub peev h (H) yog siv rau tag nrho qhov kev xav ntawm qhov chaw uas tab tom nrhiav. Peb yuav piav qhia luv luv txog cov ntawv sau no:
- Ib qho kev xav (h) yog ib qho qauv tshwj xeeb uas pab txhawb kev kos duab ntawm cov tswv yim tawm tswv yim, uas tuaj yeem siv tau rau kev ntsuam xyuas thiab kev kwv yees.
- Ib qho kev xav tau teeb tsa (H) yog qhov chaw tshawb nrhiav ntawm cov kev xav uas tuaj yeem siv los qhia cov tswv yim rau cov khoom tawm. Qhov teeb meem framing, qauv, thiab qauv configuration yog ob peb yam piv txwv ntawm generic txwv.
14. Kev kawm tshuab overfitting txhais li cas, thiab yuav tiv thaiv nws li cas?
Thaum lub tshuab sim kawm los ntawm cov ntaub ntawv tsis txaus, overfitting tshwm sim.
Yog li ntawd, overfitting yog inversely correlated nrog cov ntaub ntawv ntim. Txoj kev hla-validation tso cai rau overfitting kom zam rau cov ntaub ntawv me me. Cov ntaub ntawv tau muab faib ua ob ntu hauv txoj kev no.
Cov ntaub ntawv rau kev sim thiab kev cob qhia yuav muaj ob ntu no. Cov ntaub ntawv qhia kev cob qhia yog siv los tsim ib qho qauv, thaum cov ntaub ntawv xeem yog siv los ntsuas tus qauv siv cov khoom sib txawv.
Qhov no yog yuav ua li cas tiv thaiv overfitting.
15. Dab tsi yog Naive Bayes classifiers?
Ntau hom kev faib tawm ua rau Naive Bayes classifiers. Ib txheej ntawm cov algorithms hu ua cov classifiers tag nrho ua haujlwm ntawm tib lub tswv yim tseem ceeb.
Qhov kev xav ua los ntawm cov neeg tsis paub cai Bayes yog tias ib qho feature muaj los yog tsis tuaj yeem tsis muaj qhov cuam tshuam ntawm qhov muaj lossis tsis muaj lwm yam.
Hauv lwm lo lus, qhov no yog qhov peb hu ua "naive" txij li nws ua rau qhov kev xav tias txhua tus dataset tus cwj pwm yog qhov tseem ceeb thiab muaj kev ywj pheej.
Kev faib tawm yog ua tiav siv cov khoom tsis zoo Bayes classifiers. Lawv yooj yim siv thiab tsim cov txiaj ntsig zoo dua li cov kev kwv yees nyuaj dua thaum qhov kev ywj pheej muaj tseeb.
Hauv kev txheeb xyuas cov ntawv nyeem, spam lim, thiab cov lus pom zoo, lawv tau ua haujlwm.
16. Tus Nqi Ua Haujlwm thiab Kev Ua Haujlwm Loss txhais li cas?
Cov kab lus "tsis muaj nuj nqi" yog hais txog cov txheej txheem ntawm kev suav poob thaum tsuas yog ib qho ntawm cov ntaub ntawv raug coj mus rau hauv tus account.
Piv txwv li, peb siv tus nqi ua haujlwm los txiav txim siab tag nrho cov kev ua yuam kev rau ntau cov ntaub ntawv. Tsis muaj qhov sib txawv tseem ceeb.
Hauv lwm lo lus, thaum tus nqi ua haujlwm sib sau ua ke qhov sib txawv rau tag nrho cov ntaub ntawv qhia kev kawm, kev poob haujlwm yog tsim los ntes qhov sib txawv ntawm qhov tseeb thiab kwv yees qhov tseem ceeb rau ib cov ntaub ntawv.
17. Dab tsi yog qhov txawv ntawm tus qauv tsim los ntawm tus qauv kev ntxub ntxaug?
Tus qauv kev ntxub ntxaug kawm txog qhov sib txawv ntawm ntau pawg ntaub ntawv. Ib tug generative qauv khaws ntawm ntau hom ntaub ntawv.
Ntawm cov teeb meem kev faib tawm, cov qauv kev ntxub ntxaug feem ntau ua tau zoo dua lwm cov qauv.
18. Piav qhia qhov txawv ntawm hom I thiab Hom II yuam kev.
Qhov zoo tsis tseeb poob rau hauv qeb ntawm Hom I yuam kev, qhov tsis tseeb qhov tsis zoo mus rau hauv Hom II yuam kev (tsis muaj dab tsi tshwm sim thaum nws muaj tiag).
19. Hauv kev kawm tshuab, kev kawm Ensemble yog dab tsi?
Cov txheej txheem hu ua ensemble learning mixes ntau lub tshuab kev kawm qauv los tsim cov qauv muaj zog dua.
Ib tus qauv tuaj yeem sib txawv rau ntau yam laj thawj. Muaj ntau qhov laj thawj yog:
- Ntau haiv neeg
- Ntau yam Hypotheses
- Ntau yam kev ua qauv
Peb yuav ntsib teeb meem thaum siv tus qauv kev cob qhia thiab cov ntaub ntawv xeem. Bias, variance, thiab irreducible yuam kev yog hom ntawm qhov yuam kev no.
Tam sim no, peb hu qhov sib npaug ntawm kev tsis ncaj ncees thiab qhov sib txawv hauv cov qauv kev sib txawv-variance kev lag luam tawm, thiab nws yuav tsum muaj nyob ib txwm muaj. Qhov kev sib pauv no yog ua tiav los ntawm kev siv cov kev kawm ua ke.
Txawm hais tias muaj ntau yam kev sib koom ua ke muaj, muaj ob lub tswv yim zoo rau kev sib txuas ntau tus qauv:
- Ib txoj hauv kev ib txwm hu ua bagging siv cov txheej txheem kev cob qhia los tsim cov kev cob qhia ntxiv.
- Boosting, ib tug ntau sophisticated txheej txheem: Ntau yam xws li bagging, boosting yog siv los nrhiav cov zoo tagnrho luj mis rau ib tug kev cob qhia.
20. Dab tsi yog cov qauv parametric? Muab piv txwv.
Muaj qhov txwv tsis pub muaj nyob hauv cov qauv parametric. Txhawm rau kwv yees cov ntaub ntawv, txhua yam koj yuav tsum paub yog cov qauv tsis muaj.
Cov nram qab no yog cov piv txwv: logistic regression, linear regression, thiab linear SVMs. Cov qauv uas tsis yog parametric hloov pauv tau vim lawv tuaj yeem muaj qhov txwv tsis pub muaj.
Tus qauv qhov tsis muaj thiab cov xwm txheej ntawm cov ntaub ntawv soj ntsuam yog xav tau rau cov ntaub ntawv kwv yees. Nov yog qee qhov piv txwv: cov qauv qauv, txiav txim siab ntoo, thiab k-cov neeg nyob ze ze.
21. Piav txog kev sib koom tes lim dej. Raws li cov ntsiab lus raws li kev lim dej?
Ib txoj hauv kev sim-thiab-qhov tseeb rau kev tsim cov ntsiab lus tshwj xeeb yog kev sib koom ua ke.
Ib daim ntawv pom zoo hu ua kev sib koom tes lim dej qhia txog cov khoom tshiab los ntawm kev ntsuas cov neeg siv khoom nyiam nrog kev nyiam sib koom.
Cov neeg siv nyiam yog tib yam uas cov ntsiab lus-raws li kev pom zoo cov txheej txheem xav txog. Raws li tus neeg siv cov kev xaiv ua ntej, cov lus pom zoo tshiab tau muab los ntawm cov ntaub ntawv muaj feem xyuam.
22. Koj txhais li cas los ntawm Time series?
Lub sij hawm series yog ib qho kev sau ntawm cov lej nyob rau hauv ascending order. Nyob rau lub sij hawm predetermined, nws saib xyuas lub zog ntawm cov ntaub ntawv xaiv cov ntsiab lus thiab ib ntus captures cov ntaub ntawv cov ntsiab lus.
Tsis muaj qhov tsawg kawg nkaus lossis siab tshaj lub sijhawm nkag rau lub sijhawm series.
Lub sij hawm series feem ntau siv los ntawm cov kws tshuaj ntsuam xyuas los txheeb xyuas cov ntaub ntawv raws li lawv cov kev cai tshwj xeeb.
23. Piav txog qhov sib txawv ntawm Gradient Boosting thiab Random Forest algorithms.
Random Forest:
- Ntau tus ntoo txiav txim siab tau sib sau ua ke thaum kawg thiab hu ua random forests.
- Thaum gradient boosting tsim txhua tsob ntoo ntawm nws tus kheej ntawm lwm tus, random hav zoov tsim txhua tsob ntoo ib zaug.
- Multiclass nrhiav pom khoom ua haujlwm zoo nrog random hav zoov.
Gradient Boosting:
- Thaum Random hav zoov koom nrog cov ntoo txiav txim siab thaum kawg ntawm cov txheej txheem, Gradient Boosting Machines muab lawv los ntawm qhov pib.
- Yog tias qhov ntsuas tau raug kho kom haum, gradient boosting outperforms random forests nyob rau hauv cov nqe lus ntawm cov txiaj ntsig, tab sis nws tsis yog ib qho kev xaiv ntse yog tias cov ntaub ntawv teev muaj ntau outliers, anomalies, los yog suab nrov vim nws tuaj yeem ua rau tus qauv dhau los.
- Thaum muaj cov ntaub ntawv tsis sib npaug, raws li muaj nyob rau hauv kev soj ntsuam kev pheej hmoo ntawm lub sijhawm, gradient boosting ua tau zoo.
24. Vim li cas koj thiaj li xav tau qhov tsis meej pem matrix? Nws yog dab tsi?
Ib lub rooj hu ua qhov tsis meej pem matrix, qee zaum hu ua qhov yuam kev matrix, yog dav siv los qhia tias tus qauv kev faib tawm zoo npaum li cas, los yog cais tawm, ua rau cov ntaub ntawv xeem uas paub txog qhov tseem ceeb.
Nws ua rau peb pom tias tus qauv lossis algorithm ua haujlwm li cas. Nws ua rau nws yooj yim rau peb pom kev nkag siab tsis zoo ntawm ntau yam kev kawm.
Nws ua haujlwm raws li ib txoj hauv kev los ntsuas seb tus qauv lossis algorithm ua tau zoo npaum li cas.
Ib qho kev faib ua qauv kev kwv yees tau muab tso ua ke rau hauv qhov tsis meej pem matrix. Txhua chav kawm daim ntawv teev cov nqi suav tau raug siv los rhuav tshem tag nrho cov kev kwv yees raug thiab tsis raug.
Nws muab cov ntsiab lus ntawm qhov tsis raug ua los ntawm cov khoom cais raws li qhov sib txawv ntawm qhov yuam kev tshwm sim los ntawm cov khoom cais.
25. Lub hauv paus ntsiab lus tsom xam yog dab tsi?
Los ntawm kev txo tus naj npawb ntawm cov sib txawv uas sib raug zoo nrog ib leeg, lub hom phiaj yog kom txo qis qhov loj ntawm cov ntaub ntawv sau. Tab sis nws yog ib qho tseem ceeb kom muaj kev sib txawv kom ntau li ntau tau.
Cov kev hloov pauv tau hloov mus rau hauv ib qho tshiab tag nrho ntawm kev hloov pauv hu ua cov khoom tseem ceeb.
Cov PCs no yog orthogonal vim lawv yog cov sib txawv matrix's eigenvectors.
26. Vim li cas qhov kev sib hloov ntawm cov khoom tseem ceeb heev rau PCA (kev tsom xam cov ntsiab lus tseem ceeb)?
Kev sib hloov yog qhov tseem ceeb hauv PCA vim tias nws ua kom zoo rau kev sib cais ntawm qhov sib txawv tau los ntawm txhua qhov khoom, ua rau kev txhais lus yooj yim dua.
Peb xav tau cov khoom txuas ntxiv los nthuav qhia qhov hloov pauv yog tias cov khoom tsis hloov pauv.
27. Yuav ua li cas kom normalization thiab normalization ntawm ib leeg?
Li qub:
Cov ntaub ntawv yog hloov thaum lub sij hawm normalization. Koj yuav tsum normalize cov ntaub ntawv yog hais tias nws muaj scales uas txawv heev, tshwj xeeb tshaj yog los ntawm qis mus rau siab. Kho txhua kem kom cov kev txheeb cais tseem ceeb yog txhua yam sib xws.
Txhawm rau kom ntseeg tau tias tsis muaj qhov poob ntawm qhov tseeb, qhov no tuaj yeem pab tau. Kev txheeb xyuas lub teeb liab thaum tsis quav ntsej lub suab nrov yog ib qho ntawm cov hom phiaj ntawm kev cob qhia qauv.
Muaj lub caij nyoog ntawm overfitting yog tias tus qauv muab kev tswj kom tiav kom txo tau qhov yuam kev.
Regularization:
Hauv kev ua haujlwm tsis tu ncua, qhov kev twv ua haujlwm tau hloov kho. Qhov no yog ua raws li qee qhov kev tswj hwm los ntawm kev ua haujlwm tsis tu ncua, uas ua rau yooj yim haum rau kev ua haujlwm dhau qhov nyuaj.
28. normalization thiab standardization txawv ntawm ib leeg li cas?
Ob txoj kev siv dav tshaj plaws rau kev ntsuas qhov ntsuas yog normalization thiab standardization.
Li qub:
- Rescaling cov ntaub ntawv kom haum [0,1] ntau yog hu ua normalization.
- Thaum tag nrho cov kev ntsuas yuav tsum muaj qhov zoo ib yam, normalization yuav pab tau, tab sis cov ntaub ntawv teev cov outliers poob.
Regularization:
- Cov ntaub ntawv raug rov ntsuas dua kom muaj qhov nruab nrab ntawm 0 thiab tus qauv sib txawv ntawm 1 raws li ib feem ntawm cov txheej txheem txheem (Unit variance)
29. Dab tsi yog "variance inflation factor" txhais li cas?
Qhov piv ntawm tus qauv qhov sib txawv rau qhov sib txawv ntawm tus qauv nrog tsuas yog ib qho kev ywj pheej sib txawv yog lub npe hu ua variation inflation factor (VIF).
VIF kwv yees tus nqi ntawm multicollinearity tam sim no nyob rau hauv ib pawg ntawm ntau regression variables.
Variance of the model (VIF) Model with One Independent Variable Variance
30. Raws li qhov loj ntawm cov txheej txheem kev cob qhia, koj yuav xaiv tus cais li cas?
Lub siab tsis ncaj ncees, tsis tshua muaj qhov sib txawv ntawm tus qauv ua tau zoo dua rau kev cob qhia luv luv vim tias qhov kev sib tw tsis tshua muaj. Naive Bayes yog ib qho piv txwv.
Txhawm rau sawv cev rau kev sib cuam tshuam ntau dua rau cov txheej txheem kev cob qhia loj, tus qauv uas tsis muaj kev tsis ncaj ncees thiab qhov sib txawv siab yog qhov zoo dua. Logistic regression yog ib qho piv txwv zoo.
31. Dab tsi algorithm hauv kev kawm tshuab hu ua "tus tub kawm tub nkeeg" thiab vim li cas?
Ib tug kawm qeeb, KNN yog lub tshuab kawm algorithm. Vim tias K-NN dynamically xam qhov deb txhua lub sij hawm nws xav muab faib es tsis txhob kawm tej yam machine-kawm qhov tseem ceeb los yog variables los ntawm cov ntaub ntawv qhia, nws cim cov ntaub ntawv qhia.
Qhov no ua rau K-NN yog tub nkeeg kawm.
32. ROC Curve thiab AUC yog dab tsi?
Qhov kev ua tau zoo ntawm tus qauv kev faib tawm ntawm txhua qhov chaw pib yog sawv cev los ntawm ROC nkhaus. Nws muaj qhov tseeb qhov zoo thiab qhov tsis tseeb tus nqi zoo.
Cias muab, thaj tsam hauv qab ROC nkhaus yog hu ua AUC (Area Under the ROC Curve). ROC nkhaus ntawm ob sab ntawm thaj tsam ntawm (0,0) rau AUC yog ntsuas (1,1). Rau kev ntsuam xyuas binary classification qauv, nws yog ua hauj lwm raws li ib tug Performance index.
33. Dab tsi yog hyperparameters? Dab tsi ua rau lawv tshwj xeeb los ntawm cov qauv ntsuas?
Ib qho kev sib txawv ntawm tus qauv yog hu ua tus qauv parameter. Siv cov ntaub ntawv kev cob qhia, tus nqi parameter yog kwv yees.
Tsis paub txog tus qauv, hyperparameter yog qhov sib txawv. Tus nqi tsis tuaj yeem txiav txim siab los ntawm cov ntaub ntawv, yog li lawv nquag ua haujlwm los xam cov qauv ntsuas.
34. F1 Score, nco qab, thiab precision txhais li cas?
Kev ntsuas tsis meej pem yog cov metric siv los ntsuas qhov ua tau zoo ntawm cov qauv kev faib tawm. Cov kab lus hauv qab no tuaj yeem siv los piav qhia qhov tsis meej pem metric:
TP: Qhov Zoo Tshaj Plaws - Cov no yog cov txiaj ntsig zoo uas tau cia siab kom raug. Nws qhia tau hais tias qhov tseem ceeb ntawm chav kawm npaj thiab chav kawm tiag tiag yog ob qho tib si zoo.
TN: Qhov Tseeb Tsis Zoo- Cov no yog cov txiaj ntsig tsis zoo uas tau raug kwv yees kom raug. Nws qhia tias ob qho tib si tus nqi ntawm cov chav kawm tiag tiag thiab cov chav kawm xav tau yog qhov tsis zoo.
Cov txiaj ntsig no - qhov tsis zoo thiab qhov tsis zoo tsis tseeb - tshwm sim thaum koj chav kawm tiag tiag txawv ntawm chav kawm xav tau.
Tam sim no,
Qhov piv ntawm qhov tseeb qhov zoo (TP) rau txhua qhov kev soj ntsuam hauv chav kawm tiag tiag yog hu ua rov qab los, tseem hu ua rhiab heev.
Kev xa rov qab yog TP / (TP + FN).
Precision yog ib qho kev ntsuas ntawm qhov zoo kwv yees tus nqi, uas sib piv cov naj npawb ntawm qhov zoo ntawm tus qauv tiag tiag kwv yees rau pes tsawg qhov zoo nws tau kwv yees kom raug.
Precision yog TP / (TP + FP)
Qhov kev ntsuas kev ua tau zoo tshaj plaws kom nkag siab yog qhov tseeb, uas tsuas yog qhov kev faib ua feem ntawm kev soj ntsuam kom zoo rau txhua qhov kev soj ntsuam.
Qhov tseeb yog sib npaug rau (TP + TN) / (TP + FP + FN + TN).
Precision thiab Recall yog hnyav thiab nruab nrab los muab F1 Score. Raws li qhov tshwm sim, qhov qhab nia no suav nrog ob qho kev tsis zoo thiab qhov tsis zoo.
F1 feem ntau muaj txiaj ntsig ntau dua li qhov tseeb, tshwj xeeb tshaj yog tias koj muaj qhov tsis sib xws hauv chav kawm, txawm tias intuitively nws tsis yooj yim kom nkag siab qhov tseeb.
Qhov tseeb zoo tshaj plaws yog ua tiav thaum tus nqi ntawm qhov tsis zoo thiab qhov tsis zoo tsis zoo sib piv. Nws yog qhov zoo dua los suav nrog Precision thiab Recall yog tias cov nqi cuam tshuam nrog qhov tsis zoo thiab qhov tsis zoo tsis zoo sib txawv ntau.
35. Qhov kev lees paub tseeb yog dab tsi?
Ib txoj hauv kev txheeb xyuas qhov piv txwv hu ua cross-validation hauv tshuab kev kawm siv ntau cov ntaub ntawv subsets los cob qhia thiab ntsuas lub tshuab kev kawm algorithm hla ntau qhov sib tw.
Ib pawg tshiab ntawm cov ntaub ntawv uas tsis tau siv los cob qhia tus qauv yog sim siv kev sib tw kom pom tias tus qauv kwv yees nws zoo npaum li cas. Cov ntaub ntawv overfitting yog tiv thaiv los ntawm kev sib tw validation.
K-Fold Qhov feem ntau siv resampling txoj kev faib tag nrho cov ntaub ntawv rau hauv K pawg ntawm qhov sib npaug. Nws yog hu ua cross-validation.
36. Cia peb hais tias koj pom tias koj tus qauv muaj qhov sib txawv tseem ceeb. Dab tsi algorithm, hauv koj lub tswv yim, yog qhov tsim nyog tshaj los daws qhov teeb meem no?
Tswj kev hloov pauv siab
Peb yuav tsum siv cov txheej txheem ntim khoom rau cov teeb meem nrog kev hloov pauv loj.
Rov ua piv txwv ntawm cov ntaub ntawv random yuav siv los ntawm bagging algorithm los faib cov ntaub ntawv rau hauv pab pawg. Thaum cov ntaub ntawv tau muab faib, peb tuaj yeem siv cov ntaub ntawv random thiab cov txheej txheem kev cob qhia tshwj xeeb los tsim cov cai.
Tom qab ntawd, kev xaiv tsa tuaj yeem siv los ua ke cov qauv kev kwv yees.
37. Qhov txawv ntawm Ridge regression los ntawm Lasso regression?
Ob txoj kev siv dav dav yog Lasso (tseem hu ua L1) thiab Ridge (qee zaum hu ua L2) regression. Lawv yog siv los tiv thaiv overfitting ntawm cov ntaub ntawv.
Txhawm rau nrhiav pom qhov kev daws teeb meem zoo tshaj plaws thiab txo qis qhov nyuaj, cov tswv yim no tau ua haujlwm los rau txim rau cov coefficients. Los ntawm kev nplua tag nrho ntawm qhov tseem ceeb ntawm cov coefficients, Lasso regression ua haujlwm.
Lub txim txhaum nyob rau hauv Ridge los yog L2 regression yog muab los ntawm cov sum ntawm squares ntawm cov coefficients.
38. Qhov twg yog qhov tseem ceeb tshaj: tus qauv kev ua tau zoo lossis tus qauv raug? Qhov twg thiab vim li cas koj thiaj nyiam nws?
Qhov no yog ib lo lus nug dag, yog li ib tug yuav tsum xub to taub dab tsi Model Performance yog. Yog hais tias kev ua tau zoo yog txhais raws li kev ceev, ces nws cia siab rau hom kev thov; txhua daim ntawv thov uas muaj qhov xwm txheej tiag tiag yuav xav tau kev kub ceev raws li qhov tseem ceeb.
Piv txwv li, Qhov Kev Tshawb Nrhiav Zoo Tshaj Plaws yuav dhau los ua qhov tsis tshua muaj txiaj ntsig yog tias cov txiaj ntsig Query siv sijhawm ntev dhau los txog.
Yog tias Kev Ua Haujlwm raug siv los ua qhov kev lees paub vim li cas qhov tseeb thiab kev rov qab yuav tsum tau ua ntej tshaj qhov raug, ces qhov qhab nia F1 yuav muaj txiaj ntsig ntau dua li qhov tseeb hauv kev qhia txog kev lag luam rau cov ntaub ntawv uas tsis sib npaug.
39. Koj yuav tswj hwm cov ntaub ntawv nrog qhov tsis sib xws li cas?
Cov ntaub ntawv tsis sib npaug tuaj yeem tau txais txiaj ntsig los ntawm cov txheej txheem sampling. Sampling yuav ua tau nyob rau hauv ib tug nyob rau hauv los yog oversampled zam.
Raws li Sampling tso cai rau peb kom txo qis qhov loj ntawm cov chav kawm feem ntau kom haum rau cov chav kawm tsawg, uas pab ua kom nrawm nrawm nrog rau kev khaws cia thiab khiav sijhawm ua haujlwm tab sis kuj tuaj yeem ua rau poob ntawm cov ntaub ntawv tseem ceeb.
Yuav kom daws tau qhov teeb meem ntawm cov ntaub ntawv poob los ntawm oversampling, peb upsample cov Minority class; Txawm li cas los xij, qhov no ua rau peb khiav mus rau cov teeb meem overfitting.
Cov tswv yim ntxiv muaj xws li:
- Cluster-Based Over Sampling- Cov chav kawm tsawg thiab feem ntau yog ib tus zuj zus raws li K-txhais tau tias cov txheej txheem ua pawg hauv qhov xwm txheej no. Qhov no yog ua los nrhiav cov pawg dataset. Tom qab ntawd, txhua pawg yog oversampled kom txhua chav kawm muaj qhov loj me thiab txhua pawg hauv chav kawm muaj qhov sib npaug ntawm cov piv txwv.
- SMOTE: Synthetic Minority Over-sampling Technique- Ib daim ntawv ntawm cov ntaub ntawv los ntawm cov chav kawm tsawg yog siv los ua piv txwv, tom qab ntawd cov khoom siv dag zog ntxiv uas piv rau nws tau tsim thiab ntxiv rau cov ntaub ntawv qub. Txoj kev no ua haujlwm zoo nrog cov ntsiab lus ntawm cov lej.
40. Koj tuaj yeem paub qhov txawv ntawm kev txhawb nqa thiab ntim khoom li cas?
Ensemble Techniques muaj cov qauv hu ua bagging thiab boosting.
Hnab-
Rau algorithms nrog kev hloov pauv siab, hnab ntim khoom yog cov txheej txheem siv los txo qhov sib txawv. Ib tsev neeg zoo li no ntawm classifiers uas muaj kev tsis ncaj ncees yog kev txiav txim siab ntoo tsev neeg.
Hom ntaub ntawv uas cov ntoo txiav txim siab raug cob qhia muaj feem cuam tshuam rau lawv qhov kev ua tau zoo. Vim tias qhov no, txawm tias muaj kev nplua zoo heev, kev nthuav dav ntawm cov txiaj ntsig tau qee zaum nyuaj dua kom tau txais hauv lawv.
Yog tias kev txiav txim siab ntoo cov ntaub ntawv qhia kev hloov pauv, cov txiaj ntsig tau sib txawv.
Raws li qhov tshwm sim, cov hnab ntim tau siv, uas muaj ntau qhov kev txiav txim siab ntoo tsim, txhua qhov kev cob qhia siv cov qauv ntawm cov ntaub ntawv qub, thiab qhov kawg tshwm sim yog qhov nruab nrab ntawm tag nrho cov qauv sib txawv.
Txhawb nqa:
Boosting yog cov txheej txheem ntawm kev kwv yees nrog n-tsis muaj zog classifier system uas txhua tus tsis muaj zog classifiers ua rau qhov tsis txaus ntawm nws cov classifiers muaj zog. Peb xa mus rau ib tug classifier uas ua phem rau ib tug muab cov ntaub ntawv teev raws li ib tug "tsis muaj zog classifier."
Boosting yog obviously ib tug txheej txheem es tsis yog ib tug algorithm. Logistic regression thiab cov ntoo txiav txim siab ntiav yog cov piv txwv ntawm cov tsis muaj zog classifiers.
Adaboost, Gradient Boosting, thiab XGBoost yog ob qhov nrov tshaj plaws boosting algorithms, txawm li cas los xij, muaj ntau yam ntxiv.
41. Piav qhov sib txawv ntawm kev kawm inductive thiab deductive.
Thaum kawm los ntawm kev piv txwv los ntawm ib pawg ntawm cov piv txwv pom, tus qauv siv kev kawm inductive kom txog rau qhov kev txiav txim siab dav dav. Ntawm qhov tod tes, nrog kev kawm txiav tawm, tus qauv siv qhov tshwm sim ua ntej tsim nws tus kheej.
Kev kawm inductive yog tus txheej txheem ntawm kev kos cov lus xaus los ntawm kev soj ntsuam.
Kev kawm Deductive yog txheej txheem ntawm kev tsim cov kev soj ntsuam raws li kev xav.
xaus
Zoo siab! Cov no yog 40 sab saum toj thiab saum toj no cov lus nug sib tham rau kev kawm tshuab uas tam sim no koj paub cov lus teb rau. Data science thiab artificial txawj ntse Cov hauj lwm yuav txuas ntxiv nyob rau hauv qhov kev thov raws li kev siv technology nce qib.
Cov neeg sib tw uas hloov kho lawv txoj kev paub txog cov thev naus laus zis no thiab txhim kho lawv cov kev txawj ntse tuaj yeem nrhiav tau ntau yam kev ua haujlwm nrog kev sib tw them nyiaj.
Koj tuaj yeem txuas ntxiv nrog teb cov kev xam phaj tam sim no uas koj muaj kev nkag siab zoo txog yuav ua li cas teb rau qee cov lus nug txog kev kawm kev sib tham hauv tshuab.
Nyob ntawm koj lub hom phiaj, ua cov kauj ruam hauv qab no. Npaj rau kev xam phaj los ntawm kev mus xyuas Hashdork's Kev xam phaj Series.
Sau ntawv cia Ncua