Werrej[Aħbi][Uri]
- 1. Spjega d-differenzi bejn it-tagħlim tal-magni, l-intelliġenza artifiċjali, u t-tagħlim fil-fond.
- 2. Jekk jogħġbok iddeskrivi t-tipi differenti ta 'tagħlim tal-magni.
- 3. X'inhu l-preġudizzju kontra l-varjanza?
- 4. L-algoritmi tat-tagħlim bil-magni evolvew b'mod sinifikanti maż-żmien. Kif wieħed jagħżel l-algoritmu t-tajjeb li jutilizza minħabba sett ta' dejta?
- 5. Kif ivarjaw il-kovarjanza u l-korrelazzjoni?
- 6. Fit-tagħlim tal-magni, xi jfisser clustering?
- 7. X'inhu l-algoritmu preferut tiegħek tat-tagħlim tal-magni?
- 8. Rigressjoni Lineari fit-Tagħlim tal-Magni: X'inhu?
- 9. Iddeskrivi d-differenzi bejn KNN u k-means clustering.
- 10. Xi jfisser għalik "preġudizzju ta' għażla"?
- 11. X'inhi eżattament it-Teorema ta' Bayes?
- 12. F'Mudell ta' Tagħlim Magni, x'inhuma 'sett ta' taħriġ' u 'sett tat-test'?
- 13. X'inhi Ipoteżi fit-Tagħlim Magni?
- 14. Xi jfisser it-twaħħil żejjed tat-tagħlim tal-magni, u kif jista 'jiġi evitat?
- 15. X'inhuma eżattament il-klassifikaturi Naive Bayes?
- 16. Xi jfissru l-Funzjonijiet tal-Ispejjeż u l-Funzjonijiet tat-Telf?
- 17. X'jiddistingwi mudell ġenerattiv minn mudell diskriminattiv?
- 18. Iddeskrivi l-varjazzjonijiet bejn l-iżbalji tat-Tip I u tat-Tip II.
- 19. Fit-tagħlim tal-magni, x'inhi t-teknika ta 'tagħlim Ensemble?
- 20. X'inhuma eżattament mudelli parametriċi? Agħti eżempju.
- 21. Iddeskrivi filtrazzjoni kollaborattiva. Kif ukoll iffiltrar ibbażat fuq il-kontenut?
- 22. X'tifhem eżatt bis-serje Time?
- 23. Iddeskrivi l-varjazzjonijiet bejn l-algoritmi tal-Gradjent Boosting u Random Forest.
- 24. Għaliex għandek bżonn matriċi ta 'konfużjoni? X'inhu?
- 25. X'inhi eżattament analiżi tal-komponent prinċipju?
- 26. Għaliex ir-rotazzjoni tal-komponenti hija daqshekk kruċjali għall-PCA (analiżi tal-komponenti prinċipali)?
- 27. Ir-regolarizzazzjoni u n-normalizzazzjoni kif ivarjaw minn xulxin?
- 28. In-normalizzazzjoni u l-istandardizzazzjoni kif huma differenti minn xulxin?
- 29. Xi jfisser eżattament "fattur tal-inflazzjoni tal-varjanza"?
- 30. Ibbażat fuq id-daqs tas-sett tat-taħriġ, kif tagħżel klassifikatur?
- 31. Liema algoritmu fit-tagħlim tal-magni jissejjaħ "istudent għażżien" u għaliex?
- 32. X'inhuma l-Kurva ROC u l-AUC?
- 33. X'inhuma l-iperparametri? Dak li jagħmilhom uniċi mill-parametri tal-mudell?
- 34. Xi jfissru F1 Score, recall, u preċiżjoni?
- 35. X'inhi eżattament il-validazzjoni inkroċjata?
- 36. Ejja ngħidu li skoprejt li l-mudell tiegħek għandu varjanza sinifikanti. Liema algoritmu, fl-opinjoni tiegħek, huwa l-aktar adattat biex jimmaniġġja din is-sitwazzjoni?
- 37. X'jiddistingwi r-rigressjoni ta' Ridge mir-rigressjoni ta' Lasso?
- 38. Liema hija aktar importanti: il-prestazzjoni tal-mudell jew l-eżattezza tal-mudell? Liema waħda u għaliex se tiffavorixxih?
- 39. Kif timmaniġġja sett ta' dejta b'inugwaljanzi?
- 40. Kif tista 'tiddistingwi bejn boosting u baggging?
- 41. Spjega d-differenzi bejn it-tagħlim induttiv u deduttiv.
- konklużjoni
In-negozji qed jużaw teknoloġija avvanzata, bħall-intelliġenza artifiċjali (AI) u t-tagħlim tal-magni, biex iżidu l-aċċessibbiltà tal-informazzjoni u s-servizzi għall-individwi.
Dawn it-teknoloġiji qed jiġu adottati minn varjetà ta 'industriji, inklużi l-banek, il-finanzi, il-bejgħ bl-imnut, il-manifattura u l-kura tas-saħħa.
Wieħed mill-aktar rwoli organizzattivi mfittxija li juża l-AI huwa għal xjentisti tad-dejta, inġiniera tal-intelliġenza artifiċjali, inġiniera tat-tagħlim tal-magni, u analisti tad-dejta.
Din il-kariga se twassalk permezz ta 'varjetà ta' tagħlim magna mistoqsijiet ta’ intervista, minn bażiċi għal kumplessi, biex jgħinuk tħejji għal kwalunkwe mistoqsija li tista’ tiġi mistoqsi meta tfittex ix-xogħol ideali tiegħek.
1. Spjega d-differenzi bejn it-tagħlim tal-magni, l-intelliġenza artifiċjali, u t-tagħlim fil-fond.
L-intelliġenza artifiċjali timpjega varjetà ta' tagħlim bil-magni u approċċi ta' tagħlim profond li jippermettu lis-sistemi tal-kompjuter iwettqu kompiti li jutilizzaw intelliġenza bħall-bniedem b'loġika u regoli.
It-tagħlim bil-magni juża varjetà ta’ statistika u approċċi ta’ Tagħlim Profond biex il-magni jkunu jistgħu jitgħallmu mill-prestazzjoni preċedenti tagħhom u jsiru aktar adepti biex jagħmlu ċerti kompiti waħedhom mingħajr sorveljanza umana.
Deep Learning hija ġabra ta 'algoritmi li tippermetti lis-softwer jitgħallem minnu nnifsu u jwettaq varjetà ta' funzjonijiet kummerċjali, bħar-rikonoxximent tal-vuċi u tal-istampa.
Sistemi li jesponu tagħhom b'ħafna saffi netwerks newrali għal ammonti vasti ta’ dejta għat-tagħlim huma kapaċi jagħmlu tagħlim fil-fond.
2. Jekk jogħġbok iddeskrivi t-tipi differenti ta 'tagħlim tal-magni.
It-tagħlim bil-magni jeżisti fi tliet tipi differenti ġeneralment:
- Tagħlim Superviż: Mudell joħloq tbassir jew ġudizzji bl-użu ta’ dejta tikkettata jew storika f’tagħlim tal-magni sorveljat. Settijiet ta' dejta li ġew tikkettati jew tikkettati sabiex iżidu t-tifsira tagħhom jissejħu dejta tikkettata.
- Tagħlim mhux sorveljat: M'għandniex dejta ttikkettjata għal tagħlim mhux sorveljat. Fid-dejta li tidħol, mudell jista 'jsib mudelli, oddities, u korrelazzjonijiet.
- Tagħlim ta 'Rinfurzar: Il-mudell jista' titgħallem billi tuża r-rinforz it-tagħlim u l-premjijiet li kisbet għall-imġieba preċedenti tiegħu.
3. X'inhu l-preġudizzju kontra l-varjanza?
It-twaħħil żejjed huwa riżultat ta 'preġudizzju, li huwa l-grad li fih mudell jaqbel mad-dejta. Preġudizzju huwa kkawżat minn suppożizzjonijiet mhux korretti jew sempliċi wisq fil tiegħek algoritmu ta 'tagħlim bil-magna.
Varjazzjoni tirreferi għal żbalji ikkawżati mill-kumplessità fl-algoritmu ML tiegħek, li jipproduċi sensittività għal gradi kbar ta 'varjanza fid-dejta tat-taħriġ u t-twaħħil żejjed.
Varjazzjoni hija kemm mudell ivarja skond l-inputs.
Fi kliem ieħor, mudelli bażiċi huma estremament preġudikati iżda stabbli (varjanza baxxa). It-twaħħil żejjed huwa problema b'mudelli kumplessi, għalkemm madankollu jaqbdu r-realtà tal-mudell (preġudizzju baxx).
Sabiex tiġi evitata kemm varjazzjoni għolja kif ukoll preġudizzju għoli, huwa meħtieġ kompromess bejn preġudizzju u varjanza għall-aħjar tnaqqis tal-iżball.
4. L-algoritmi tat-tagħlim bil-magni evolvew b'mod sinifikanti maż-żmien. Kif wieħed jagħżel l-algoritmu t-tajjeb li jutilizza minħabba sett ta' dejta?
It-teknika tat-tagħlim tal-magni li għandha tiġi utilizzata tiddependi biss fuq it-tip ta' data f'sett ta' data speċifiku.
Meta d-dejta tkun lineari, tintuża rigressjoni lineari. Il-metodu tal-boroż ikun jaħdem aħjar jekk id-dejta tindika nuqqas ta' linearità. Nistgħu nutilizzaw siġar tad-deċiżjonijiet jew SVM jekk id-dejta trid tiġi evalwata jew interpretata għal skopijiet kummerċjali.
Netwerks newrali jistgħu jkunu utli biex tinkiseb tweġiba preċiża jekk is-sett tad-dejta jinkludi ritratti, vidjows u awdjo.
L-għażla tal-algoritmu għal ċirkustanza speċifika jew ġbir ta' data ma tistax issir biss fuq miżura waħda.
Għall-għan li niżviluppaw l-aħjar metodu, l-ewwel irridu neżaminaw id-dejta billi tuża analiżi esploratorja tad-dejta (EDA) u nifhmu l-għan li nutilizzaw is-sett tad-dejta.
5. Kif ivarjaw il-kovarjanza u l-korrelazzjoni?
Il-kovarjanza tevalwa kif żewġ varjabbli huma konnessi ma 'xulxin u kif wieħed jista' jinbidel b'reazzjoni għal bidliet fl-ieħor.
Jekk ir-riżultat ikun pożittiv, jindika li hemm rabta diretta bejn il-varjabbli u li wieħed jitla' jew jonqos b'żieda jew tnaqqis fil-varjabbli bażi, jekk wieħed jassumi li l-kundizzjonijiet l-oħra kollha jibqgħu kostanti.
Il-korrelazzjoni tkejjel ir-rabta bejn żewġ varjabbli każwali u għandha biss tliet valuri distinti: 1, 0, u -1.
6. Fit-tagħlim tal-magni, xi jfisser clustering?
Metodi ta’ tagħlim mhux sorveljat li jiġbru l-punti tad-dejta flimkien jissejħu clustering. B'ġbir ta 'punti tad-dejta, tista' tiġi applikata t-teknika ta 'clustering.
Tista' tiġbor il-punti tad-dejta kollha skont il-funzjonijiet tagħhom billi tuża din l-istrateġija.
Il-karatteristiċi u l-kwalitajiet tal-punti tad-dejta li jaqgħu fl-istess kategorija huma simili, filwaqt li dawk tal-punti tad-dejta li jaqgħu fi gruppi separati huma differenti.
Dan l-approċċ jista' jintuża biex janalizza data statistika.
7. X'inhu l-algoritmu preferut tiegħek tat-tagħlim tal-magni?
Għandek iċ-ċans li turi l-preferenzi u t-talenti uniċi tiegħek f'din il-mistoqsija, kif ukoll l-għarfien komprensiv tiegħek ta 'tekniki numerużi ta' tagħlim bil-magni.
Hawn huma ftit algoritmi tipiċi ta' tagħlim tal-magni biex wieħed jaħseb dwarhom:
- Regressjoni lineari
- Rigressjoni loġistika
- Bayes naive
- Siġar tad-deċiżjonijiet
- K tfisser
- Algoritmu tal-foresti każwali
- K-eqreb ġar (KNN)
8. Rigressjoni Lineari fit-Tagħlim tal-Magni: X'inhu?
Algoritmu ta' tagħlim tal-magni sorveljat huwa rigressjoni lineari.
Huwa impjegat fl-analiżi ta 'tbassir biex tiddetermina l-konnessjoni lineari bejn il-varjabbli dipendenti u indipendenti.
L-ekwazzjoni tar-rigressjoni lineari hija kif ġej:
Y = A + BX
fejn:
- L-input jew il-varjabbli indipendenti jissejjaħ X.
- Il-varjabbli dipendenti jew tal-output huwa Y.
- Il-koeffiċjent ta' X huwa b, u l-interċettazzjoni tiegħu hija a.
9. Iddeskrivi d-differenzi bejn KNN u k-means clustering.
Id-distinzjoni primarja hija li KNN (metodu ta 'klassifikazzjoni, tagħlim sorveljat) jeħtieġ punti ttikkettjati filwaqt li k-means m'għandux (algoritmu ta' raggruppament, tagħlim mhux sorveljat).
Tista' tikklassifika dejta ttikkettjata f'punt mhux tikkettat billi tuża K-Nearest Neighbors. K-means clustering juża d-distanza medja bejn il-punti biex jitgħallmu kif jiġbru l-punti mhux tikkettati.
10. Xi jfisser għalik "preġudizzju ta' għażla"?
Il-preġudizzju fil-fażi ta' kampjunar ta' esperiment huwa dovut għal ineżattezza statistika.
Grupp wieħed tal-kampjun jintgħażel b'mod aktar frekwenti mill-gruppi l-oħra fl-esperiment bħala riżultat tal-ineżattezza.
Jekk il-preġudizzju tal-għażla ma jiġix rikonoxxut, jista' jirriżulta f'konklużjoni żbaljata.
11. X'inhi eżattament it-Teorema ta' Bayes?
Meta nkunu konxji ta' probabbiltajiet oħra, nistgħu niddeterminaw probabbiltà bl-użu tat-Teorema ta' Bayes. Joffri l-probabbiltà posterjuri ta' okkorrenza bbażata fuq informazzjoni minn qabel, fi kliem ieħor.
Metodu sod għall-istima tal-probabbiltajiet kondizzjonali huwa pprovdut minn din it-teorema.
Meta tiżviluppa problemi ta 'mudellar ta' tbassir ta 'klassifikazzjoni u twaħħil ta' mudell għal taħriġ dataset fit-tagħlim tal-magni, tiġi applikata t-teorema ta' Bayes (jiġifieri Naive Bayes, Bayes Optimal Classifier).
12. F'Mudell ta' Tagħlim Magni, x'inhuma 'sett ta' taħriġ' u 'sett tat-test'?
Sett ta' taħriġ:
- Is-sett ta' taħriġ jikkonsisti f'każijiet li jintbagħtu lill-mudell għall-analiżi u t-tagħlim.
- Din hija d-dejta ttikkettjata li se tintuża biex jitħarreġ il-mudell.
- Tipikament, 70% tad-dejta totali tintuża bħala s-sett tad-dejta tat-taħriġ.
Sett tat-Test:
- Is-sett tat-test jintuża biex jevalwa l-eżattezza tal-ġenerazzjoni tal-ipoteżi tal-mudell.
- Aħna nittestjaw mingħajr data ttikkettjata u mbagħad nużaw tikketti biex nikkonfermaw ir-riżultati.
- It-30% li jifdal jintuża bħala sett tad-dejta tat-test.
13. X'inhi Ipoteżi fit-Tagħlim Magni?
It-Tagħlim tal-Machine jippermetti l-użu ta’ settijiet ta’ dejta eżistenti biex jifhmu aħjar funzjoni partikolari li tgħaqqad l-input mal-output. Dan huwa magħruf bħala approssimazzjoni tal-funzjoni.
F'dan il-każ, l-approssimazzjoni għandha tintuża għall-funzjoni tal-mira mhux magħrufa biex tittrasferixxi l-osservazzjonijiet kollha konċepibbli bbażati fuq is-sitwazzjoni mogħtija bl-aħjar mod possibbli.
Fit-tagħlim tal-magni, ipoteżi hija mudell li jgħin fl-istima tal-funzjoni fil-mira u fit-tlestija tal-mappings xierqa ta 'input-to-output.
L-għażla u d-disinn tal-algoritmi jippermettu d-definizzjoni tal-ispazju tal-ipoteżi possibbli li jistgħu jiġu rappreżentati minn mudell.
Għal ipoteżi waħda, tintuża h (h) minusura, iżda h kapitali (H) tintuża għall-ispazju kollu tal-ipoteżi li qed jiġi mfittex. Aħna ser nirrevedu fil-qosor dawn in-notazzjonijiet:
- Ipoteżi (h) hija mudell partikolari li jiffaċilita l-immappjar tal-input għall-output, li sussegwentement jista 'jintuża għall-evalwazzjoni u t-tbassir.
- Sett ta' ipoteżi (H) huwa spazju li jista' jitfittex ta' ipoteżijiet li jista' jintuża biex jiġi mmappjat l-inputs għall-outputs. It-tfassil tal-ħruġ, il-mudell u l-konfigurazzjoni tal-mudell huma ftit eżempji ta’ limitazzjonijiet ġeneriċi.
14. Xi jfisser it-twaħħil żejjed tat-tagħlim tal-magni, u kif jista 'jiġi evitat?
Meta magna tipprova titgħallem minn sett ta' dejta insuffiċjenti, iseħħ it-twaħħil żejjed.
Bħala riżultat, it-twaħħil żejjed huwa inversament korrelatat mal-volum tad-dejta. L-approċċ ta' validazzjoni inkroċjata jippermetti li jiġi evitat l-iffittjar żejjed għal settijiet ta' dejta żgħar. Sett tad-dejta huwa maqsum f'żewġ partijiet f'dan il-metodu.
Is-sett tad-dejta għall-ittestjar u t-taħriġ se jikkonsisti minn dawn iż-żewġ partijiet. Is-sett tad-dejta tat-taħriġ jintuża biex jinħoloq mudell, filwaqt li s-sett tad-dejta tal-ittestjar jintuża biex jevalwa l-mudell billi juża inputs differenti.
Dan huwa kif tipprevjeni t-twaħħil żejjed.
15. X'inhuma eżattament il-klassifikaturi Naive Bayes?
Diversi metodi ta 'klassifikazzjoni jiffurmaw il-klassifikaturi Naive Bayes. Sett ta' algoritmi magħrufa bħala dawn il-klassifikaturi kollha jaħdmu fuq l-istess idea fundamentali.
Is-suppożizzjoni magħmula minn klassifikaturi Bayes naive hija li l-preżenza jew l-assenza ta 'karatteristika waħda m'għandha l-ebda effett fuq il-preżenza jew in-nuqqas ta' karatteristika oħra.
Fi kliem ieħor, dan huwa dak li nirreferu għalih bħala "naive" peress li jagħmel is-suppożizzjoni li kull attribut tas-sett tad-dejta huwa ugwalment sinifikanti u indipendenti.
Il-klassifikazzjoni ssir bl-użu ta’ klassifikaturi Bayes naive. Huma sempliċi biex jintużaw u jipproduċu riżultati aħjar minn tbassir aktar kumplessi meta l-premessa tal-indipendenza hija vera.
Fl-analiżi tat-test, filtrazzjoni tal-ispam, u sistemi ta 'rakkomandazzjoni, huma impjegati.
16. Xi jfissru l-Funzjonijiet tal-Ispejjeż u l-Funzjonijiet tat-Telf?
Il-frażi "funzjoni ta' telf" tirreferi għall-proċess tat-telf tal-kompjuter meta titqies biċċa data waħda biss.
Kuntrarjament, aħna nużaw il-funzjoni tal-ispiża biex niddeterminaw l-ammont totali ta 'żbalji għal dejta numeruża. Ma teżisti l-ebda distinzjoni sinifikanti.
Fi kliem ieħor, filwaqt li l-funzjonijiet tal-ispiża jaggregaw id-differenza għas-sett tad-dejta tat-taħriġ kollu, il-funzjonijiet tat-telf huma mfassla biex jaqbdu d-differenza bejn il-valuri attwali u mbassra għal rekord wieħed.
17. X'jiddistingwi mudell ġenerattiv minn mudell diskriminattiv?
Mudell diskriminattiv jitgħallem id-differenzi bejn diversi kategoriji tad-dejta. Mudell ġenerattiv jiġbor fuq tipi ta 'dejta differenti.
Dwar problemi ta' klassifikazzjoni, mudelli diskriminattivi ħafna drabi jaqbżu mudelli oħra.
18. Iddeskrivi l-varjazzjonijiet bejn l-iżbalji tat-Tip I u tat-Tip II.
Il-pożittivi foloz jaqgħu taħt il-kategorija tal-iżbalji tat-Tip I, filwaqt li n-negattivi foloz jaqgħu taħt l-iżbalji tat-Tip II (li jallegaw li ma ġara xejn meta fil-fatt sar).
19. Fit-tagħlim tal-magni, x'inhi t-teknika ta 'tagħlim Ensemble?
Teknika msejħa tagħlim ensemble tħallat ħafna mudelli ta 'tagħlim tal-magni biex tipproduċi mudelli aktar qawwija.
Mudell jista 'jiġi varjat għal varjetà ta' raġunijiet. Diversi kawżi huma:
- Popolazzjonijiet Diversi
- Diversi Ipotesi
- Diversi metodi ta 'mudellar
Se niltaqgħu ma' kwistjoni waqt li nużaw id-dejta tat-taħriġ u l-ittestjar tal-mudell. Preġudizzju, varjanza, u żball irriduċibbli huma tipi possibbli ta 'dan l-iżball.
Issa, insejħu dan il-bilanċ bejn il-preġudizzju u l-varjanza fil-mudell kompromess ta 'preġudizzju-varjanza, u għandu dejjem jeżisti. Dan il-kompromess jitwettaq permezz tal-użu tat-tagħlim ensemble.
Għalkemm hemm diversi approċċi ta 'ensemble disponibbli, hemm żewġ strateġiji komuni biex tgħaqqad ħafna mudelli:
- Approċċ nattiv imsejjaħ bagging juża s-sett ta 'taħriġ biex jipproduċi settijiet ta' taħriġ addizzjonali.
- Boosting, teknika aktar sofistikata: L-istess bħall-bagging, il-boosting jintuża biex tinstab il-formula tal-ippeżar ideali għal sett ta 'taħriġ.
20. X'inhuma eżattament mudelli parametriċi? Agħti eżempju.
Hemm ammont limitat ta 'parametri fil-mudelli parametriċi. Biex tbassar id-dejta, kull ma trid tkun taf huma l-parametri tal-mudell.
Dawn li ġejjin huma eżempji tipiċi: rigressjoni loġistika, rigressjoni lineari, u SVMs lineari. Mudelli mhux parametriċi huma flessibbli peress li jista 'jkun fihom numru illimitat ta' parametri.
Il-parametri tal-mudell u l-istatus tad-dejta osservata huma meħtieġa għat-tbassir tad-dejta. Hawn huma xi eżempji tipiċi: mudelli ta’ suġġetti, siġar tad-deċiżjonijiet, u k-eqreb ġirien.
21. Iddeskrivi filtrazzjoni kollaborattiva. Kif ukoll iffiltrar ibbażat fuq il-kontenut?
Metodu ppruvat u veru għall-ħolqien ta' suġġerimenti ta' kontenut imfassal apposta huwa l-iffiltrar kollaborattiv.
Forma ta 'sistema ta' rakkomandazzjoni msejħa filtrazzjoni kollaborattiva tbassar materjal frisk billi tibbilanċja l-preferenzi tal-utent ma 'interessi kondiviżi.
Il-preferenzi tal-utent huma l-unika ħaġa li s-sistemi ta' rakkomandazzjoni bbażati fuq il-kontenut jikkunsidraw. Fid-dawl tal-għażliet preċedenti tal-utent, rakkomandazzjonijiet ġodda huma pprovduti minn materjal relatat.
22. X'tifhem eżatt bis-serje Time?
Serje ta' żmien hija ġabra ta' numri f'ordni axxendenti. Matul perjodu ta 'żmien predeterminat, jimmonitorja l-moviment tal-punti tad-dejta magħżula u perjodikament jaqbad il-punti tad-dejta.
M'hemm l-ebda input ta' ħin minimu jew massimu għal serje ta' ħin.
Is-serje tal-ħin huma spiss użati mill-analisti biex janalizzaw id-dejta skont ir-rekwiżiti uniċi tagħhom.
23. Iddeskrivi l-varjazzjonijiet bejn l-algoritmi tal-Gradjent Boosting u Random Forest.
Foresti każwali:
- Numru kbir ta 'siġar tad-deċiżjonijiet huma miġbura flimkien fl-aħħar u huma magħrufa bħala foresti każwali.
- Filwaqt li t-tisħiħ tal-gradjent jipproduċi kull siġra indipendentement mill-oħrajn, il-foresta bl-addoċċ tibni kull siġra waħda waħda.
- Multiklassi sejbien ta 'oġġett jaħdem tajjeb mal-foresti każwali.
Spinta tal-gradjent:
- Filwaqt li l-foresti Random jingħaqdu mas-siġar tad-deċiżjonijiet fl-aħħar tal-proċess, Magni li Jgħollu l-Gradient jgħaqqduhom mill-bidu.
- Jekk il-parametri huma aġġustati b'mod xieraq, it-tisħiħ tal-gradjent jegħleb il-foresti każwali f'termini ta 'riżultati, iżda mhix għażla intelliġenti jekk is-sett tad-dejta jkollu ħafna każijiet ta' barra, anomaliji jew storbju peress li jista 'jikkawża li l-mudell isir iżżejjed.
- Meta jkun hemm data żbilanċjata, kif hemm fil-valutazzjoni tar-riskju f'ħin reali, it-tisħiħ tal-gradjent jaħdem tajjeb.
24. Għaliex għandek bżonn matriċi ta 'konfużjoni? X'inhu?
Tabella magħrufa bħala l-matriċi ta 'konfużjoni, xi kultant magħrufa bħala l-matriċi ta' żball, tintuża ħafna biex turi kemm mudell ta 'klassifikazzjoni, jew klassifikatur, jaħdem tajjeb fuq sett ta' data tat-test li għalihom il-valuri reali huma magħrufa.
Dan jippermettilna naraw kif jaħdem mudell jew algoritmu. Jagħmilha sempliċi għalina li nsibu nuqqas ta' ftehim fost diversi korsijiet.
Iservi bħala mod biex jiġi evalwat kemm jitwettaq mudell jew algoritmu.
Il-previżjonijiet ta' mudell ta' klassifikazzjoni huma miġbura f'matriċi ta' konfużjoni. Il-valuri tal-għadd ta' kull tikketta tal-klassi ntużaw biex ikissru n-numru totali ta' tbassir korretti u mhux korretti.
Jipprovdi dettalji dwar il-ħsarat magħmula mill-klassifikatur kif ukoll it-tipi differenti ta 'żbalji kkawżati mill-klassifikaturi.
25. X'inhi eżattament analiżi tal-komponent prinċipju?
Billi timminimizza n-numru ta 'varjabbli li huma korrelatati ma' xulxin, l-għan huwa li tiġi minimizzata d-dimensjonalità tal-ġbir tad-dejta. Iżda huwa importanti li tinżamm id-diversità kemm jista 'jkun.
Il-varjabbli jinbidlu f'sett kompletament ġdid ta' varjabbli msejħa komponenti prinċipali.
Dawn il-PCs huma ortogonali peress li huma eigenvectors ta' matriċi ta' kovarjanza.
26. Għaliex ir-rotazzjoni tal-komponenti hija daqshekk kruċjali għall-PCA (analiżi tal-komponenti prinċipali)?
Ir-rotazzjoni hija kruċjali fil-PCA minħabba li tottimizza s-separazzjoni bejn il-varjazzjonijiet miksuba minn kull komponent, u tagħmel l-interpretazzjoni tal-komponenti aktar sempliċi.
Aħna neħtieġu komponenti estiżi biex jesprimu l-varjazzjoni tal-komponent jekk il-komponenti ma jiġux imdawra.
27. Ir-regolarizzazzjoni u n-normalizzazzjoni kif ivarjaw minn xulxin?
Normalizzazzjoni:
Id-dejta tinbidel waqt in-normalizzazzjoni. Għandek tinnormalizza d-dejta jekk ikollha skali li huma drastikament differenti, speċjalment minn baxx għal għoli. Aġġusta kull kolonna sabiex l-istatistika fundamentali tkun kollha kompatibbli.
Biex jiġi żgurat li ma jkunx hemm telf ta 'preċiżjoni, dan jista' jkun utli. Is-sejbien tas-sinjal filwaqt li jinjora l-istorbju huwa wieħed mill-għanijiet tat-taħriġ tal-mudell.
Hemm ċans ta 'twaħħil żejjed jekk il-mudell jingħata kontroll sħiħ biex jitnaqqas l-iżball.
Ir-regolarizzazzjoni:
Fir-regolarizzazzjoni, il-funzjoni tat-tbassir hija modifikata. Dan huwa suġġett għal xi kontroll permezz tar-regolarizzazzjoni, li tiffavorixxi funzjonijiet ta 'twaħħil aktar sempliċi fuq dawk ikkumplikati.
28. In-normalizzazzjoni u l-istandardizzazzjoni kif huma differenti minn xulxin?
Iż-żewġ tekniki l-aktar użati għall-iskala tal-karatteristiċi huma n-normalizzazzjoni u l-istandardizzazzjoni.
Normalizzazzjoni:
- L-iskala mill-ġdid tad-dejta biex tkun adattata għal firxa [0,1] hija magħrufa bħala normalizzazzjoni.
- Meta l-parametri kollha għandu jkollhom l-istess skala pożittiva, in-normalizzazzjoni hija utli, iżda l-outliers tas-sett tad-dejta jintilfu.
Ir-regolarizzazzjoni:
- Id-dejta tiġi skalata mill-ġdid biex ikollha medja ta' 0 u devjazzjoni standard ta' 1 bħala parti mill-proċess ta' standardizzazzjoni (Varjanza tal-unità)
29. Xi jfisser eżattament "fattur tal-inflazzjoni tal-varjanza"?
Il-proporzjon tal-varjanza tal-mudell mal-varjanza tal-mudell b'varjabbli indipendenti wieħed biss huwa magħruf bħala l-fattur tal-inflazzjoni tal-varjazzjoni (VIF).
VIF jistma l-ammont ta 'multicollinearity preżenti f'sett ta' diversi varjabbli ta 'rigressjoni.
Varjazzjoni tal-Mudell tal-Mudell (VIF) b'Varjanza Varjabbli Waħda Indipendenti
30. Ibbażat fuq id-daqs tas-sett tat-taħriġ, kif tagħżel klassifikatur?
Mudell ta 'preġudizzju għoli, varjanza baxxa jaħdem aħjar għal sett ta' taħriġ qasir peress li t-twaħħil żejjed huwa inqas probabbli. Naive Bayes huwa eżempju wieħed.
Sabiex tirrappreżenta interazzjonijiet aktar ikkumplikati għal sett kbir ta 'taħriġ, mudell bi preġudizzju baxx u varjanza għolja huwa preferibbli. Rigressjoni loġistika hija eżempju tajjeb.
31. Liema algoritmu fit-tagħlim tal-magni jissejjaħ "istudent għażżien" u għaliex?
Student kajman, KNN huwa algoritmu ta 'tagħlim bil-magni. Minħabba li K-NN jikkalkula b'mod dinamiku d-distanza kull darba li jixtieq jikklassifika minflok ma jitgħallem xi valuri jew varjabbli mitgħallma mill-magni mid-dejta tat-taħriġ, jimmemorizza s-sett tad-dejta tat-taħriġ.
Dan jagħmel K-NN student għażżien.
32. X'inhuma l-Kurva ROC u l-AUC?
Il-prestazzjoni ta' mudell ta' klassifikazzjoni fil-limiti kollha hija rappreżentata grafikament mill-kurva ROC. Għandu kriterji ta' rata pożittiva vera u kriterji ta' rata pożittiva falza.
Fi kliem sempliċi, iż-żona taħt il-kurva ROC hija magħrufa bħala AUC (Area Under the ROC Curve). L-erja bidimensjonali tal-kurva ROC minn (0,0) sa AUC titkejjel (1,1). Għall-valutazzjoni tal-mudelli ta 'klassifikazzjoni binarja, hija użata bħala statistika tal-prestazzjoni.
33. X'inhuma l-iperparametri? Dak li jagħmilhom uniċi mill-parametri tal-mudell?
Varjabbli intern tal-mudell huwa magħruf bħala parametru tal-mudell. Bl-użu tad-dejta tat-taħriġ, il-valur ta' parametru huwa approssimat.
Mhux magħruf mill-mudell, iperparametru huwa varjabbli. Il-valur ma jistax jiġi ddeterminat mid-dejta, għalhekk huma spiss użati biex jiġu kkalkulati l-parametri tal-mudell.
34. Xi jfissru F1 Score, recall, u preċiżjoni?
Il-Miżura ta' konfużjoni hija l-metrika użata biex titkejjel l-effettività tal-mudell ta' klassifikazzjoni. Il-frażijiet li ġejjin jistgħu jintużaw biex jispjegaw aħjar il-metrika tal-konfużjoni:
TP: Pożittivi Veri - Dawn huma l-valuri pożittivi li kienu antiċipati kif suppost. Jissuġġerixxi li l-valuri tal-klassi pproġettata u l-klassi attwali huma t-tnejn pożittivi.
TN: Negattivi Veri - Dawn huma l-valuri avversi li kienu mbassra b'mod preċiż. Jissuġġerixxi li kemm il-valur tal-klassi attwali kif ukoll il-klassi antiċipata huma negattivi.
Dawn il-valuri—pożittivi foloz u negattivi foloz—iseħħu meta l-klassi attwali tiegħek tvarja mill-klassi antiċipata.
issa,
Il-proporzjon tar-rata pożittiva vera (TP) għall-osservazzjonijiet kollha magħmula fil-klassi attwali jissejjaħ sejħa lura, magħrufa wkoll bħala sensittività.
L-irtirar huwa TP/(TP+FN).
Il-preċiżjoni hija miżura tal-valur ta 'tbassir pożittiv, li tqabbel in-numru ta' pożittivi li l-mudell ibassar verament ma' kemm ibassar pożittivi korretti b'mod preċiż.
Il-preċiżjoni hija TP/(TP + FP)
L-eħfef metrika tal-prestazzjoni biex tinftiehem hija l-eżattezza, li hija biss il-proporzjon tal-osservazzjonijiet imbassra sew għall-osservazzjonijiet kollha.
L-eżattezza hija ugwali għal (TP+TN)/(TP+FP+FN+TN).
Preċiżjoni u Recall huma peżati u medja biex jipprovdu l-F1 Score. Bħala riżultat, dan il-punteġġ iqis kemm pożittivi foloz kif ukoll negattivi foloz.
F1 ta 'spiss huwa aktar siewi mill-eżattezza, partikolarment jekk għandek distribuzzjoni ta' klassi mhux ugwali, anki jekk intuwittivament ma tkunx sempliċi biex tifhem daqs l-eżattezza.
L-aħjar preċiżjoni tinkiseb meta l-ispiża ta 'pożittivi foloz u negattivi foloz tkun komparabbli. Huwa preferibbli li jiġu inklużi kemm Preċiżjoni kif ukoll Recall jekk l-ispejjeż assoċjati ma 'pożittivi foloz u negattivi foloz ivarjaw b'mod sinifikanti.
35. X'inhi eżattament il-validazzjoni inkroċjata?
Approċċ ta’ kampjunar mill-ġdid statistiku msejjaħ cross-validation fit-tagħlim tal-magni jimpjega diversi sottosettijiet ta’ dataset biex iħarreġ u jevalwa algoritmu ta’ tagħlim tal-magni f’numru ta’ rawnds.
Lott ġdid ta 'dejta li ma ntużatx biex jitħarreġ il-mudell jiġi ttestjat bl-użu ta' validazzjoni inkroċjata biex tara kemm il-mudell ibassarha tajjeb. It-twaħħil żejjed tad-dejta jiġi evitat permezz ta' validazzjoni inkroċjata.
K-Fold Il-metodu ta' kampjunar mill-ġdid li jintuża l-aktar ta' spiss jaqsam is-sett tad-dejta kollu f'K settijiet ta' daqsijiet ugwali. Din tissejjaħ cross-validation.
36. Ejja ngħidu li skoprejt li l-mudell tiegħek għandu varjanza sinifikanti. Liema algoritmu, fl-opinjoni tiegħek, huwa l-aktar adattat biex jimmaniġġja din is-sitwazzjoni?
Ġestjoni ta' varjabilità għolja
Għandna nużaw it-teknika tal-boroż għal problemi b'varjazzjonijiet kbar.
Kampjunar ripetut ta' dejta każwali jintuża mill-algoritmu tal-boroż biex jaqsam id-dejta f'sottogruppi. Ladarba d-dejta tkun ġiet maqsuma, nistgħu nutilizzaw dejta każwali u proċedura ta 'taħriġ speċifika biex niġġeneraw regoli.
Wara dan, il-votazzjoni jista 'jintuża biex jgħaqqad it-tbassir tal-mudell.
37. X'jiddistingwi r-rigressjoni ta' Ridge mir-rigressjoni ta' Lasso?
Żewġ metodi ta 'regolarizzazzjoni użati ħafna huma rigressjoni Lasso (imsejħa wkoll L1) u Ridge (xi kultant imsejħa L2). Jintużaw biex jipprevjenu t-twaħħil żejjed tad-dejta.
Sabiex tiġi skoperta l-aħjar soluzzjoni u tiġi minimizzata l-kumplessità, dawn it-tekniki huma użati biex jikkastigaw il-koeffiċjenti. Billi tippenalizza t-total tal-valuri assoluti tal-koeffiċjenti, ir-rigressjoni Lasso topera.
Il-funzjoni tal-penali f'Ridge jew rigressjoni L2 hija derivata mis-somma tal-kwadri tal-koeffiċjenti.
38. Liema hija aktar importanti: il-prestazzjoni tal-mudell jew l-eżattezza tal-mudell? Liema waħda u għaliex se tiffavorixxih?
Din hija mistoqsija qarrieqa, għalhekk wieħed għandu l-ewwel jifhem x'inhi l-Prestazzjoni tal-Mudell. Jekk il-prestazzjoni hija definita bħala veloċità, allura tiddependi fuq it-tip ta 'applikazzjoni; kwalunkwe applikazzjoni li tinvolvi sitwazzjoni f'ħin reali tkun teħtieġ veloċità għolja bħala komponent kruċjali.
Pereżempju, l-aħjar Riżultati tat-Tiftix se jsiru inqas siewja jekk ir-riżultati tal-Mistoqsija jdumu wisq biex jaslu.
Jekk il-Prestazzjoni tintuża bħala ġustifikazzjoni għala l-preċiżjoni u l-irtirar għandhom ikunu prijoritizzati 'l fuq mill-eżattezza, allura punteġġ F1 ikun aktar utli mill-eżattezza biex jintwera l-każ tan-negozju għal kwalunkwe sett ta' dejta li jkun żbilanċjat.
39. Kif timmaniġġja sett ta' dejta b'inugwaljanzi?
Sett ta' dejta żbilanċjat jista' jibbenefika minn tekniki ta' teħid ta' kampjuni. It-teħid ta' kampjuni jista' jsir jew b'mod taħt jew b'mod żejjed.
Taħt il-Kampjuni jippermettilna li nnaqqsu d-daqs tal-klassi tal-maġġoranza biex tqabbel mal-klassi tal-minoranza, li tgħin biex tiżdied il-veloċità fir-rigward tal-ħażna u l-eżekuzzjoni tal-run-time iżda tista 'tirriżulta wkoll fit-telf ta' dejta siewja.
Sabiex nirrimedjaw il-kwistjoni tat-telf ta 'informazzjoni ikkawżat minn teħid ta' kampjuni żejjed, aħna nieħdu kampjuni tal-klassi tal-Minoranza; madankollu, dan iġġiegħelna nidħlu fi kwistjonijiet ta' twaħħil żejjed.
Strateġiji addizzjonali jinkludu:
- Kampjuni Ibbażat fuq Cluster- L-istanzi tal-klassi tal-minoranza u l-maġġoranza huma suġġetti individwalment għat-teknika ta 'clustering K-means f'din is-sitwazzjoni. Dan isir biex jinstabu raggruppamenti tas-sett tad-dejta. Imbagħad, kull cluster jiġi kampjunat iżżejjed sabiex il-klassijiet kollha jkollhom l-istess daqs u l-clusters kollha fi ħdan klassi jkollhom numru ugwali ta’ każijiet.
- SMOTE: Teknika ta' Sampling Over-Sintetic Minority- Porzjon ta' dejta mill-klassi ta' minoranza tintuża bħala eżempju, u wara jiġu prodotti istanzi artifiċjali addizzjonali li huma komparabbli magħha u miżjuda mas-sett ta' dejta oriġinali. Dan il-metodu jaħdem tajjeb ma 'punti ta' data numerika.
40. Kif tista 'tiddistingwi bejn boosting u baggging?
Ensemble Techniques għandhom verżjonijiet magħrufa bħala bagging u boosting.
L-ixkejjer-
Għal algoritmi b'varjazzjoni għolja, l-ixkejjer huwa teknika użata biex titbaxxa l-varjanza. Familja waħda ta' klassifikaturi bħal dawn li hija suxxettibbli għal preġudizzju hija l-familja tas-siġra tad-deċiżjonijiet.
It-tip ta' dejta li s-siġar tad-deċiżjonijiet jiġu mħarrġa fuqha għandu impatt sinifikanti fuq il-prestazzjoni tagħhom. Minħabba dan, anke b'rfinar għoli ħafna, il-ġeneralizzazzjoni tar-riżultati kultant tkun ferm aktar diffiċli biex tinkiseb fihom.
Jekk id-dejta tat-taħriġ tas-siġar tad-deċiżjonijiet tinbidel, ir-riżultati jvarjaw sostanzjalment.
Bħala konsegwenza, jintuża l-ixkejjer, li fih jinħolqu ħafna siġar tad-deċiżjonijiet, li kull waħda minnhom hija mħarrġa bl-użu ta 'kampjun tad-dejta oriġinali, u r-riżultat aħħari huwa l-medja ta' dawn il-mudelli differenti kollha.
Spinta:
L-ispinta hija t-teknika li tagħmel tbassir b'sistema ta 'klassifikazzjoni n-dgħajfa li fiha kull klassifikatur dgħajjef jagħmel tajjeb għan-nuqqasijiet tal-klassifikaturi aktar b'saħħithom tiegħu. Nirreferu għal klassifikatur li jaħdem ħażin fuq sett ta’ data partikolari bħala "klassifikatur dgħajjef."
It-tisħiħ huwa ovvjament proċess aktar milli algoritmu. Rigressjoni loġistika u siġar ta 'deċiżjonijiet baxxi huma eżempji komuni ta' klassifikaturi dgħajfa.
Adaboost, Gradient Boosting, u XGBoost huma ż-żewġ algoritmi ta' spinta l-aktar popolari, madankollu, hemm ħafna aktar.
41. Spjega d-differenzi bejn it-tagħlim induttiv u deduttiv.
Meta jitgħallem bl-eżempju minn sett ta’ eżempji osservati, mudell juża tagħlim induttiv biex jasal għal konklużjoni ġeneralizzata. Min-naħa l-oħra, bit-tagħlim deduttiv, il-mudell juża r-riżultat qabel ma jifforma tiegħu.
It-tagħlim induttiv huwa l-proċess ta 'teħid ta' konklużjonijiet mill-osservazzjonijiet.
It-tagħlim deduttiv huwa l-proċess tal-ħolqien ta' osservazzjonijiet ibbażati fuq inferenzi.
konklużjoni
Prosit! Dawn huma l-aqwa 40 u aktar mistoqsijiet tal-intervista għat-tagħlim tal-magni li issa taf it-tweġibiet għalihom. Xjenza tad-data u intelliġenza artifiċjali okkupazzjonijiet se jkomplu jkunu fid-domanda hekk kif tavvanza t-teknoloġija.
Il-kandidati li jaġġornaw l-għarfien tagħhom ta’ dawn it-teknoloġiji avvanzati u jtejbu s-sett ta’ ħiliet tagħhom jistgħu jsibu varjetà wiesgħa ta’ possibbiltajiet ta’ impjieg b’paga kompetittiva.
Tista' tipproċedi billi twieġeb l-intervisti issa li għandek fehim sod ta' kif twieġeb għal xi wħud mill-mistoqsijiet tal-intervisti ta' tagħlim bil-magni li huma mistoqsi b'mod wiesa'.
Skont il-miri tiegħek, ħu l-pass li ġej. Ipprepara għall-intervisti billi żżur Hashdork's Serje ta' Intervisti.
Ħalli Irrispondi