Clár na nÁbhar[Folaigh][Taispeáin]
- 1. Mínigh na difríochtaí idir foghlaim meaisín, hintleachta saorga, agus foghlaim dhomhain.
- 2. Déan cur síos le do thoil ar na cineálacha éagsúla foghlama meaisín.
- 3. Cad é an comhbhabhtáil idir laofacht in aghaidh athraithis?
- 4. Tá halgartaim foghlama meaisín tagtha chun cinn go mór le himeacht ama. Conas a roghnaíonn duine an t-algartam ceart chun tacar sonraí a úsáid?
- 5. Cén difríocht atá idir comhathraitheas agus comhghaol?
- 6. I meaisínfhoghlaim, cad a chiallaíonn cnuasú?
- 7. Cad é an t-algartam meaisínfhoghlama is fearr leat?
- 8. Aischéimniú Líneach san Fhoghlaim Meaisín: Cad É?
- 9. Déan cur síos ar na difríochtaí idir KNN agus cnuasú modhanna k.
- 10. Cad a chiallaíonn “claonadh roghnóireachta” duitse?
- 11. Cad é go díreach Teoirim Bayes?
- 12. I Múnla Foghlama Meaisín, cad iad 'Tacar Oiliúna' agus 'Tacar Tástála'?
- 13. Cad is Hipitéis i bhFoghlaim Meaisín?
- 14. Cad a chiallaíonn rófheisteas meaisínfhoghlama, agus conas is féidir é a chosc?
- 15. Cad é go díreach aicmitheoirí Naive Bayes?
- 16. Cad a chiallaíonn Feidhmeanna Costas agus Feidhmeanna Caillteanais?
- 17. Cad a dhéanann idirdhealú idir samhail ginideach agus samhail idirdhealaitheach?
- 18. Déan cur síos ar na héagsúlachtaí idir earráidí de Chineál I agus Chineál II.
- 19. I meaisínfhoghlaim, cad é an teicníc foghlama Ensemble?
- 20. Cad é go díreach samhlacha paraiméadracha? Tabhair sampla.
- 21. Déan cur síos ar scagadh comhoibríoch. Chomh maith le scagadh ábhar-bhunaithe?
- 22. Cad go díreach atá i gceist agat leis an tsraith Am?
- 23. Déan cur síos ar na héagsúlachtaí idir na halgartaim Treisiú Grádáin agus an Fhoraois Randamach.
- 24. Cén fáth a bhfuil maitrís mearbhall ag teastáil uait? Cad é sin?
- 25. Cad é go díreach anailís chomhpháirte prionsabal?
- 26. Cén fáth a bhfuil rothlú comhpháirteanna chomh ríthábhachtach sin do PCA (anailís ar phríomh-chomhpháirteanna)?
- 27. Conas a athraíonn rialtacht agus normalú óna chéile?
- 28. Conas atá normalú agus caighdeánú difriúil óna chéile?
- 29. Cad go díreach a chiallaíonn “fachtóir boilscithe athraitheachta”?
- 30. Bunaithe ar mhéid na sraithe oiliúna, conas a roghnaíonn tú aicmitheoir?
- 31. Cén algartam i meaisínfhoghlama a dtugtar an “foghlaimeoir leisciúil” air agus cén fáth?
- 32. Cad iad Cuar ROC agus AUC?
- 33. Cad is hipearpharaiméadair ann? Cad a dhéanann uathúil iad ó pharaiméadair an mhúnla?
- 34. Cad is brí le Scór F1, le haisghairm agus le beachtas?
- 35. Cad é go díreach atá i gceist le tras-bhailíochtú?
- 36. Ligean le rá go bhfuair tú amach go bhfuil éagsúlacht shuntasach ag do mhúnla. Cén algartam, dar leat, is oiriúnaí chun an cás seo a láimhseáil?
- 37. Cad a dhéanann idirdhealú idir aischéimniú Ridge agus aischéimniú Lasso?
- 38. Cé acu atá níos tábhachtaí: feidhmíocht mhúnla nó cruinneas múnla? Cén ceann agus cén fáth a mbeidh tú i bhfabhar é?
- 39. Conas a dhéanfá tacar sonraí le héagothroime a bhainistiú?
- 40. Conas is féidir leat idirdhealú a dhéanamh idir treisiú agus bagáil?
- 41. Mínigh na difríochtaí idir foghlaim ionduchtach agus asbhainteach.
- Conclúid
Tá gnólachtaí ag baint leasa as teicneolaíocht cheannródaíoch, amhail hintleachta saorga (AI) agus meaisínfhoghlaim, chun inrochtaineacht faisnéise agus seirbhísí do dhaoine aonair a mhéadú.
Tá na teicneolaíochtaí seo á nglacadh ag tionscail éagsúla, lena n-áirítear baincéireacht, airgeadas, miondíol, déantúsaíocht agus cúram sláinte.
Tá eolaithe sonraí, innealtóirí hintleachta saorga, innealtóirí foghlama meaisín, agus anailísithe sonraí ar cheann de na róil eagraíochtúla is mó a bhfuiltear ag lorg úsáid a bhaint as AI.
Tabharfaidh an post seo tú trí raon de foghlaim meaisín ceisteanna agallaimh, ón mbunús go dtí an casta, chun cabhrú leat ullmhú d’aon cheisteanna a d’fhéadfaí a chur ort agus tú ag lorg do phost idéalach.
1. Mínigh na difríochtaí idir foghlaim meaisín, hintleachta saorga, agus foghlaim dhomhain.
Úsáideann faisnéis shaorga éagsúlacht de chur chuige meaisínfhoghlama agus domhainfhoghlama a ligeann do chórais ríomhaireachta tascanna a dhéanamh ag baint úsáide as faisnéis atá cosúil leis an duine le loighic agus rialacha.
Úsáideann foghlaim meaisín éagsúlacht staitisticí agus cineálacha cur chuige Deepfhoghlama chun meaisíní a chumasú chun foghlaim óna gcuid feidhmíochta roimhe seo agus a bheith níos cumasaí maidir le tascanna áirithe a dhéanamh ina n-aonar gan maoirseacht dhaonna.
Is bailiúchán halgartaim é Deep Learning a ligeann do na bogearraí foghlaim uaidh féin agus éagsúlacht feidhmeanna tráchtála a chur i gcrích, mar aitheantas gutha agus pictiúr.
Córais a nochtar a n-ilsraitheach líonraí neural go bhfuil méideanna ollmhóra sonraí le haghaidh foghlama in ann foghlaim dhomhain a dhéanamh.
2. Déan cur síos le do thoil ar na cineálacha éagsúla foghlama meaisín.
Tá meaisínfhoghlaim i dtrí chineál éagsúla go ginearálta:
- Foghlaim faoi Mhaoirseacht: Cruthaíonn samhail tuartha nó breithiúnais ag úsáid sonraí lipéadaithe nó stairiúla i meaisínfhoghlaim faoi mhaoirseacht. Tagraítear do thacair sonraí atá clibáilte nó lipéadaithe chun a mbrí a mhéadú mar shonraí lipéadaithe.
- Foghlaim gan Maoirseacht: Níl sonraí lipéadaithe againn don fhoghlaim gan mhaoirseacht. Sna sonraí a thagann isteach, is féidir le samhail patrúin, aisteacha agus comhghaolta a aimsiú.
- Foghlaim Neartú: Is féidir leis an tsamhail foghlaim trí úsáid a bhaint as atreisiú foghlama agus an luach saothair a fuair sé as a iompar roimhe seo.
3. Cad é an comhbhabhtáil idir laofacht in aghaidh athraithis?
Is toradh é an rófheisteas ar laofacht, agus is é sin an méid a luíonn samhail do na sonraí. Toimhdí míchearta nó ró-shimplí i do chuid is cúis le claonadh algartam foghlama meaisín.
Tagraíonn Athraitheas do bhotúin a dhéantar mar gheall ar chastacht i d'algartam ML, rud a chruthaíonn íogaireacht d'éagsúlachtaí móra i sonraí oiliúna agus rófheisteas.
Is éard atá i gceist le hathraitheas ná an méid a athraíonn samhail ag brath ar ionchuir.
I bhfocail eile, tá samhlacha bunúsacha thar a bheith claonta ach cobhsaí (athrú íseal). Fadhb le samhlacha casta is ea rófheisteas, cé go nglacann siad réaltacht an mhúnla (claonadh íseal) mar sin féin.
Chun éagsúlacht ard agus ardchlaonadh araon a chosc, tá gá le comhbhabhtáil idir laofacht agus athraitheacht chun earráidí a laghdú is fearr.
4. Tá halgartaim foghlama meaisín tagtha chun cinn go mór le himeacht ama. Conas a roghnaíonn duine an t-algartam ceart chun tacar sonraí a úsáid?
Ní bhraitheann an teicníc meaisínfhoghlama ar cheart a úsáid ach ar an gcineál sonraí i dtacar sonraí ar leith.
Nuair a bhíonn sonraí líneach, úsáidtear aischéimniú líneach. D’fheidhmigh an modh bagála níos fearr dá léireodh sonraí neamhlíneacht. Is féidir linn úsáid a bhaint as crainn chinnidh nó SVM más gá na sonraí a mheas nó a léirmhíniú chun críocha tráchtála.
D’fhéadfadh líonraí néaracha a bheith úsáideach chun freagra cruinn a fháil má chuimsíonn an tacar sonraí grianghraif, físeáin agus fuaime.
Ní féidir an t-algartam a roghnú le haghaidh imthosca sonracha nó bailiú sonraí a dhéanamh ar aon bheart amháin.
D'fhonn an modh is oiriúnaí a fhorbairt, ní mór dúinn na sonraí a scrúdú ar dtús trí úsáid a bhaint as anailís sonraí taiscéalaíoch (EDA) agus an sprioc a bhaineann leis an tacar sonraí a úsáid a thuiscint.
5. Cén difríocht atá idir comhathraitheas agus comhghaol?
Déanann comhathraitheas meastóireacht ar an gcaoi a bhfuil dhá athróg nasctha lena chéile agus conas a d’fhéadfadh duine amháin athrú mar fhreagra ar athruithe sa cheann eile.
Má tá an toradh dearfach, léiríonn sé go bhfuil nasc díreach idir na hathróga agus go n-ardódh nó go laghdódh ceann acu le méadú nó laghdú ar an mbunathróg, ag glacadh leis go bhfanfadh na coinníollacha eile ar fad tairiseach.
Tomhaiseann comhghaol an nasc idir dhá athróg randamach agus níl ach trí luach ar leith aige: 1, 0, agus -1.
6. I meaisínfhoghlaim, cad a chiallaíonn cnuasú?
Tugtar cnuasú ar mhodhanna foghlama gan mhaoirseacht a dhéanann pointí sonraí a ghrúpáil le chéile. Le bailiúchán pointí sonraí, is féidir an teicníc cnuasaithe a chur i bhfeidhm.
Is féidir leat na pointí sonraí go léir a ghrúpáil de réir a bhfeidhmeanna ag baint úsáide as an straitéis seo.
Tá gnéithe agus cáilíochtaí na bpointí sonraí a thagann faoin gcatagóir chéanna cosúil le chéile, agus tá gnéithe agus cáilíochtaí na bpointí sonraí a thagann isteach i ngrúpaí ar leith difriúil.
Is féidir an cur chuige seo a úsáid chun anailís a dhéanamh ar shonraí staidrimh.
7. Cad é an t-algartam meaisínfhoghlama is fearr leat?
Tá deis agat do chuid sainroghanna agus buanna uathúla a léiriú sa cheist seo, chomh maith le heolas cuimsitheach a bheith agat ar an iliomad teicnící meaisínfhoghlama.
Seo roinnt gnáth-halgartaim meaisínfhoghlama le smaoineamh orthu:
- Cúlchéimniú líneach
- Aischéimniú lóistíochta
- Naive Bayes
- Crainn chinnidh
- Ciallaíonn K
- Algartam foraoise randamach
- K- chomharsa is gaire (KNN)
8. Aischéimniú Líneach san Fhoghlaim Meaisín: Cad É?
Is aischéimniú líneach é algartam meaisínfhoghlama maoirsithe.
Úsáidtear é in anailís thuarthach chun an nasc líneach idir na hathróga cleithiúnacha agus na hathróga neamhspleácha a chinneadh.
Is é seo a leanas cothromóid aischéimnithí líneach:
Y = A + BX
más rud é:
- X a thugtar ar an athróg ionchuir nó neamhspleách.
- Is é Y an athróg spleách nó an t-aschur.
- Is é b comhéifeacht X, agus is é a idircheap.
9. Déan cur síos ar na difríochtaí idir KNN agus cnuasú modhanna k.
Is é an príomh-idirdhealú ná go bhfuil pointí lipéadaithe de dhíth ar KNN (modh aicmithe, foghlaim faoi mhaoirsiú) ach nach bhfuil gá le k-a (algartam cnuasaithe, foghlaim gan mhaoirseacht).
Is féidir leat sonraí lipéadaithe a rangú i bpointe neamhlipéadaithe trí úsáid a bhaint as K-Nearest Neighbours. Úsáideann cnuasú K-modhanna an meánfhad idir pointí chun foghlaim conas pointí gan lipéad a ghrúpáil.
10. Cad a chiallaíonn “claonadh roghnóireachta” duitse?
Tá an claonadh i gcéim samplála turgnaimh mar gheall ar mhíchruinneas staidrimh.
Roghnaítear grúpa samplach amháin níos minice ná na grúpaí eile sa turgnamh mar thoradh ar an míchruinneas.
Mura n-admhaítear an claonadh roghnóireachta, d’fhéadfadh conclúid mícheart a bheith mar thoradh air.
11. Cad é go díreach Teoirim Bayes?
Nuair is eol dúinn dóchúlachtaí eile, is féidir linn dóchúlacht a chinneadh trí úsáid a bhaint as Teoirim Bayes. Cuireann sé an dóchúlacht iarmhaire ar fáil bunaithe ar fhaisnéis roimh ré, i bhfocail eile.
Soláthraíonn an teoirim seo modh fónta chun dóchúlachtaí coinníollach a mheas.
Nuair a bhíonn fadhbanna samhaltú réamh-mheastacháin á bhforbairt maidir le haicmiú agus le múnla a fheistiú in oiliúint tacar sonraí i meaisínfhoghlama, cuirtear teoirim Bayes i bhfeidhm (ie Naive Bayes, Bayes Optimal Classifier).
12. I Múnla Foghlama Meaisín, cad iad 'Tacar Oiliúna' agus 'Tacar Tástála'?
Sraith traenála:
- Cuimsíonn an tacar oiliúna cásanna a sheoltar chuig an tsamhail le haghaidh anailíse agus foghlama.
- Seo iad na sonraí lipéadaithe a úsáidfear chun an tsamhail a oiliúint.
- Go hiondúil, úsáidtear 70% de na sonraí iomlána mar thacar sonraí oiliúna.
Sraith Tástála:
- Úsáidtear an tacar tástála chun cruinneas giniúna hipitéise an mhúnla a mheas.
- Déanaimid tástáil gan sonraí lipéadaithe agus ansin úsáidimid lipéid chun na torthaí a dhearbhú.
- Úsáidtear an 30% eile mar thacar sonraí tástála.
13. Cad is Hipitéis i bhFoghlaim Meaisín?
Cumasaíonn Foghlaim Mheaisín úsáid a bhaint as tacair shonraí atá ann cheana féin chun tuiscint níos fearr a fháil ar fheidhm ar leith a nascann ionchur le haschur. Tugtar comhfhogasú feidhme air seo.
Sa chás seo, ní mór comhfhogasú a úsáid don spriocfheidhm anaithnid chun na breathnuithe go léir is féidir a shamhlú bunaithe ar an gcás ar leith a aistriú ar an mbealach is fearr is féidir.
Sa mheaisínfhoghlaim, is samhail í hipitéis a chuidíonn le meastachán a dhéanamh ar an spriocfheidhm agus leis na mapálacha cuí ionchuir-go-aschuir a chomhlánú.
Ceadaíonn roghnú agus dearadh na n-algartam sainiú spás na hipitéisí féideartha is féidir a léiriú le samhail.
I gcás hipitéis amháin, úsáidtear cás íochtair h(h), ach úsáidtear príomhchathair h (H) don spás hipitéise iomlán atá á cuardach. Déanfaimid athbhreithniú gairid ar na nodaireachtaí seo:
- Is samhail faoi leith é hipitéis (h) a éascaíonn léarscáiliú ionchuir go haschur, ar féidir a úsáid ina dhiaidh sin le haghaidh meastóireachta agus tuar.
- Is éard is tacar hipitéise (H) ann spás inchuardaithe hipitéisí is féidir a úsáid chun ionchuir chuig aschuir a mhapáil. Is samplaí de theorainneacha cineálacha iad frámaíocht saincheiste, samhail, agus cumraíocht mhúnla.
14. Cad a chiallaíonn rófheisteas meaisínfhoghlama, agus conas is féidir é a chosc?
Nuair a dhéanann meaisín iarracht foghlaim ó thacar sonraí neamhleor, tarlaíonn rófheisteas.
Mar thoradh air sin, déantar comhghaolú contrártha ar rófheisteas le toirt sonraí. Leis an gcur chuige tras-bhailíochtaithe is féidir rófheisteas a sheachaint do thacair sonraí beaga. Roinntear tacar sonraí ina dhá chuid sa mhodh seo.
Beidh an dá chuid seo sa tacar sonraí le haghaidh tástála agus oiliúna. Úsáidtear an tacar sonraí oiliúna chun samhail a chruthú, agus úsáidtear an tacar sonraí tástála chun an tsamhail a mheas ag baint úsáide as ionchuir éagsúla.
Seo é an chaoi rófheisteas a chosc.
15. Cad é go díreach aicmitheoirí Naive Bayes?
Is éard atá i modhanna éagsúla aicmithe ná aicmitheoirí Naive Bayes. Oibríonn sraith algartam ar a dtugtar na haicmitheoirí seo ar an mbunsmaoineamh céanna.
Is é an toimhde a dhéanann aicmitheoirí Bayes naive ná nach bhfuil aon tionchar ag láithreacht nó as láthair gné amháin ar láithreacht nó ar easpa gné eile.
I bhfocail eile, is é seo an rud a ndéanaimid tagairt dó mar “naive” toisc go nglactar leis go bhfuil gach aitreabúid tacair sonraí chomh suntasach agus chomh neamhspleách céanna.
Déantar an t-aicmiú trí úsáid a bhaint as aicmitheoirí Bayes naive. Tá siad simplí le húsáid agus cruthaíonn siad torthaí níos fearr ná na réamhaisnéiseoirí níos casta nuair is fíor an bonn le neamhspleáchas.
In anailís téacs, scagadh turscair, agus córais mholta, úsáidtear iad.
16. Cad a chiallaíonn Feidhmeanna Costas agus Feidhmeanna Caillteanais?
Tagraíonn an frása “feidhm chaillteanais” don phróiseas a bhaineann le caillteanas a ríomh nuair nach gcuirtear ach píosa amháin sonraí san áireamh.
Ar an taobh eile, úsáidimid an fheidhm chostais chun méid iomlán na botúin a chinneadh le haghaidh sonraí iomadúla. Níl aon idirdhealú suntasach ann.
I bhfocail eile, cé go gcomhiomlánaíonn feidhmeanna costais an difríocht don tacar sonraí oiliúna iomlán, tá feidhmeanna caillteanais deartha chun an difríocht idir na luachanna iarbhír agus réamh-mheasta do thaifead aonair a ghabháil.
17. Cad a dhéanann idirdhealú idir samhail ginideach agus samhail idirdhealaitheach?
Foghlaimíonn samhail idirdhealaitheach na difríochtaí idir roinnt catagóirí sonraí. Piocann samhail ghiniúna suas ar chineálacha éagsúla sonraí.
Maidir le fadhbanna aicmithe, is minic a sháraíonn samhlacha idirdhealaitheacha samhlacha eile.
18. Déan cur síos ar na héagsúlachtaí idir earráidí de Chineál I agus Chineál II.
Tagann deimhneacha bréagacha faoi chatagóir na n-earráidí de Chineál I, ach téann claonchlónna bréagacha faoi earráidí Cineál II (ag maíomh nár tharla aon rud nuair a tharla i ndáiríre).
19. I meaisínfhoghlaim, cad é an teicníc foghlama Ensemble?
Meascann teicníc ar a dtugtar foghlaim ensemble go leor samhlacha meaisínfhoghlama chun samhlacha níos cumhachtaí a tháirgeadh.
Is féidir múnla a athrú ar chúiseanna éagsúla. Tá roinnt cúiseanna:
- Daonra Éagsúla
- Hipitéisí Éagsúla
- Modhanna éagsúla samhaltú
Tabharfaimid aghaidh ar shaincheist agus sonraí oiliúna agus tástála an mhúnla á n-úsáid. Is cineálacha féideartha den bhotún seo iad laofacht, athraithis agus earráid do-laghdaithe.
Anois, tugaimid an chothromaíocht seo idir laofacht agus éagsúlacht sa tsamhail mar chomhbhabhtáil idir an claonadh agus an éagsúlacht, agus ba cheart go mbeadh sé ann i gcónaí. Baintear an chomhbhabhtáil seo amach trí úsáid a bhaint as foghlaim ensemble.
Cé go bhfuil cineálacha cur chuige ensemble éagsúla ar fáil, tá dhá straitéis choiteann ann chun go leor samhlacha a chur le chéile:
- Úsáideann cur chuige dúchais ar a dtugtar bagáil an tacar oiliúna chun tacair oiliúna breise a tháirgeadh.
- Treisiú, teicníocht níos sofaisticiúla: Cosúil le bagáil, úsáidtear treisiú chun an fhoirmle ualaithe idéalach a fháil do thacar oiliúna.
20. Cad é go díreach samhlacha paraiméadracha? Tabhair sampla.
Tá méid teoranta paraiméadair i samhlacha paraiméadracha. Chun sonraí a thuar, níl a fhios agat ach paraiméadair an mhúnla.
Is samplaí tipiciúla iad seo a leanas: aischéimniú lóistíochta, aischéimniú líneach, agus SVManna líneacha. Tá samhlacha neamh-pharaiméadracha solúbtha ós rud é gur féidir líon neamhtheoranta paraiméadair a bheith iontu.
Teastaíonn paraiméadair na samhla agus stádas na sonraí breathnaithe chun sonraí a thuar. Seo roinnt samplaí tipiciúla: samhlacha ábhar, crainn chinnidh, agus k-na comharsana is gaire.
21. Déan cur síos ar scagadh comhoibríoch. Chomh maith le scagadh ábhar-bhunaithe?
Modh atá triailte agus fíor chun moltaí inneachair saincheaptha a chruthú is ea scagadh comhoibríoch.
Déanann cineál de chóras moltaí ar a dtugtar scagadh comhoibríoch réamhinsint ar ábhar úr trí roghanna úsáideoirí a chothromú le leasanna comhroinnte.
Is iad sainroghanna úsáideoirí an t-aon rud a mheasann córais molta ábhar-bhunaithe. I bhfianaise réamhroghanna an úsáideora, soláthraítear moltaí nua ó ábhar gaolmhar.
22. Cad go díreach atá i gceist agat leis an tsraith Am?
Cnuasach uimhreacha in ord ardaitheach is ea amshraith. Thar thréimhse ama réamhshocraithe, déanann sé monatóireacht ar ghluaiseacht na bpointí sonraí roghnaithe agus gabhann sé na pointí sonraí go tréimhsiúil.
Níl aon íosmhéid ama ná uas-ionchur ama ann do shraith ama.
Is minic a úsáideann anailísí sraith ama chun sonraí a anailísiú de réir a gcuid riachtanas uathúla.
23. Déan cur síos ar na héagsúlachtaí idir na halgartaim Treisiú Grádáin agus an Fhoraois Randamach.
Foraoise Randamach:
- Cuirtear líon mór crann cinnidh le chéile ag an deireadh agus tugtar foraoisí randamacha orthu.
- Cé go dtáirgeann treisiú grádáin gach crann neamhspleách ar na cinn eile, tógann foraois randamach gach crann ceann ag an am.
- Ilrang braite réad oibríonn go maith le foraoisí randamacha.
Treisiú Grádáin:
- Cé go nascann foraoisí randamacha le crainn chinnidh ag deireadh an phróisis, cuireann Meaisíní Treisiú Grádáin le chéile iad ón tús.
- Má dhéantar paraiméadair a choigeartú go cuí, sáraíonn treisiú grádáin na foraoisí randamacha i dtéarmaí torthaí, ach ní rogha chliste é má tá go leor asluiteacha, aimhrialtachtaí nó torainn sa tacar sonraí toisc go bhféadfadh sé a bheith ina chúis leis an tsamhail a bheith ró-fheistithe.
- Nuair a bhíonn sonraí neamhchothromaithe, mar a dhéantar i measúnú riosca fíor-ama, is maith an rud é treisiú grádáin.
24. Cén fáth a bhfuil maitrís mearbhall ag teastáil uait? Cad é sin?
Úsáidtear tábla ar a dtugtar an maitrís mearbhaill, ar a dtugtar an maitrís earráide uaireanta, go forleathan chun a thaispeáint cé chomh maith agus a fheidhmíonn múnla aicmithe, nó aicmitheora, ar thacar sonraí tástála a bhfuil na fíorluachanna ar eolas ina leith.
Cuireann sé ar ár gcumas a fheiceáil conas a fheidhmíonn samhail nó algartam. Déanann sé simplí dúinn míthuiscintí a aimsiú i measc cúrsaí éagsúla.
Feidhmíonn sé mar bhealach chun a mheas cé chomh maith agus a dhéantar samhail nó algartam.
Tiomsaítear tuar samhail aicmithe i maitrís mearbhaill. Baineadh úsáid as luachanna comhairimh gach lipéid ranga chun líon iomlán na dtuartha cearta agus míchearta a bhriseadh síos.
Soláthraíonn sé sonraí ar na lochtanna a rinne an t-aicmitheoir chomh maith leis na cineálacha éagsúla earráidí a dhéanann aicmitheoirí.
25. Cad é go díreach anailís chomhpháirte prionsabal?
Trí líon na n-athróg atá comhghaolmhar lena chéile a íoslaghdú, is é an sprioc ná gné an bhailithe sonraí a íoslaghdú. Ach tá sé tábhachtach an éagsúlacht a choinneáil oiread agus is féidir.
Athraítear na hathróga go sraith iomlán nua athróg ar a dtugtar príomhchodanna.
Tá na ríomhairí pearsanta seo orthogonal ós rud é gur eigenvectors maitrís chomhathraitheas iad.
26. Cén fáth a bhfuil rothlú comhpháirteanna chomh ríthábhachtach sin do PCA (anailís ar phríomh-chomhpháirteanna)?
Tá rothlú ríthábhachtach i PCA toisc go n-uasmhéadaíonn sé an deighilt idir na hathraithis a fhaigheann gach comhpháirt, rud a fhágann go bhfuil léirmhíniú comhpháirte níos simplí.
Éilímid comhpháirteanna leathnaithe chun éagsúlacht comhpháirte a chur in iúl mura ndéantar na comhpháirteanna a rothlú.
27. Conas a athraíonn rialtacht agus normalú óna chéile?
Normalú:
Athraítear sonraí le linn normalaithe. Ba cheart duit na sonraí a normalú má tá scálaí ann atá an-difriúil, go háirithe ó íseal go hard. Coigeartaigh gach colún ionas go mbeidh na bunstaitisticí comhoiriúnach go léir.
Chun a chinntiú nach gcailltear cruinneas, is féidir é seo a bheith úsáideach. Ceann de chuspóirí na hoiliúna múnla é an comhartha a bhrath agus neamhaird á dhéanamh ar an torann.
Tá seans ann go ndéanfaí rófheisteas má thugtar smacht iomlán don mhúnla chun earráid a laghdú.
Rialáil:
I rialtacht, déantar an fheidhm tuar a mhodhnú. Tá sé seo faoi réir roinnt rialaithe trí rialtacht, rud a thugann le tuiscint go bhfuil feidhmeanna feistiúcháin níos simplí i bhfabhar feidhmeanna casta níos simplí.
28. Conas atá normalú agus caighdeánú difriúil óna chéile?
Is iad an dá theicníc is mó a úsáidtear le haghaidh scálaithe gné ná normalú agus caighdeánú.
Normalú:
- Tugtar normalú ar na sonraí a athscálú chun freastal ar raon [0,1].
- Nuair a chaithfidh an scála dearfach céanna a bheith ag na paraiméadair go léir, tá gnáthú cabhrach, ach cailltear asluitigh na tacair sonraí.
Rialáil:
- Déantar sonraí a athscálú le meán 0 a bheith acu agus diallas caighdeánach de 1 mar chuid den phróiseas caighdeánaithe (Athraitheas aonaid)
29. Cad go díreach a chiallaíonn “fachtóir boilscithe athraitheachta”?
Is é an fachtóir boilscithe éagsúlachta (VIF) a thugtar ar chóimheas athraithis an mhúnla le hathraitheas an mhúnla gan ach athróg neamhspleách amháin.
Déanann VIF meastachán ar an méid ilchomhlíneachta atá i sraith roinnt athróg aischéimnithí.
Athrú sa tSamhail (VIF) Múnla le hAthraitheas Athraitheach Neamhspleách Amháin
30. Bunaithe ar mhéid na sraithe oiliúna, conas a roghnaíonn tú aicmitheoir?
Feidhmíonn samhail ard-laofachta, íseal-athraitheachta níos fearr do thacar oiliúna gairid toisc gur lú an seans go ndéanfaí rófheisteas. Sampla amháin is ea Naive Bayes.
Chun idirghníomhaíochtaí níos casta a léiriú do thacar oiliúna mór, is fearr múnla le claonadh íseal agus éagsúlacht ard. Is sampla maith é aischéimniú lóistíochta.
31. Cén algartam i meaisínfhoghlama a dtugtar an “foghlaimeoir leisciúil” air agus cén fáth?
Is foghlaimeoir leisciúil é KNN algartam meaisínfhoghlama. Toisc go ndéanann K-NN an t-achar a ríomh go dinimiciúil gach uair is mian leis a rangú seachas aon luachanna nó athróga meaisín-fhoghlaim a fhoghlaim ó na sonraí oiliúna, cuireann sé an tacar sonraí oiliúna de ghlanmheabhair.
Is foghlaimeoir leisciúil é K-NN dá bharr.
32. Cad iad Cuar ROC agus AUC?
Léirítear feidhmíocht samhail aicmithe ag gach tairseach go grafach ag cuar ROC. Tá fíorchritéir ráta dearfacha agus ráta dearfach bréagach aige.
Níl ort ach a chur, tugtar AUC (Ceantar Faoi Chuar ROC) ar an limistéar faoi chuar ROC. Tomhaistear achar déthoiseach an chuar ROC ó (0,0) go AUC (1,1). Chun samhlacha aicmithe dénártha a mheasúnú, úsáidtear é mar staitistic feidhmíochta.
33. Cad is hipearpharaiméadair ann? Cad a dhéanann uathúil iad ó pharaiméadair an mhúnla?
Paraiméadar samhla a thugtar ar athróg inmheánach den mhúnla. Agus sonraí oiliúna á n-úsáid, déantar luach paraiméadar a chomhfhogasú.
Gan aithne don mhúnla, is athróg é hipearpharaiméadar. Ní féidir an luach a chinneadh ó shonraí, mar sin is minic a úsáidtear iad chun paraiméadair mhúnla a ríomh.
34. Cad is brí le Scór F1, le haisghairm agus le beachtas?
Is é an Beart mearbhaill an méadrach a úsáidtear chun éifeachtacht an mhúnla aicmithe a thomhas. Is féidir na frásaí seo a leanas a úsáid chun an méadrach mearbhaill a mhíniú níos fearr:
TP: Fíordhearfach – Seo iad na luachanna dearfacha a rabhthas ag súil leo i gceart. Tugann sé le tuiscint go bhfuil luachanna an aicme réamh-mheasta agus an aicme iarbhír araon dearfach.
TN: Fíor Diúltach - Seo iad na luachanna díobhálacha a bhí tuartha go cruinn. Tugann sé le tuiscint go bhfuil luach an aicme iarbhír agus an aicme réamh-mheasta araon diúltach.
Tarlaíonn na luachanna seo - dearfacha bréagacha agus diúltacha bréagacha - nuair a bhíonn difríocht idir do rang féin agus an rang a bhfuiltear ag súil leis.
Anois,
Athghairm a thugtar ar chóimheas an fhíorráta deimhneach (TP) leis na breathnuithe go léir a rinneadh san aicme iarbhír, ar a dtugtar íogaireacht freisin.
Is é TP/(TP+FN) an t-aisghairm.
Is tomhas é beachtas ar an luach réamh-mheastacháin deimhneach, a dhéanann comparáid idir líon na ndeimhneacha a dhéanann an tsamhail a thuar i ndáiríre agus cé mhéad deimhneach ceart a dhéanann sé a thuar go beacht.
Is é an beachtas TP/(TP + FP)
Is é an méadrach feidhmíochta is fusa le tuiscint ná cruinneas, nach bhfuil ann ach comhréir na mbreathnuithe atá tuartha i gceart le gach breathnóireacht.
Tá cruinneas cothrom le (TP+TN)/(TP+FP+FN+TN).
Déantar Beachtas agus Athghairm a ualú agus a mheán chun an Scór F1 a sholáthar. Mar thoradh air sin, breithníonn an scór seo dearfacha bréagacha agus claonchlónna bréagacha.
Is minic a bhíonn F1 níos luachmhaire ná cruinneas, go háirithe má tá dáileadh ranga éagothrom agat, fiú mura bhfuil sé chomh simplí le cruinneas a thuiscint go hintuigthe.
Baintear an cruinneas is fearr amach nuair a bhíonn costas dearfacha bréagacha agus claonchlónna bréagacha inchomparáide. Is fearr Beachtas agus Athghairm araon a chur san áireamh má tá difríocht shuntasach idir na costais a bhaineann le dearfacha bréagacha agus le diúltacha bréagacha.
35. Cad é go díreach atá i gceist le tras-bhailíochtú?
Úsáideann cur chuige athshamplála staitistiúil ar a dtugtar tras-bhailíochtú i meaisínfhoghlaim roinnt fo-thacair sonraí chun oiliúint agus meastóireacht a dhéanamh ar algartam meaisínfhoghlama thar roinnt babhtaí.
Déantar baisc nua sonraí nár úsáideadh chun an tsamhail a oiliúint a thástáil trí úsáid a bhaint as tras-bhailíochtú féachaint cé chomh maith agus a dhéanann an tsamhail é a thuar. Cuirtear cosc ar rófheistiú sonraí trí chrosbhailíochtú.
K-Fillte Déanann an modh athshamplála is minicí a úsáidtear an tacar sonraí iomlán a roinnt ina thacair K ar chomhmhéideanna. Tugtar tras-bhailíochtú air.
36. Ligean le rá go bhfuair tú amach go bhfuil éagsúlacht shuntasach ag do mhúnla. Cén algartam, dar leat, is oiriúnaí chun an cás seo a láimhseáil?
Ard-éagsúlacht a bhainistiú
Ba cheart dúinn an teicníc bagála a úsáid le haghaidh fadhbanna le héagsúlachtaí móra.
D’úsáidfeadh an t-algartam bagála sampláil arís agus arís eile ar shonraí randamacha chun na sonraí a roinnt ina bhfoghrúpaí. Nuair a bheidh na sonraí roinnte, is féidir linn sonraí randamacha agus nós imeachta oiliúna sonrach a úsáid chun rialacha a ghiniúint.
Ina dhiaidh sin, d’fhéadfaí vótaíocht a úsáid chun tuar na samhla a chomhcheangal.
37. Cad a dhéanann idirdhealú idir aischéimniú Ridge agus aischéimniú Lasso?
Dhá mhodh rialtaithe a úsáidtear go forleathan ná aischéimniú Lasso (ar a dtugtar L1 freisin) agus Ridge (ar a dtugtar L2 uaireanta). Úsáidtear iad chun ró-fheistiú sonraí a chosc.
D'fhonn an réiteach is fearr a fháil agus castacht a íoslaghdú, úsáidtear na teicnící seo chun na comhéifeachtaí a phionósú. Trí phionós a ghearradh ar luach iomlán na gcomhéifeachtaí, feidhmíonn aischéimniú Lasso.
Díorthaítear feidhm an phionóis in aischéimniú Ridge nó L2 ó shuim chearnóga na gcomhéifeachtaí.
38. Cé acu atá níos tábhachtaí: feidhmíocht mhúnla nó cruinneas múnla? Cén ceann agus cén fáth a mbeidh tú i bhfabhar é?
Is ceist mheabhlach í seo, mar sin ba cheart go dtuigfeadh duine ar dtús cad is Feidhmíocht Múnla ann. Má shainmhínítear feidhmíocht mar luas, ansin braitheann sé ar an gcineál iarratais; bheadh ardluais ag teastáil mar chomhpháirt ríthábhachtach d'aon iarratas a bhaineann le cás fíor-ama.
Mar shampla, ní bheidh na Torthaí Cuardaigh is fearr chomh luachmhar má thógann sé ró-fhada teacht ar thorthaí na gCeist.
Má úsáidtear Feidhmíocht mar chosaint ar an bhfáth ar cheart tús áite a thabhairt do bheachtais agus athghairm os cionn cruinnis, ansin beidh scór F1 níos úsáidí ná cruinneas chun an cás gnó a léiriú d’aon tacar sonraí atá neamhchothromaithe.
39. Conas a dhéanfá tacar sonraí le héagothroime a bhainistiú?
Is féidir le tacar sonraí neamhchothromaithe leas a bhaint as teicnící samplála. Is féidir sampláil a dhéanamh ar bhealach ró-íseal nó róshampla.
Ligeann Sampláil dúinn méid rang an tromlaigh a laghdú chun teacht leis an rang mionlaigh, rud a chabhraíonn le luas a mhéadú maidir le stóráil agus cur i gcrích am rite ach is féidir sonraí luachmhara a chailliúint dá bharr.
Chun ceist an chaillteanais faisnéise de bharr róshamplála a réiteach, déanaimid an rang Mionlach a uasshampláil; mar sin féin, is cúis le saincheisteanna rófheistithe sinn dá bharr.
I measc na straitéisí breise tá:
- Róshampláil Cnuasbhunaithe - Cuirtear na cásanna mionlaigh agus ranganna tromlaigh faoi réir teicníc cnuasaithe K-modhanna ina n-aonar sa chás seo. Déantar é seo chun braislí tacar sonraí a aimsiú. Ansin, déantar róshampláil ar gach cnuasach ionas go mbeidh an méid céanna ag gach rang agus go mbíonn an líon céanna cásanna ag gach cnuasach laistigh de rang.
- SMOTE: Teicníc Róshamplála Mionlaigh Shintéiseacha- Úsáidtear sliseog sonraí ón rang mionlaigh mar shampla, ina dhiaidh sin déantar cásanna saorga breise atá inchomparáide leis a tháirgeadh agus a chur leis an mbunachar sonraí. Oibríonn an modh seo go maith le pointí sonraí uimhriúla.
40. Conas is féidir leat idirdhealú a dhéanamh idir treisiú agus bagáil?
Tá leaganacha ag Ensemble Techniques ar a dtugtar bagáil agus treisiú.
Bagging-
Maidir le halgartaim a bhfuil éagsúlacht mhór acu, is teicníc é bagáil a úsáidtear chun an t-athraitheas a ísliú. Is é teaghlach amháin aicmitheora den sórt sin a bhfuil seans ann go mbeidh claonadh ann ná an crann cinnteoireachta.
Bíonn tionchar suntasach ag an gcineál sonraí a gcuirtear oiliúint ar chrainn chinntí ar a bhfeidhmíocht. Mar gheall air seo, fiú le mionchoigeartú an-ard, bíonn sé i bhfad níos deacra torthaí a ghinearálú iontu uaireanta.
Má athraítear sonraí oiliúna na gcrann cinnteoireachta, athraíonn na torthaí go suntasach.
Mar thoradh air sin, úsáidtear bagáil, ina gcruthaítear go leor crainn cinnidh, agus déantar gach ceann acu a oiliúint ag baint úsáide as sampla de na sonraí bunaidh, agus is é an toradh deiridh meán na múnlaí éagsúla seo go léir.
Treisiú:
Is éard is treisiú ann ná an teicníocht chun tuar a dhéanamh le córas aicmitheora n-lag ina ndéanann gach aicmitheoir lag suas le haghaidh easnaimh a aicmitheora níos láidre. Tagraíonn muid d’aicmitheoir a fheidhmíonn go dona ar thacar sonraí ar leith mar “aicmitheoir lag.”
Is léir gur próiseas seachas algartam é treisiú. Is samplaí coitianta d’aicmitheoirí laga iad cúlchéimniú lóistíochta agus crainn chinnte éadomhain.
Is iad Adaboost, Treisiú Grádán, agus XGBoost an dá algartam treisithe is coitianta, áfach, tá go leor eile ann.
41. Mínigh na difríochtaí idir foghlaim ionduchtach agus asbhainteach.
Agus é ag foghlaim trí shampla ó thacar samplaí breathnaithe, úsáideann samhail foghlaim ionduchtach chun teacht ar chonclúid ghinearálta. Ar an láimh eile, le foghlaim asbhainteach, úsáideann an tsamhail an toradh sula ndéantar a cuid féin.
Is í an fhoghlaim ionduchtach an próiseas chun tátail a bhaint as breathnuithe.
Is éard is foghlaim dhéaduchtach ann ná an próiseas chun breathnuithe a chruthú bunaithe ar thátail.
Conclúid
Comhghairdeachas! Seo iad na 40 ceist agallaimh is fearr agus os a chionn le haghaidh meaisínfhoghlama a bhfuil na freagraí ar eolas agat orthu anois. Eolaíocht sonraí agus hintleachta saorga beidh éileamh fós ar ghairmeacha de réir mar a théann an teicneolaíocht chun cinn.
Is féidir le hiarrthóirí a nuashonraíonn a gcuid eolais ar na teicneolaíochtaí ceannródaíocha seo agus a fheabhsaíonn a gcuid scileanna raon leathan féidearthachtaí fostaíochta a aimsiú le pá iomaíoch.
Féadfaidh tú dul ar aghaidh leis na hagallaimh a fhreagairt anois go bhfuil tuiscint mhaith agat ar conas freagra a thabhairt ar chuid de na ceisteanna agallaimh meaisínfhoghlama a chuirtear go forleathan.
Ag brath ar do spriocanna, déan an chéim seo a leanas. Ullmhaigh d'agallaimh trí chuairt a thabhairt ar Hashdork's Sraith Agallaimh.
Leave a Reply