Y 40+ o Gwestiynau Cyfweliad Dysgu Peiriannau Gorau (2024)

Tabl Cynnwys[Cuddio][Dangos]

1. Eglurwch y gwahaniaethau rhwng dysgu peiriant, deallusrwydd artiffisial, a dysgu dwfn.
2. Disgrifiwch y gwahanol fathau o ddysgu peiriant.
3. Beth yw'r cyfaddawdu ar ragfarn yn erbyn amrywiant?
4. Mae algorithmau dysgu peiriannau wedi esblygu'n sylweddol dros amser. Sut mae rhywun yn dewis yr algorithm cywir i'w ddefnyddio o ystyried set ddata?
5. Sut mae covariance a chydberthynas yn wahanol?
6. Mewn dysgu peiriant, beth mae clystyru yn ei olygu?
7. Beth yw eich algorithm dysgu peiriant dewisol?
8. Atchweliad Llinol mewn Dysgu Peiriant: Beth Yw?
9. Disgrifiwch y gwahaniaethau rhwng clystyru KNN a k-moddion.
10. Beth mae “tuedd dethol” yn ei olygu i chi?
11. Beth yn union yw Theorem Bayes?
12. Mewn Model Dysgu Peiriannau, beth yw 'Set hyfforddi' a 'Set brawf'?
13. Beth yw Damcaniaeth mewn Dysgu Peiriant?
14. Beth yw ystyr gorffitio dysgu peiriannau, a sut y gellir ei atal?
15. Beth yn union yw dosbarthwyr Naive Bayes?
16. Beth mae Swyddogaethau Cost a Swyddogaethau Coll yn ei olygu?
17. Beth sy'n gwahaniaethu model cynhyrchiol o fodel gwahaniaethol?
18. Disgrifiwch yr amrywiadau rhwng gwallau Math I a Math II.
19. Mewn dysgu peiriant, beth yw techneg dysgu'r Ensemble?
20. Beth yn union yw modelau parametrig? Rhowch enghraifft.
21. Disgrifiwch hidlo cydweithredol. Yn ogystal â hidlo seiliedig ar gynnwys?
22. Beth yn union yw ystyr y gyfres Time?
23. Disgrifiwch yr amrywiadau rhwng yr algorithmau Hybu Graddiant a Choedwig Hap.
24. Pam mae angen matrics dryswch arnoch chi? Beth yw e?
25. Beth yn union yw prif ddadansoddiad cydran?
26. Pam mae cylchdroi cydrannau mor hanfodol i PCA (dadansoddiad prif gydrannau)?
27. Sut mae rheoleiddio a normaleiddio yn amrywio oddi wrth ei gilydd?
28. Sut mae normaleiddio a safoni yn wahanol i'w gilydd?
29. Beth yn union mae “amrywiant chwyddiant ffactor” yn ei olygu?
30. Yn seiliedig ar faint y set hyfforddi, sut ydych chi'n dewis dosbarthwr?
31. Pa algorithm mewn dysgu peirianyddol y cyfeirir ato fel y “dysgwr diog” a pham?
32. Beth yw Cromlin ROC a'r AUC?
33. Beth yw hyperparameters? Beth sy'n eu gwneud yn unigryw o baramedrau'r model?
34. Beth mae Sgôr F1, adalw, a manwl gywirdeb yn ei olygu?
35. Beth yn union yw croes-ddilysu?
36. Gadewch i ni ddweud eich bod wedi darganfod bod gan eich model amrywiad sylweddol. Pa algorithm, yn eich barn chi, sydd fwyaf addas i drin y sefyllfa hon?
37. Beth sy'n gwahaniaethu atchweliad Ridge oddi wrth atchweliad Lasso?
38. Pa un sy'n bwysicach: perfformiad model neu gywirdeb model? Pa un a pham fyddwch chi'n ei ffafrio?
39. Sut byddech chi'n rheoli set ddata gydag anghydraddoldebau?
40. Sut gallwch chi wahaniaethu rhwng rhoi hwb a bagio?
41. Eglurwch y gwahaniaethau rhwng dysgu anwythol a diddwythol.
Casgliad

Mae busnesau'n defnyddio technoleg flaengar, megis deallusrwydd artiffisial (AI) a dysgu peiriannau, i gynyddu hygyrchedd gwybodaeth a gwasanaethau i unigolion.

Mae'r technolegau hyn yn cael eu mabwysiadu gan amrywiaeth o ddiwydiannau, gan gynnwys bancio, cyllid, manwerthu, gweithgynhyrchu a gofal iechyd.

Un o'r rolau sefydliadol mwyaf poblogaidd sy'n defnyddio AI yw gwyddonwyr data, peirianwyr deallusrwydd artiffisial, peirianwyr dysgu peiriannau, a dadansoddwyr data.

Bydd y swydd hon yn eich arwain trwy amrywiaeth o dysgu peiriant cwestiynau cyfweliad, o'r sylfaenol i'r cymhleth, i'ch helpu i baratoi ar gyfer unrhyw gwestiynau y gallech eu gofyn wrth chwilio am eich swydd ddelfrydol.

1. Eglurwch y gwahaniaethau rhwng dysgu peiriant, deallusrwydd artiffisial, a dysgu dwfn.

Mae deallusrwydd artiffisial yn defnyddio amrywiaeth o ddysgu peirianyddol a dulliau dysgu dwfn sy'n caniatáu i systemau cyfrifiadurol gyflawni tasgau gan ddefnyddio deallusrwydd dynol gyda rhesymeg a rheolau.

Mae dysgu peiriant yn defnyddio amrywiaeth o ystadegau a dulliau Dysgu Dwfn i alluogi peiriannau i ddysgu o'u perfformiad blaenorol a dod yn fwy medrus wrth wneud rhai tasgau ar eu pen eu hunain heb oruchwyliaeth ddynol.

Mae Deep Learning yn gasgliad o algorithmau sy'n caniatáu i'r feddalwedd ddysgu ohono'i hun a chyflawni amrywiaeth o swyddogaethau masnachol, megis adnabod llais a llun.

Systemau sy'n datgelu eu amlhaenog rhwydweithiau nefol i symiau helaeth o ddata ar gyfer dysgu yn gallu gwneud dysgu dwfn.

2. Disgrifiwch y gwahanol fathau o ddysgu peiriant.

Mae dysgu peirianyddol yn bodoli mewn tri math gwahanol yn fras:

Dysgu dan Oruchwyliaeth: Mae model yn creu rhagfynegiadau neu farnau gan ddefnyddio data wedi'i labelu neu ddata hanesyddol mewn dysgu peirianyddol dan oruchwyliaeth. Cyfeirir at setiau data sydd wedi'u tagio neu eu labelu er mwyn cynyddu eu hystyr fel data wedi'i labelu.
Dysgu Heb Oruchwyliaeth: Nid oes gennym ni ddata wedi'i labelu ar gyfer dysgu heb oruchwyliaeth. Yn y data sy'n dod i mewn, gall model ddod o hyd i batrymau, rhyfeddodau a chydberthnasau.
Dysgu Atgyfnerthu: Gall y model dysgu trwy ddefnyddio atgyfnerthu dysgu a'r gwobrau a gafodd am ei ymddygiad blaenorol.

3. Beth yw'r cyfaddawdu ar ragfarn yn erbyn amrywiant?

Mae gorffitio yn ganlyniad i ogwydd, sef i ba raddau y mae model yn ffitio'r data. Mae rhagfarn yn cael ei achosi gan ragdybiaethau anghywir neu rhy syml yn eich algorithm dysgu peiriant.

Mae amrywiad yn cyfeirio at gamgymeriadau a achosir gan gymhlethdod yn eich algorithm ML, sy'n cynhyrchu sensitifrwydd i raddau helaeth o amrywiant mewn data hyfforddi a gorffitio.

Amrywiant yw faint mae model yn amrywio yn dibynnu ar fewnbynnau.

Mewn geiriau eraill, mae modelau sylfaenol yn hynod o ragfarnllyd ond yn sefydlog (amrywiad isel). Mae gorffitio yn broblem gyda modelau cymhleth, er eu bod serch hynny yn dal realiti'r model (tuedd isel).

Er mwyn atal amrywiad uchel a thuedd uchel, mae angen cyfaddawdu rhwng rhagfarn ac amrywiant er mwyn lleihau gwallau yn y ffordd orau.

4. Mae algorithmau dysgu peiriannau wedi esblygu'n sylweddol dros amser. Sut mae rhywun yn dewis yr algorithm cywir i'w ddefnyddio o ystyried set ddata?

Mae'r dechneg dysgu peiriant y dylid ei defnyddio yn dibynnu ar y math o ddata mewn set ddata benodol yn unig.

Pan fo data'n llinol, defnyddir atchweliad llinol. Byddai'r dull bagio yn perfformio'n well pe bai data'n dangos aflinolrwydd. Gallwn ddefnyddio coed penderfynu neu SVM os oes rhaid gwerthuso neu ddehongli'r data at ddibenion masnachol.

Gallai rhwydweithiau niwral fod yn ddefnyddiol i gael ateb cywir os yw'r set ddata yn cynnwys lluniau, fideos a sain.

Ni ellir dewis algorithm ar gyfer amgylchiad penodol neu gasgliad o ddata ar un mesur yn unig.

Er mwyn datblygu'r dull ffit orau, rhaid i ni yn gyntaf archwilio'r data gan ddefnyddio dadansoddiad data archwiliadol (EDA) a deall y nod o ddefnyddio'r set ddata.

5. Sut mae covariance a chydberthynas yn wahanol?

Mae Covariance yn gwerthuso sut mae dau newidyn yn gysylltiedig â'i gilydd a sut y gallai un newid mewn ymateb i newidiadau yn y llall.

Os yw'r canlyniad yn bositif, mae'n nodi bod cysylltiad uniongyrchol rhwng y newidynnau ac y byddai un yn codi neu'n lleihau gyda chynnydd neu ostyngiad yn y newidyn sylfaenol, gan dybio bod yr holl amodau eraill yn aros yn gyson.

Mae cydberthynas yn mesur y cysylltiad rhwng dau hapnewidyn a dim ond tri gwerth gwahanol sydd ganddo: 1, 0, a -1.

6. Mewn dysgu peiriant, beth mae clystyru yn ei olygu?

Gelwir dulliau dysgu heb oruchwyliaeth sy'n grwpio pwyntiau data gyda'i gilydd yn glystyru. Gyda chasgliad o bwyntiau data, gellir cymhwyso'r dechneg clystyru.

Gallwch grwpio'r holl bwyntiau data yn ôl eu swyddogaethau gan ddefnyddio'r strategaeth hon.

Mae nodweddion a rhinweddau'r pwyntiau data sy'n perthyn i'r un categori yn debyg, tra bod nodweddion a rhinweddau'r pwyntiau data sy'n perthyn i grwpiau ar wahân yn wahanol.

Gellir defnyddio'r dull hwn i ddadansoddi data ystadegol.

7. Beth yw eich algorithm dysgu peiriant dewisol?

Mae gennych gyfle i ddangos eich hoffterau a'ch doniau unigryw yn y cwestiwn hwn, yn ogystal â'ch gwybodaeth gynhwysfawr am nifer o dechnegau dysgu peirianyddol.

Dyma rai algorithmau dysgu peiriant nodweddiadol i feddwl amdanynt:

Atchweliad llinol
Atchweliad logistaidd
Bayes Naïf
Coed penderfynu
Ystyr K yw
Algorithm coedwig ar hap
Cymydog agosaf K (KNN)

8. Atchweliad Llinol mewn Dysgu Peiriant: Beth Yw?

Mae algorithm dysgu peirianyddol dan oruchwyliaeth yn atchweliad llinol.

Fe'i defnyddir mewn dadansoddiad rhagfynegol i bennu'r cysylltiad llinol rhwng y newidynnau dibynnol ac annibynnol.

Mae hafaliad atchweliad llinol fel a ganlyn:

Y = A + BX

lle:

Gelwir y mewnbwn neu'r newidyn annibynnol yn X.
Y newidyn dibynnol neu allbwn yw Y.
Cyfernod X yw b, a'i rhyngdoriad yw a.

9. Disgrifiwch y gwahaniaethau rhwng clystyru KNN a k-moddion.

Y prif wahaniaeth yw bod angen pwyntiau wedi'u labelu ar KNN (dull dosbarthu, dysgu dan oruchwyliaeth) ond nid yw k-yn yn golygu (algorithm clystyru, dysgu heb oruchwyliaeth).

Gallwch ddosbarthu data wedi'i labelu yn bwynt heb ei labelu trwy ddefnyddio K-Nearest Neighbours. Mae clystyru K-moddion yn defnyddio'r pellter cyfartalog rhwng pwyntiau i ddysgu sut i grwpio pwyntiau heb eu labelu.

10. Beth mae “tuedd dethol” yn ei olygu i chi?

Mae'r rhagfarn yng nghyfnod samplu arbrawf yn deillio o anghywirdeb ystadegol.

Dewisir un grŵp sampl yn amlach na'r grwpiau eraill yn yr arbrawf o ganlyniad i'r anghywirdeb.

Os na chaiff y gogwydd dethol ei gydnabod, gallai arwain at gasgliad anghywir.

11. Beth yn union yw Theorem Bayes?

Pan fyddwn yn ymwybodol o debygolrwyddau eraill, gallwn bennu tebygolrwydd gan ddefnyddio Theorem Bayes. Mae'n cynnig y tebygolrwydd dilynol o ddigwyddiad yn seiliedig ar wybodaeth flaenorol, mewn geiriau eraill.

Darperir dull cadarn o amcangyfrif tebygolrwydd amodol gan y theorem hwn.

Wrth ddatblygu dosbarthiad problemau modelu rhagfynegol a gosod model i hyfforddiant set ddata mewn dysgu peirianyddol, Theorem Bayes yn cael ei gymhwyso (hy Naive Bayes, Bayes Optimal Classifier).

12. Mewn Model Dysgu Peiriannau, beth yw 'Set hyfforddi' a 'Set brawf'?

Set hyfforddi:

Mae'r set hyfforddi yn cynnwys enghreifftiau sy'n cael eu hanfon at y model i'w dadansoddi a'u dysgu.
Dyma'r data wedi'i labelu a fydd yn cael ei ddefnyddio i hyfforddi'r model.
Yn nodweddiadol, defnyddir 70% o gyfanswm y data fel y set ddata hyfforddi.

Set Prawf:

Defnyddir y set prawf i asesu cywirdeb cynhyrchu rhagdybiaeth y model.
Rydym yn profi heb ddata wedi'i labelu ac yna'n defnyddio labeli i gadarnhau'r canlyniadau.
Defnyddir y 30% sy'n weddill fel set ddata prawf.

13. Beth yw Damcaniaeth mewn Dysgu Peiriant?

Mae Machine Learning yn galluogi defnyddio setiau data presennol i ddeall swyddogaeth benodol sy'n cysylltu mewnbwn ag allbwn yn well. Gelwir hyn yn frasamcan swyddogaeth.

Yn yr achos hwn, rhaid defnyddio brasamcan ar gyfer y swyddogaeth darged anhysbys i drosglwyddo'r holl arsylwadau posibl yn seiliedig ar y sefyllfa a roddwyd yn y ffordd orau bosibl.

Mewn dysgu peirianyddol, mae rhagdybiaeth yn fodel sy'n helpu i amcangyfrif y swyddogaeth darged a chwblhau'r mapiau mewnbwn-i-allbwn priodol.

Mae dewis a dylunio algorithmau yn caniatáu ar gyfer diffinio gofod damcaniaethau posibl y gellir eu cynrychioli gan fodel.

Ar gyfer rhagdybiaeth sengl, defnyddir h(h) mewn llythrennau bach, ond defnyddir prifddinas h (H) ar gyfer y gofod damcaniaethol cyfan sy'n cael ei chwilio. Byddwn yn adolygu'r nodau hyn yn fyr:

Mae rhagdybiaeth (h) yn fodel penodol sy'n hwyluso mapio mewnbwn i allbwn, y gellir ei ddefnyddio wedyn ar gyfer gwerthuso a rhagfynegi.
Mae set rhagdybiaeth (H) yn ofod chwiliadwy o ddamcaniaethau y gellir eu defnyddio i fapio mewnbynnau i allbynnau. Mae fframio mater, model, a chyfluniad model yn rhai enghreifftiau o gyfyngiadau generig.

14. Beth yw ystyr gorffitio dysgu peiriannau, a sut y gellir ei atal?

Pan fydd peiriant yn ceisio dysgu o set ddata annigonol, mae gorffitio yn digwydd.

O ganlyniad, mae gorffitio yn cydberthyn yn wrthdro â chyfaint data. Mae'r dull traws-ddilysu yn caniatáu osgoi gorffitio ar gyfer setiau data bach. Rhennir set ddata yn ddwy ran yn y dull hwn.

Bydd y set ddata ar gyfer profi a hyfforddi yn cynnwys y ddwy ran hyn. Defnyddir y set ddata hyfforddi i greu model, tra bod y set ddata profi yn cael ei defnyddio i werthuso'r model gan ddefnyddio gwahanol fewnbynnau.

Dyma sut i atal gorffitio.

15. Beth yn union yw dosbarthwyr Naive Bayes?

Mae dulliau dosbarthu amrywiol yn ffurfio dosbarthwyr Naive Bayes. Mae set o algorithmau a elwir yn y dosbarthwyr hyn i gyd yn gweithio ar yr un syniad sylfaenol.

Y dybiaeth a wneir gan ddosbarthwyr naïf Bayes yw nad yw presenoldeb neu absenoldeb un nodwedd yn effeithio o gwbl ar bresenoldeb neu absenoldeb nodwedd arall.

Mewn geiriau eraill, dyma beth rydyn ni'n cyfeirio ato fel “naïf” gan ei fod yn rhagdybio bod pob priodoledd set ddata yr un mor arwyddocaol ac annibynnol.

Gwneir dosbarthiad gan ddefnyddio dosbarthwyr Bayes naïf. Maent yn syml i'w defnyddio ac yn cynhyrchu canlyniadau gwell na rhagfynegwyr mwy cymhleth pan fo'r rhagosodiad annibyniaeth yn wir.

Mewn dadansoddi testun, hidlo sbam, a systemau argymell, fe'u defnyddir.

16. Beth mae Swyddogaethau Cost a Swyddogaethau Coll yn ei olygu?

Mae'r ymadrodd “colli swyddogaeth” yn cyfeirio at y broses o golli cyfrifiadura pan fydd dim ond un darn o ddata yn cael ei ystyried.

I'r gwrthwyneb, rydym yn defnyddio'r swyddogaeth cost i bennu cyfanswm y camgymeriadau ar gyfer data niferus. Nid oes unrhyw wahaniaeth arwyddocaol.

Mewn geiriau eraill, tra bod swyddogaethau cost yn agregu'r gwahaniaeth ar gyfer y set ddata hyfforddi gyfan, mae swyddogaethau colled wedi'u cynllunio i ddal y gwahaniaeth rhwng y gwerthoedd gwirioneddol a'r gwerthoedd a ragwelir ar gyfer un cofnod.

17. Beth sy'n gwahaniaethu model cynhyrchiol o fodel gwahaniaethol?

Mae model gwahaniaethol yn dysgu'r gwahaniaethau rhwng sawl categori data. Mae model cynhyrchiol yn sylwi ar wahanol fathau o ddata.

O ran problemau dosbarthu, mae modelau gwahaniaethol yn aml yn perfformio'n well na modelau eraill.

18. Disgrifiwch yr amrywiadau rhwng gwallau Math I a Math II.

Mae positifau ffug yn dod o dan y categori o wallau Math I, tra bod negatifau ffug yn mynd o dan wallau Math II (honni nad oes dim wedi digwydd pan mae wedi digwydd mewn gwirionedd).

19. Mewn dysgu peiriant, beth yw techneg dysgu'r Ensemble?

Mae techneg a elwir yn ddysgu ensemble yn cymysgu llawer o fodelau dysgu peirianyddol i gynhyrchu modelau mwy grymus.

Gellir amrywio model am amrywiaeth o resymau. Mae sawl achos yn cynnwys:

Amryw Boblogaeth
Amryw Damcaniaeth
Dulliau modelu amrywiol

Byddwn yn dod ar draws problem wrth ddefnyddio data hyfforddi a phrofi'r model. Mae rhagfarn, amrywiant, a gwallau anostyngadwy yn fathau posibl o'r camgymeriad hwn.

Nawr, rydym yn galw'r cydbwysedd hwn rhwng gogwydd ac amrywiant yn y model yn gyfaddawd rhagfarn-amrywiad, a dylai fodoli bob amser. Cyflawnir y cyfaddawd hwn trwy ddefnyddio dysgu ensemble.

Er bod amrywiaeth o ddulliau ensemble ar gael, mae dwy strategaeth gyffredin ar gyfer cyfuno llawer o fodelau:

Mae dull brodorol o'r enw bagio yn defnyddio'r set hyfforddi i gynhyrchu setiau hyfforddi ychwanegol.
Rhoi hwb, techneg fwy soffistigedig: Yn debyg iawn i fagio, defnyddir hwb i ddod o hyd i'r fformiwla bwysoli ddelfrydol ar gyfer set hyfforddi.

20. Beth yn union yw modelau parametrig? Rhowch enghraifft.

Mae nifer gyfyngedig o baramedrau mewn modelau parametrig. I ragweld data, y cyfan sydd angen i chi ei wybod yw paramedrau'r model.

Mae'r canlynol yn enghreifftiau nodweddiadol: atchweliad logistaidd, atchweliad llinol, a SVMs llinol. Mae modelau nad ydynt yn baramedrig yn hyblyg oherwydd gallant gynnwys nifer anghyfyngedig o baramedrau.

Mae angen paramedrau'r model a statws y data a arsylwyd ar gyfer rhagfynegiadau data. Dyma rai enghreifftiau nodweddiadol: modelau pwnc, coed penderfyniad, a k-cymydogion agosaf.

21. Disgrifiwch hidlo cydweithredol. Yn ogystal â hidlo seiliedig ar gynnwys?

Dull profedig iawn o greu awgrymiadau cynnwys wedi'u teilwra yw hidlo cydweithredol.

Mae math o system argymell o'r enw hidlo cydweithredol yn rhagfynegi deunydd ffres trwy gydbwyso dewisiadau defnyddwyr â diddordebau cyffredin.

Dewisiadau defnyddwyr yw'r unig beth y mae systemau argymell sy'n seiliedig ar gynnwys yn ei ystyried. Yng ngoleuni dewisiadau blaenorol y defnyddiwr, darperir argymhellion newydd o ddeunydd cysylltiedig.

22. Beth yn union yw ystyr y gyfres Time?

Casgliad o rifau mewn trefn esgynnol yw cyfres amser. Dros gyfnod o amser a bennwyd ymlaen llaw, mae'n monitro symudiad y pwyntiau data a ddewiswyd ac yn dal y pwyntiau data o bryd i'w gilydd.

Nid oes isafswm nac uchafswm amser ar gyfer cyfresi amser.

Defnyddir cyfresi amser yn aml gan ddadansoddwyr i ddadansoddi data yn unol â'u gofynion unigryw.

23. Disgrifiwch yr amrywiadau rhwng yr algorithmau Hybu Graddiant a Choedwig Hap.

Coedwig ar Hap:

Mae nifer fawr o goed penderfynu yn cael eu cronni gyda'i gilydd ar y diwedd ac fe'u gelwir yn goedwigoedd ar hap.
Er bod cynyddu graddiant yn cynhyrchu pob coeden yn annibynnol ar y lleill, mae coedwig ar hap yn adeiladu pob coeden un ar y tro.
Aml-ddosbarth canfod gwrthrych yn gweithio'n dda gyda choedwigoedd ar hap.

Hybu graddiant:

Tra bod coedwigoedd ar hap yn ymuno â choed penderfynu ar ddiwedd y broses, mae Peiriannau Hybu Graddiant yn eu cyfuno o'r dechrau.
Os caiff paramedrau eu haddasu'n briodol, mae hwb graddiant yn perfformio'n well na choedwigoedd ar hap o ran canlyniadau, ond nid yw'n ddewis call os oes gan y set ddata lawer o allgleifion, anghysondebau neu sŵn gan y gallai achosi i'r model fynd yn orffit.
Pan fo data anghytbwys, fel mewn asesiad risg amser real, mae hybu graddiant yn perfformio'n dda.

24. Pam mae angen matrics dryswch arnoch chi? Beth yw e?

Defnyddir tabl a elwir yn fatrics dryswch, a elwir weithiau yn fatrics gwallau, yn eang i ddangos pa mor dda y mae model dosbarthu, neu ddosbarthwr, yn perfformio ar set o ddata prawf y mae'r gwerthoedd gwirioneddol yn hysbys ar eu cyfer.

Mae'n ein galluogi i weld sut mae model neu algorithm yn perfformio. Mae'n ei gwneud hi'n syml i ni sylwi ar gamddealltwriaeth ymhlith cyrsiau amrywiol.

Mae'n ffordd o werthuso pa mor dda y mae model neu algorithm yn cael ei berfformio.

Mae rhagfynegiadau model dosbarthu yn cael eu crynhoi mewn matrics dryswch. Defnyddiwyd gwerthoedd cyfrif pob label dosbarth i ddadansoddi cyfanswm y rhagfynegiadau cywir ac anghywir.

Mae'n rhoi manylion am y diffygion a wneir gan y dosbarthwr yn ogystal â'r gwahanol fathau o wallau a achosir gan ddosbarthwyr.

25. Beth yn union yw prif ddadansoddiad cydran?

Trwy leihau nifer y newidynnau sy'n cydberthyn i'w gilydd, y nod yw lleihau maint y dimensiwn wrth gasglu data. Ond mae'n bwysig cadw'r amrywiaeth cymaint â phosib.

Mae'r newidynnau'n cael eu newid i set hollol newydd o newidynnau o'r enw prif gydrannau.

Mae'r cyfrifiaduron personol hyn yn orthogonol gan eu bod yn fectorau eigen matrics covariance.

26. Pam mae cylchdroi cydrannau mor hanfodol i PCA (dadansoddiad prif gydrannau)?

Mae cylchdroi yn hanfodol yn PCA oherwydd ei fod yn gwneud y gorau o'r gwahaniad rhwng yr amrywiannau a geir gan bob cydran, gan wneud dehongliad cydran yn symlach.

Mae angen cydrannau estynedig arnom i fynegi amrywiad cydran os nad yw'r cydrannau'n cael eu cylchdroi.

27. Sut mae rheoleiddio a normaleiddio yn amrywio oddi wrth ei gilydd?

Normaleiddio:

Mae data yn cael ei newid yn ystod normaleiddio. Dylech normaleiddio'r data os oes ganddo raddfeydd sy'n dra gwahanol, yn enwedig o isel i uchel. Addaswch bob colofn fel bod yr ystadegau sylfaenol i gyd yn gydnaws.

Er mwyn sicrhau nad yw cywirdeb yn cael ei golli, gall hyn fod yn ddefnyddiol. Mae canfod y signal wrth anwybyddu'r sŵn yn un o amcanion hyfforddiant model.

Mae siawns o or-ffitio os rhoddir rheolaeth lwyr i'r model i leihau gwall.

Rheoleiddio:

Wrth reoleiddio, caiff y swyddogaeth ragfynegi ei haddasu. Mae hyn yn destun rhywfaint o reolaeth trwy reoleiddio, sy'n ffafrio swyddogaethau gosod symlach yn hytrach na rhai cymhleth.

28. Sut mae normaleiddio a safoni yn wahanol i'w gilydd?

Y ddwy dechneg a ddefnyddir amlaf ar gyfer graddio nodweddion yw normaleiddio a safoni.

Normaleiddio:

Gelwir ailraddio'r data i weddu i ystod [0,1] yn normaleiddio.
Pan fo'n rhaid i bob paramedr fod â'r un raddfa gadarnhaol, mae normaleiddio yn ddefnyddiol, ond mae allanolion y set ddata yn cael eu colli.

Rheoleiddio:

Caiff data eu hailraddio i gael cymedr o 0 a gwyriad safonol o 1 fel rhan o'r broses safoni (amrywiant uned)

29. Beth yn union mae “amrywiant chwyddiant ffactor” yn ei olygu?

Gelwir cymhareb amrywiant y model i amrywiant y model gydag un newidyn annibynnol yn unig yn ffactor chwyddiant amrywiad (VIF).

Mae VIF yn amcangyfrif faint o aml-gydlinedd sy'n bresennol mewn set o nifer o newidynnau atchweliad.

Amrywiad y Model (VIF) Model gydag Un Amrywiant Amrywiol Annibynnol

30. Yn seiliedig ar faint y set hyfforddi, sut ydych chi'n dewis dosbarthwr?

Mae model tuedd uchel, amrywiad isel yn perfformio'n well ar gyfer set hyfforddi fer gan fod gorffitio yn llai tebygol. Mae Naive Bayes yn un enghraifft.

Er mwyn cynrychioli rhyngweithiadau mwy cymhleth ar gyfer set hyfforddi fawr, mae model â thuedd isel ac amrywiant uchel yn well. Mae atchweliad logistaidd yn enghraifft dda.

31. Pa algorithm mewn dysgu peirianyddol y cyfeirir ato fel y “dysgwr diog” a pham?

Yn ddysgwr swrth, mae KNN yn algorithm dysgu peirianyddol. Gan fod K-NN yn cyfrifo pellter yn ddeinamig bob tro y mae'n dymuno dosbarthu yn hytrach na dysgu unrhyw werthoedd neu newidynnau a ddysgwyd gan beiriant o'r data hyfforddi, mae'n cofio'r set ddata hyfforddi.

Mae hyn yn gwneud K-NN yn ddysgwr diog.

32. Beth yw Cromlin ROC a'r AUC?

Cynrychiolir perfformiad model dosbarthu ar bob trothwy yn graffigol gan gromlin ROC. Mae ganddo wir feini prawf cyfradd bositif a chyfradd bositif ffug.

Yn syml, gelwir yr ardal o dan gromlin ROC yn AUC (Ardal o Dan y Gromlin ROC). Mae arwynebedd dau ddimensiwn cromlin ROC o (0,0) i AUC yn cael ei fesur (1,1). Ar gyfer asesu modelau dosbarthu deuaidd, fe'i defnyddir fel ystadegyn perfformiad.

33. Beth yw hyperparameters? Beth sy'n eu gwneud yn unigryw o baramedrau'r model?

Gelwir newidyn mewnol y model yn baramedr model. Gan ddefnyddio data hyfforddi, brasamcanir gwerth paramedr.

Yn anhysbys i'r model, mae hyperparamedr yn newidyn. Ni ellir pennu'r gwerth o ddata, felly fe'u defnyddir yn aml i gyfrifo paramedrau model.

34. Beth mae Sgôr F1, adalw, a manwl gywirdeb yn ei olygu?

Y Mesur dryswch yw'r metrig a ddefnyddir i fesur effeithiolrwydd y model dosbarthu. Gellir defnyddio'r ymadroddion canlynol i egluro'r metrig dryswch yn well:

TP: Gwir Gadarnhaol – Dyma'r gwerthoedd cadarnhaol a ragwelwyd yn gywir. Mae'n awgrymu bod gwerthoedd y dosbarth rhagamcanol a'r dosbarth gwirioneddol yn gadarnhaol.

TN: Gwir Negyddol - Dyma'r gwerthoedd anffafriol a ragwelwyd yn gywir. Mae'n awgrymu bod gwerth y dosbarth gwirioneddol a'r dosbarth a ragwelir yn negyddol.

Mae'r gwerthoedd hyn - positifau ffug a negyddol ffug - yn digwydd pan fydd eich dosbarth gwirioneddol yn wahanol i'r dosbarth a ragwelir.

Yn awr,

Gelwir cymhareb y gwir gyfradd bositif (TP) i'r holl arsylwadau a wneir yn y dosbarth gwirioneddol yn adalw, a elwir hefyd yn sensitifrwydd.

Yr adalw yw TP/(TP+FN).

Mae manwl gywirdeb yn fesur o'r gwerth rhagfynegol positif, sy'n cymharu nifer y positifau y mae'r model yn eu rhagweld mewn gwirionedd â faint o bethau positif cywir y mae'n eu rhagweld yn gywir.

Y cywirdeb yw TP / (TP + FP)

Y metrig perfformiad hawsaf i'w ddeall yw cywirdeb, sef dim ond cyfran yr arsylwadau a ragfynegwyd yn gywir i'r holl arsylwadau.

Mae cywirdeb yn hafal i (TP+TN)/(TP+FP+FN+TN).

Caiff Manwl a Galw i gof eu pwysoli a'u cyfartaleddu i ddarparu'r Sgôr F1. O ganlyniad, mae'r sgôr hwn yn ystyried positifau ffug a negyddol ffug.

Mae F1 yn aml yn fwy gwerthfawr na chywirdeb, yn enwedig os oes gennych ddosbarthiad dosbarth anghyfartal, hyd yn oed os yn reddfol nid yw mor syml i'w ddeall â chywirdeb.

Cyflawnir y cywirdeb gorau pan fo cost positifau ffug a negatifau ffug yn gymaradwy. Mae'n well cynnwys Manwl a Galw i gof os yw'r costau sy'n gysylltiedig â chadarnhaol ffug a negyddol ffug yn amrywio'n sylweddol.

35. Beth yn union yw croes-ddilysu?

Mae dull ailsamplu ystadegol o'r enw traws-ddilysu mewn dysgu peirianyddol yn defnyddio sawl is-set set ddata i hyfforddi a gwerthuso algorithm dysgu peiriant ar draws nifer o rowndiau.

Mae swp newydd o ddata na chafodd ei ddefnyddio i hyfforddi'r model yn cael ei brofi gan ddefnyddio traws-ddilysiad i weld pa mor dda y mae'r model yn ei ragweld. Mae gorffitio data yn cael ei atal trwy groes-ddilysu.

K-Plyg Mae'r dull ailsamplu a ddefnyddir amlaf yn rhannu'r set ddata gyfan yn setiau K o'r un maint. Fe'i gelwir yn groes-ddilysu.

36. Gadewch i ni ddweud eich bod wedi darganfod bod gan eich model amrywiad sylweddol. Pa algorithm, yn eich barn chi, sydd fwyaf addas i drin y sefyllfa hon?

Rheoli amrywioldeb uchel

Dylem ddefnyddio'r dechneg bagio ar gyfer problemau gydag amrywiadau mawr.

Byddai'r algorithm bagio yn defnyddio samplu data ar hap dro ar ôl tro i rannu'r data yn is-grwpiau. Unwaith y bydd y data wedi'i rannu, gallwn ddefnyddio data ar hap a gweithdrefn hyfforddi benodol i gynhyrchu rheolau.

Wedi hynny, gellid defnyddio arolygon barn i gyfuno rhagfynegiadau'r model.

37. Beth sy'n gwahaniaethu atchweliad Ridge oddi wrth atchweliad Lasso?

Dau ddull rheoleiddio a ddefnyddir yn eang yw atchweliad Lasso (a elwir hefyd yn L1) a Ridge (a elwir weithiau yn L2). Cânt eu defnyddio i atal gorffitio data.

Er mwyn darganfod yr ateb gorau a lleihau cymhlethdod, defnyddir y technegau hyn i gosbi'r cyfernodau. Trwy gosbi cyfanswm gwerthoedd absoliwt y cyfernodau, mae atchweliad Lasso yn gweithredu.

Mae'r ffwythiant cosb yn atchweliad Ridge neu L2 yn deillio o swm sgwariau'r cyfernodau.

38. Pa un sy'n bwysicach: perfformiad model neu gywirdeb model? Pa un a pham fyddwch chi'n ei ffafrio?

Mae hwn yn gwestiwn twyllodrus, felly dylai rhywun ddeall yn gyntaf beth yw Perfformiad Model. Os diffinnir perfformiad fel cyflymder, yna mae'n dibynnu ar y math o gais; byddai unrhyw gais sy'n ymwneud â sefyllfa amser real yn gofyn am gyflymder uchel fel elfen hanfodol.

Er enghraifft, bydd y Canlyniadau Chwilio gorau yn dod yn llai gwerthfawr os bydd canlyniadau'r Ymholiad yn cymryd gormod o amser i'w cyrraedd.

Os defnyddir Perfformiad fel cyfiawnhad dros pam y dylid rhoi blaenoriaeth i drachywiredd a galw i gof uwchlaw cywirdeb, yna bydd sgôr F1 yn fwy defnyddiol na chywirdeb wrth ddangos yr achos busnes ar gyfer unrhyw set ddata sy’n anghytbwys.

39. Sut byddech chi'n rheoli set ddata gydag anghydraddoldebau?

Gall set ddata anghytbwys elwa o dechnegau samplu. Gellir samplu naill ai heb ddigon o sampl neu wedi'i orsamplu.

Mae Dan Samplu yn caniatáu i ni leihau maint y dosbarth mwyafrif i gyd-fynd â'r dosbarth lleiafrifol, sy'n helpu i gynyddu cyflymder o ran storio a gweithredu amser rhedeg ond a all hefyd arwain at golli data gwerthfawr.

Er mwyn unioni'r broblem o golli gwybodaeth a achosir gan orsamplu, rydym yn uwchsamplu'r dosbarth Lleiafrifol; serch hynny, mae hyn yn achosi i ni redeg i mewn i faterion gorffitio.

Mae strategaethau ychwanegol yn cynnwys:

Gorsamplo mewn Clwstwr - Mae'r achosion dosbarth lleiafrifol a mwyafrifol yn destun y dechneg clystyru K-modd yn unigol yn y sefyllfa hon. Gwneir hyn i ddod o hyd i glystyrau o setiau data. Yna, caiff pob clwstwr ei orsamplu fel bod pob dosbarth yr un maint a bod gan bob clwstwr o fewn dosbarth yr un nifer o achosion.
SMOTE: Techneg Gor-samplu Lleiafrifoedd Synthetig - Defnyddir darn o ddata o'r dosbarth lleiafrifol fel enghraifft, ac ar ôl hynny mae enghreifftiau artiffisial ychwanegol y gellir eu cymharu ag ef yn cael eu cynhyrchu a'u hychwanegu at y set ddata wreiddiol. Mae'r dull hwn yn gweithio'n dda gyda phwyntiau data rhifol.

40. Sut gallwch chi wahaniaethu rhwng rhoi hwb a bagio?

Mae gan Ensemble Techniques fersiynau a elwir yn bagio a rhoi hwb.

Bagio -

Ar gyfer algorithmau ag amrywiad uchel, mae bagio yn dechneg a ddefnyddir i leihau'r amrywiant. Un teulu o ddosbarthwyr o'r fath sy'n dueddol o duedd yw teulu'r goeden benderfynu.

Mae'r math o ddata y mae coed penderfynu yn cael eu hyfforddi yn ei gylch yn cael effaith sylweddol ar eu perfformiad. Oherwydd hyn, hyd yn oed gyda mireinio uchel iawn, mae cyffredinoli canlyniadau weithiau'n llawer anoddach i'w gael ynddynt.

Os caiff data hyfforddi coed penderfyniadau ei newid, mae'r canlyniadau'n amrywio'n sylweddol.

O ganlyniad, defnyddir bagio, lle mae llawer o goed penderfynu yn cael eu creu, pob un ohonynt yn cael ei hyfforddi gan ddefnyddio sampl o'r data gwreiddiol, a'r canlyniad terfynol yw cyfartaledd yr holl fodelau gwahanol hyn.

Rhoi hwb:

Hybu yw'r dechneg o wneud rhagfynegiadau gyda system ddosbarthu n-wan lle mae pob dosbarthwr gwan yn gwneud iawn am ddiffygion ei ddosbarthwyr cryfach. Rydym yn cyfeirio at ddosbarthwr sy'n perfformio'n wael ar set ddata benodol fel “dosbarthwr gwan.”

Mae rhoi hwb yn amlwg yn broses yn hytrach nag algorithm. Mae atchweliad logistaidd a choed penderfynu bas yn enghreifftiau cyffredin o ddosbarthwyr gwan.

Adaboost, Gradient Boosting, ac XGBoost yw'r ddau algorithm hybu mwyaf poblogaidd, fodd bynnag, mae llawer mwy.

41. Eglurwch y gwahaniaethau rhwng dysgu anwythol a diddwythol.

Wrth ddysgu trwy esiampl o set o enghreifftiau a arsylwyd, mae model yn defnyddio dysgu anwythol i ddod i gasgliad cyffredinol. Ar y llaw arall, gyda dysgu diddwythol, mae'r model yn defnyddio'r canlyniad cyn ffurfio un ei hun.

Dysgu anwythol yw'r broses o ddod i gasgliadau o arsylwadau.

Dysgu diddwythol yw'r broses o greu arsylwadau yn seiliedig ar gasgliadau.

Casgliad

Llongyfarchiadau! Dyma'r 40 cwestiwn cyfweliad uchaf ac uwch ar gyfer dysgu peirianyddol rydych chi bellach yn gwybod yr atebion iddynt. Gwyddor data a deallusrwydd artiffisial bydd galw am alwedigaethau o hyd wrth i dechnoleg ddatblygu.

Gall ymgeiswyr sy'n diweddaru eu gwybodaeth am y technolegau blaengar hyn ac yn gwella eu set sgiliau ddod o hyd i amrywiaeth eang o bosibiliadau cyflogaeth gyda chyflog cystadleuol.

Gallwch fwrw ymlaen ag ateb y cyfweliadau nawr bod gennych ddealltwriaeth gadarn o sut i ymateb i rai o'r cwestiynau cyfweliad dysgu peirianyddol a ofynnir yn eang.

Yn dibynnu ar eich nodau, cymerwch y cam canlynol. Paratowch ar gyfer cyfweliadau trwy ymweld â Hashdork's Cyfres Cyfweliadau.

40+ o Gwestiynau Cyfweliad Dysgu Peiriannau Gorau