Mbi 40 pyetjet kryesore të intervistës për mësimin e makinerisë (2024)

Përmbajtje[Fshih][Shfaqje]

1. Shpjegoni ndryshimet midis mësimit të makinerive, inteligjencës artificiale dhe mësimit të thellë.
2. Përshkruani llojet e ndryshme të mësimit të makinerive.
3. Cili është kompensimi i paragjykimit kundrejt variancës?
4. Algoritmet e mësimit të makinerive kanë evoluar ndjeshëm me kalimin e kohës. Si mund të zgjidhni algoritmin e duhur për të përdorur një grup të dhënash?
5. Si ndryshojnë kovarianca dhe korrelacioni?
6. Në mësimin e makinerive, çfarë do të thotë grupimi?
7. Cili është algoritmi juaj i preferuar për mësimin e makinerive?
8. Regresioni linear në mësimin e makinerisë: çfarë është?
9. Përshkruani ndryshimet midis grupimit KNN dhe k-means.
10. Çfarë do të thotë për ju “paragjykimi i përzgjedhjes”?
11. Çfarë është saktësisht teorema e Bayes?
12. Në një model të mësimit të makinerisë, çfarë janë 'Set-i i trajnimit' dhe 'Set-i i testimit'?
13. Çfarë është një hipotezë në mësimin e makinerive?
14. Çfarë do të thotë mbipërshtatja e mësimit të makinerive dhe si mund të parandalohet?
15. Çfarë saktësisht janë klasifikuesit Naive Bayes?
16. Çfarë nënkuptojnë Funksionet e Kostos dhe Funksionet e Humbjes?
17. Çfarë e dallon një model gjenerues nga një model diskriminues?
18. Përshkruani variacionet ndërmjet gabimeve të tipit I dhe tipit II.
19. Në mësimin e makinës, çfarë është teknika e të mësuarit të Ansamblit?
20. Çfarë janë saktësisht modelet parametrike? Jep një shembull.
21. Përshkruani filtrimin bashkëpunues. Si dhe filtrimi i bazuar në përmbajtje?
22. Çfarë saktësisht kuptoni me seritë kohore?
23. Përshkruani variacionet midis algoritmeve për rritjen e gradientit dhe pyllit të rastësishëm.
24. Pse keni nevojë për një matricë konfuzioni? Çfarë është ajo?
25. Çfarë është saktësisht analiza e komponentëve parimore?
26. Pse është rotacioni i komponentëve kaq vendimtar për PCA (analiza e komponentit kryesor)?
27. Si ndryshojnë rregullimi dhe normalizimi nga njëri-tjetri?
28. Si ndryshojnë nga njëri-tjetri normalizimi dhe standardizimi?
29. Çfarë do të thotë saktësisht “faktori i inflacionit të variancës”?
30. Bazuar në madhësinë e grupit të trajnimit, si zgjidhni një klasifikues?
31. Cili algoritëm në mësimin e makinerive quhet "nxënësi dembel" dhe pse?
32. Çka janë kurba ROC dhe AUC?
33. Çka janë hiperparametrat? Çfarë i bën ato unike nga parametrat e modelit?
34. Çfarë do të thotë F1 Score, rikujtimi dhe saktësia?
35. Çka është saktësisht verifikimi i kryqëzuar?
36. Le të themi se keni zbuluar se modeli juaj ka një variancë të konsiderueshme. Cili algoritëm, sipas mendimit tuaj, është më i përshtatshmi për të trajtuar këtë situatë?
37. Çfarë e dallon regresionin Ridge nga regresioni Lasso?
38. Cila është më e rëndësishme: performanca e modelit apo saktësia e modelit? Cilin dhe pse do ta favorizoni?
39. Si do ta menaxhonit një grup të dhënash me pabarazi?
40. Si mund të dalloni mes nxitjes dhe bagazhit?
41. Shpjegoni ndryshimet midis të nxënit induktiv dhe deduktiv.
Përfundim

Bizneset po përdorin teknologjinë e fundit, të tilla si inteligjenca artificiale (AI) dhe mësimi i makinerive, për të rritur aksesin e informacionit dhe shërbimeve për individët.

Këto teknologji janë duke u adoptuar nga një sërë industrish, duke përfshirë bankat, financat, shitjet me pakicë, prodhimtarinë dhe kujdesin shëndetësor.

Një nga rolet organizative më të kërkuara që përdor AI është për shkencëtarët e të dhënave, inxhinierët e inteligjencës artificiale, inxhinierët e mësimit të makinerive dhe analistët e të dhënave.

Ky postim do t'ju çojë nëpër një shumëllojshmëri të Mësimi makinë Pyetjet e intervistës, nga ato themelore në komplekse, për t'ju ndihmuar të përgatiteni për çdo pyetje që mund t'ju bëhet kur kërkoni punën tuaj ideale.

1. Shpjegoni ndryshimet midis mësimit të makinerive, inteligjencës artificiale dhe mësimit të thellë.

Inteligjenca artificiale përdor një shumëllojshmëri metodash të mësimit të makinerive dhe mësimit të thellë që lejojnë sistemet kompjuterike të kryejnë detyra duke përdorur inteligjencën njerëzore me logjikë dhe rregulla.

Mësimi i makinerisë përdor një sërë statistikash dhe qasjesh të të mësuarit të thellë për t'i mundësuar makinerive të mësojnë nga performanca e tyre e mëparshme dhe të bëhen më të aftë në kryerjen e detyrave të caktuara vetë, pa mbikëqyrjen njerëzore.

Mësimi i thellë është një koleksion algoritmesh që lejon softuerin të mësojë nga vetja dhe të kryejë një sërë funksionesh komerciale, si njohja e zërit dhe e figurës.

Sistemet që ekspozojnë shumështresat e tyre rrjetet nervore në sasi të mëdha të dhënash për të mësuar janë në gjendje të bëjnë mësim të thellë.

2. Përshkruani llojet e ndryshme të mësimit të makinerive.

Mësimi i makinerisë ekziston në tre lloje të ndryshme gjerësisht:

Mësimi i mbikëqyrur: Një model krijon parashikime ose gjykime duke përdorur të dhëna të etiketuara ose historike në mësimin e mbikëqyrur të makinerisë. Grupet e të dhënave që janë etiketuar ose etiketuar për të rritur kuptimin e tyre quhen të dhëna të etiketuara.
Mësimi i pambikëqyrur: Ne nuk kemi të dhëna të etiketuara për mësimin e pambikëqyrur. Në të dhënat hyrëse, një model mund të gjejë modele, çudira dhe korrelacione.
Të mësuarit përforcues: Modeli mund mësoni duke përdorur përforcimin të mësuarit dhe shpërblimet që mori për sjelljen e mëparshme.

3. Cili është kompensimi i paragjykimit kundrejt variancës?

Mbi përshtatja është rezultat i njëanshmërisë, që është shkalla në të cilën një model përshtatet me të dhënat. Paragjykimi shkaktohet nga supozime të pasakta ose shumë të thjeshta në tuaj algoritmi i të mësuarit makinerik.

Varianca i referohet gabimeve të shkaktuara nga kompleksiteti në algoritmin tuaj ML, i cili prodhon ndjeshmëri ndaj shkallëve të mëdha të variancës në të dhënat e trajnimit dhe përshtatjen e tepërt.

Varianca është se sa ndryshon një model në varësi të inputeve.

Me fjalë të tjera, modelet bazë janë jashtëzakonisht të njëanshme por të qëndrueshme (variancë e ulët). Përshtatja e tepërt është një problem me modelet komplekse, megjithëse ato gjithsesi kapin realitetin e modelit (paragjykim i ulët).

Për të parandaluar si variacionin e lartë ashtu edhe paragjykimin e lartë, është i nevojshëm një shkëmbim ndërmjet paragjykimit dhe variancës për reduktimin më të mirë të gabimit.

4. Algoritmet e mësimit të makinerive kanë evoluar ndjeshëm me kalimin e kohës. Si mund të zgjidhni algoritmin e duhur për të përdorur një grup të dhënash?

Teknika e mësimit të makinës që duhet të përdoret varet vetëm nga lloji i të dhënave në një grup të dhënash specifike.

Kur të dhënat janë lineare, përdoret regresioni linear. Metoda e grumbullimit do të funksiononte më mirë nëse të dhënat tregojnë jolinearitet. Ne mund të përdorim pemët e vendimit ose SVM nëse të dhënat duhet të vlerësohen ose interpretohen për qëllime komerciale.

Rrjetet nervore mund të jenë të dobishme për të marrë një përgjigje të saktë nëse grupi i të dhënave përfshin foto, video dhe audio.

Zgjedhja e algoritmit për një rrethanë specifike ose grumbullimi i të dhënave nuk mund të bëhet vetëm me një masë të vetme.

Për qëllimin e zhvillimit të metodës së përshtatjes më të mirë, së pari duhet të shqyrtojmë të dhënat duke përdorur analizën e të dhënave eksploruese (EDA) dhe të kuptojmë qëllimin e përdorimit të të dhënave.

5. Si ndryshojnë kovarianca dhe korrelacioni?

Kovarianca vlerëson se si dy variabla janë të lidhur me njëri-tjetrin dhe se si njëra mund të ndryshojë në përgjigje të ndryshimeve në tjetrën.

Nëse rezultati është pozitiv, ai tregon se ekziston një lidhje e drejtpërdrejtë midis variablave dhe se njëri do të rritet ose ulet me një rritje ose ulje të variablit bazë, duke supozuar se të gjitha kushtet e tjera qëndrojnë konstante.

Korrelacioni mat lidhjen midis dy ndryshoreve të rastësishme dhe ka vetëm tre vlera të dallueshme: 1, 0 dhe -1.

6. Në mësimin e makinerive, çfarë do të thotë grupimi?

Metodat e të mësuarit pa mbikëqyrje që grupojnë pikat e të dhënave së bashku quhen grupim. Me një koleksion të pikave të të dhënave, teknika e grupimit mund të zbatohet.

Ju mund të gruponi të gjitha pikat e të dhënave sipas funksioneve të tyre duke përdorur këtë strategji.

Karakteristikat dhe cilësitë e pikave të të dhënave që bien në të njëjtën kategori janë të ngjashme, ndërsa ato të pikave të të dhënave që ndahen në grupime të veçanta janë të ndryshme.

Kjo qasje mund të përdoret për të analizuar të dhënat statistikore.

7. Cili është algoritmi juaj i preferuar për mësimin e makinerive?

Ju keni mundësinë të demonstroni preferencat tuaja dhe talentet unike në këtë pyetje, si dhe njohuritë tuaja gjithëpërfshirëse për teknikat e shumta të mësimit të makinerive.

Këtu janë disa algoritme tipike të mësimit të makinerive për të menduar:

Regresionit linear
Regresioni logjistik
Bayes naive
Pemët vendimtare
K do të thotë
Algoritmi i rastësishëm i pyjeve
Fqinji më i afërt K (KNN)

8. Regresioni linear në mësimin e makinerisë: çfarë është?

Një algoritëm i mbikëqyrur i mësimit të makinerisë është regresioni linear.

Përdoret në analizën parashikuese për të përcaktuar lidhjen lineare midis variablave të varur dhe të pavarur.

Ekuacioni i regresionit linear është si më poshtë:

Y = A + BX

ku:

Ndryshorja hyrëse ose e pavarur quhet X.
Variabla e varur ose dalëse është Y.
Koeficienti i X-së është b, dhe ndërprerja e tij është a.

9. Përshkruani ndryshimet midis grupimit KNN dhe k-means.

Dallimi kryesor është se KNN (një metodë klasifikimi, mësim i mbikëqyrur) ka nevojë për pika të etiketuara, ndërsa k-mesatarja jo (algoritmi i grupimit, mësimi i pambikëqyrur).

Ju mund t'i klasifikoni të dhënat e etiketuara në një pikë të paetiketuar duke përdorur K-Fqinjët më të afërt. Grumbullimi i mjeteve K përdor distancën mesatare midis pikave për të mësuar se si të grupohen pikat e paetiketuara.

10. Çfarë do të thotë për ju “paragjykimi i përzgjedhjes”?

Paragjykimi në fazën e kampionimit të një eksperimenti është për shkak të pasaktësisë statistikore.

Një grup mostër zgjidhet më shpesh se grupet e tjera në eksperiment si rezultat i pasaktësisë.

Nëse paragjykimi i përzgjedhjes nuk pranohet, mund të rezultojë në një përfundim të pasaktë.

11. Çfarë është saktësisht teorema e Bayes?

Kur jemi të vetëdijshëm për probabilitete të tjera, ne mund të përcaktojmë një probabilitet duke përdorur teoremën e Bayes. Ai ofron probabilitetin e mëvonshëm të një ndodhie bazuar në informacionin paraprak, me fjalë të tjera.

Një metodë e shëndoshë për vlerësimin e probabiliteteve të kushtëzuara jepet nga kjo teoremë.

Gjatë zhvillimit të problemeve të modelimit parashikues të klasifikimit dhe përshtatjes së një modeli në një trajnim të dhënat në mësimin e makinerive, zbatohet teorema e Bayes (p.sh. Naive Bayes, Bayes Optimal Classifier).

12. Në një model të mësimit të makinerisë, çfarë janë 'Set-i i trajnimit' dhe 'Set-i i testimit'?

Set trajnimi:

Seti i trajnimit përbëhet nga instanca që i dërgohen modelit për analizë dhe mësim.
Këto janë të dhënat e etiketuara që do të përdoren për të trajnuar modelin.
Në mënyrë tipike, 70% e të dhënave totale përdoren si grup i të dhënave të trajnimit.

Set testimi:

Grupi i testit përdoret për të vlerësuar saktësinë e gjenerimit të hipotezës së modelit.
Ne testojmë pa të dhëna të etiketuara dhe më pas përdorim etiketa për të konfirmuar rezultatet.
30% e mbetur përdoret si grup i të dhënave testuese.

13. Çfarë është një hipotezë në mësimin e makinerive?

Mësimi i Makinerisë mundëson përdorimin e grupeve ekzistuese të të dhënave për të kuptuar më mirë një funksion të caktuar që lidh hyrjen me daljen. Kjo njihet si përafrim i funksionit.

Në këtë rast, përafrimi duhet të përdoret për funksionin e synuar të panjohur për të transferuar të gjitha vëzhgimet e mundshme bazuar në situatën e dhënë në mënyrën më të mirë të mundshme.

Në mësimin e makinerive, një hipotezë është një model që ndihmon në vlerësimin e funksionit të synuar dhe plotësimin e hartave të duhura të hyrjes në dalje.

Përzgjedhja dhe dizajni i algoritmeve mundëson përcaktimin e hapësirës së hipotezave të mundshme që mund të përfaqësohen nga një model.

Për një hipotezë të vetme, përdoret shkronja e vogël h (h), por kapitali h (H) përdoret për të gjithë hapësirën e hipotezës që po kërkohet. Ne do të shqyrtojmë shkurtimisht këto shënime:

Një hipotezë (h) është një model i veçantë që lehtëson hartëzimin e hyrjes në dalje, e cila më pas mund të përdoret për vlerësim dhe parashikim.
Një grup hipotezash (H) është një hapësirë e kërkueshme e hipotezave që mund të përdoret për të hartuar hyrjet me rezultatet. Inkuadrimi i çështjeve, modeli dhe konfigurimi i modelit janë disa shembuj të kufizimeve të përgjithshme.

14. Çfarë do të thotë mbipërshtatja e mësimit të makinerive dhe si mund të parandalohet?

Kur një makinë përpiqet të mësojë nga një grup të dhënash të pamjaftueshme, ndodh mbipërshtatja.

Si rezultat, përshtatja e tepërt lidhet në mënyrë të kundërt me vëllimin e të dhënave. Qasja e verifikimit të kryqëzuar lejon që të shmanget mbipërshtatja për grupe të vogla të dhënash. Një grup të dhënash ndahet në dy pjesë në këtë metodë.

Të dhënat për testim dhe trajnim do të përbëhet nga këto dy pjesë. Të dhënat e trajnimit përdoren për të krijuar një model, ndërsa grupi i të dhënave testuese përdoret për të vlerësuar modelin duke përdorur inpute të ndryshme.

Kjo është mënyra për të parandaluar mbivendosjen.

15. Çfarë saktësisht janë klasifikuesit Naive Bayes?

Metoda të ndryshme klasifikimi përbëjnë klasifikuesit Naive Bayes. Një grup algoritmesh të njohur si këta klasifikues punojnë të gjithë në të njëjtën ide themelore.

Supozimi i bërë nga klasifikuesit naivë të Bayes është se prania ose mungesa e një veçorie nuk ka asnjë ndikim në praninë ose mungesën e një tipari tjetër.

Me fjalë të tjera, kjo është ajo që ne i referohemi si "naive" pasi supozohet se çdo atribut i të dhënave është po aq domethënës dhe i pavarur.

Klasifikimi bëhet duke përdorur klasifikues naivë Bayes. Ato janë të thjeshta për t'u përdorur dhe prodhojnë rezultate më të mira se parashikuesit më kompleksë kur premisa e pavarësisë është e vërtetë.

Në analizën e tekstit, filtrimin e spamit dhe sistemet e rekomandimit, ato përdoren.

16. Çfarë nënkuptojnë Funksionet e Kostos dhe Funksionet e Humbjes?

Shprehja "funksioni i humbjes" i referohet procesit të llogaritjes së humbjes kur merret parasysh vetëm një pjesë e të dhënave.

Në të kundërt, ne përdorim funksionin e kostos për të përcaktuar sasinë totale të gabimeve për të dhëna të shumta. Nuk ekziston asnjë dallim domethënës.

Me fjalë të tjera, ndërsa funksionet e kostos grumbullojnë diferencën për të gjithë grupin e të dhënave të trajnimit, funksionet e humbjes janë krijuar për të kapur diferencën midis vlerave aktuale dhe atyre të parashikuara për një regjistrim të vetëm.

17. Çfarë e dallon një model gjenerues nga një model diskriminues?

Një model diskriminues mëson ndryshimet midis disa kategorive të të dhënave. Një model gjenerues mbledh lloje të ndryshme të dhënash.

Në problemet e klasifikimit, modelet diskriminuese shpesh tejkalojnë modelet e tjera.

18. Përshkruani variacionet ndërmjet gabimeve të tipit I dhe tipit II.

Pozitivet e rreme bien nën kategorinë e gabimeve të tipit I, ndërsa negativet e rreme hyjnë në gabimet e tipit II (duke pretenduar se asgjë nuk ka ndodhur kur në të vërtetë ka ndodhur).

19. Në mësimin e makinës, çfarë është teknika e të mësuarit të Ansamblit?

Një teknikë e quajtur mësimi i ansamblit përzien shumë modele të mësimit të makinerive për të prodhuar modele më të fuqishme.

Një model mund të ndryshohet për një sërë arsyesh. Disa shkaqe janë:

Popullsi të ndryshme
Hipoteza të ndryshme
Metoda të ndryshme modelimi

Do të hasim një problem gjatë përdorimit të të dhënave të trajnimit dhe testimit të modelit. Paragjykimi, varianca dhe gabimi i pakalueshëm janë llojet e mundshme të këtij gabimi.

Tani, ne e quajmë këtë ekuilibër midis paragjykimit dhe variancës në model një kompensim paragjykim-variancë, dhe ai duhet të ekzistojë gjithmonë. Ky kompromis realizohet nëpërmjet përdorimit të mësimit të ansamblit.

Megjithëse ka qasje të ndryshme të ansamblit në dispozicion, ekzistojnë dy strategji të zakonshme për kombinimin e shumë modeleve:

Një qasje vendase e quajtur bagging përdor grupin e trajnimit për të prodhuar grupe trajnimi shtesë.
Rritja, një teknikë më e sofistikuar: Ashtu si bagazhi, rritja përdoret për të gjetur formulën ideale të peshimit për një grup stërvitje.

20. Çfarë janë saktësisht modelet parametrike? Jep një shembull.

Ekzistojnë një sasi e kufizuar parametrash në modelet parametrike. Për të parashikuar të dhënat, gjithçka që duhet të dini janë parametrat e modelit.

Më poshtë janë shembuj tipikë: regresioni logjistik, regresioni linear dhe SVM lineare. Modelet joparametrike janë fleksibël pasi ato mund të përmbajnë një numër të pakufizuar parametrash.

Parametrat e modelit dhe statusi i të dhënave të vëzhguara kërkohen për parashikimet e të dhënave. Këtu janë disa shembuj tipikë: modelet e temave, pemët e vendimit dhe k-fqinjët më të afërt.

21. Përshkruani filtrimin bashkëpunues. Si dhe filtrimi i bazuar në përmbajtje?

Një metodë e provuar dhe e vërtetë për krijimin e sugjerimeve të përmbajtjes së përshtatur është filtrimi bashkëpunues.

Një formë sistemi rekomandimi i quajtur filtrim bashkëpunues parashikon materiale të freskëta duke balancuar preferencat e përdoruesve me interesat e përbashkëta.

Preferencat e përdoruesve janë e vetmja gjë që marrin në konsideratë sistemet e rekomanduesve të bazuara në përmbajtje. Në dritën e zgjedhjeve të mëparshme të përdoruesit, rekomandimet e reja ofrohen nga materialet përkatëse.

22. Çfarë saktësisht kuptoni me seritë kohore?

Një seri kohore është një koleksion numrash në rend rritës. Gjatë një periudhe kohore të paracaktuar, ai monitoron lëvizjen e pikave të përzgjedhura të të dhënave dhe kap periodikisht pikat e të dhënave.

Nuk ka të dhëna kohore minimale ose maksimale për seritë kohore.

Seritë kohore përdoren shpesh nga analistët për të analizuar të dhënat në përputhje me kërkesat e tyre unike.

23. Përshkruani variacionet midis algoritmeve për rritjen e gradientit dhe pyllit të rastësishëm.

Pylli i rastësishëm:

Një numër i madh i pemëve vendimtare grumbullohen së bashku në fund dhe njihen si pyje të rastit.
Ndërsa rritja e gradientit prodhon çdo pemë në mënyrë të pavarur nga të tjerat, pylli i rastësishëm ndërton secilën pemë një nga një.
me shumë klasa zbulimi i objektit funksionon mirë me pyjet e rastësishme.

Rritja e gradientit:

Ndërsa pyjet e rastësishme bashkohen me pemët e vendimit në fund të procesit, Makinat e Rritjes së Gradientit i kombinojnë ato që nga fillimi.
Nëse parametrat rregullohen siç duhet, rritja e gradientit tejkalon pyjet e rastësishme për sa i përket rezultateve, por nuk është një zgjedhje e zgjuar nëse grupi i të dhënave ka shumë të dhëna të jashtme, anomali ose zhurmë pasi mund të shkaktojë që modeli të bëhet i tepërt.
Kur ka të dhëna të pabalancuara, siç ka në vlerësimin e rrezikut në kohë reale, rritja e gradientit funksionon mirë.

24. Pse keni nevojë për një matricë konfuzioni? Çfarë është ajo?

Një tabelë e njohur si matrica e konfuzionit, ndonjëherë e njohur si matrica e gabimit, përdoret gjerësisht për të treguar se sa mirë funksionon një model klasifikimi, ose klasifikues, në një grup të dhënash testimi për të cilat dihen vlerat reale.

Na mundëson të shohim se si funksionon një model ose algoritëm. Na e bën të thjeshtë të dallojmë keqkuptimet midis kurseve të ndryshme.

Ai shërben si një mënyrë për të vlerësuar se sa mirë është kryer një model ose algoritëm.

Parashikimet e një modeli klasifikimi përpilohen në një matricë konfuzioni. Vlerat e numërimit të çdo etikete klase u përdorën për të zbërthyer numrin total të parashikimeve të sakta dhe të pasakta.

Ai jep detaje mbi gabimet e bëra nga klasifikuesi si dhe llojet e ndryshme të gabimeve të shkaktuara nga klasifikuesit.

25. Çfarë është saktësisht analiza e komponentëve parimore?

Duke minimizuar numrin e variablave që lidhen me njëri-tjetrin, qëllimi është të minimizohet dimensionaliteti i mbledhjes së të dhënave. Por është e rëndësishme të ruhet diversiteti sa më shumë që të jetë e mundur.

Variablat ndryshohen në një grup krejtësisht të ri variablash të quajtur komponentë kryesorë.

Këto PC janë ortogonale pasi janë eigjenvektorë të matricës së kovariancës.

26. Pse është rotacioni i komponentëve kaq vendimtar për PCA (analiza e komponentit kryesor)?

Rrotullimi është thelbësor në PCA sepse optimizon ndarjen midis variancave të marra nga secili komponent, duke e bërë më të thjeshtë interpretimin e komponentëve.

Ne kërkojmë komponentë të zgjeruar për të shprehur ndryshimin e komponentëve nëse komponentët nuk rrotullohen.

27. Si ndryshojnë rregullimi dhe normalizimi nga njëri-tjetri?

Normalizimi:

Të dhënat ndryshohen gjatë normalizimit. Ju duhet të normalizoni të dhënat nëse ato kanë shkallë që ndryshojnë në mënyrë drastike, veçanërisht nga e ulëta në e lartë. Rregulloni secilën kolonë në mënyrë që statistikat themelore të jenë të gjitha të pajtueshme.

Për të siguruar që nuk ka humbje të saktësisë, kjo mund të jetë e dobishme. Zbulimi i sinjalit duke injoruar zhurmën është një nga objektivat e trajnimit të modelit.

Ekziston një shans për përshtatje të tepërt nëse modelit i jepet kontroll i plotë për të zvogëluar gabimin.

Rregullimi:

Në rregullim, funksioni i parashikimit modifikohet. Kjo i nënshtrohet njëfarë kontrolli nëpërmjet rregullimit, i cili favorizon funksionet më të thjeshta të përshtatjes ndaj atyre të komplikuara.

28. Si ndryshojnë nga njëri-tjetri normalizimi dhe standardizimi?

Dy teknikat më të përdorura për shkallëzimin e veçorive janë normalizimi dhe standardizimi.

Normalizimi:

Rishkallëzimi i të dhënave për t'iu përshtatur një intervali [0,1] njihet si normalizim.
Kur të gjithë parametrat duhet të kenë të njëjtën shkallë pozitive, normalizimi është i dobishëm, por vlerat e jashtme të grupit të të dhënave humbasin.

Rregullimi:

Të dhënat rishkallëzohen për të pasur një mesatare prej 0 dhe një devijim standard prej 1 si pjesë e procesit të standardizimit (varianca e njësisë)

29. Çfarë do të thotë saktësisht “faktori i inflacionit të variancës”?

Raporti i variancës së modelit ndaj variancës së modelit me vetëm një variabël të pavarur njihet si faktori i inflacionit të variacionit (VIF).

VIF vlerëson sasinë e multikolinearitetit të pranishëm në një grup variablash të regresionit.

Varianca e modelit (VIF) Modeli me një variancë të pavarur variabël

30. Bazuar në madhësinë e grupit të trajnimit, si zgjidhni një klasifikues?

Një model i njëanshmërie të lartë, variancë të ulët funksionon më mirë për një grup të shkurtër trajnimi pasi përshtatja e tepërt është më pak e mundshme. Naive Bayes është një shembull.

Për të përfaqësuar ndërveprime më të komplikuara për një grup të madh trajnimi, preferohet një model me paragjykim të ulët dhe variancë të lartë. Regresioni logjistik është një shembull i mirë.

31. Cili algoritëm në mësimin e makinerive quhet "nxënësi dembel" dhe pse?

Një nxënës i ngadaltë, KNN është një algoritëm i mësimit të makinës. Për shkak se K-NN llogarit në mënyrë dinamike distancën sa herë që dëshiron të klasifikojë në vend që të mësojë ndonjë vlerë ose ndryshore të mësuar nga makina nga të dhënat e trajnimit, ai memorizon të dhënat e trajnimit.

Kjo e bën K-NN një nxënës dembel.

32. Çka janë kurba ROC dhe AUC?

Performanca e një modeli klasifikimi në të gjitha pragjet përfaqësohet grafikisht nga kurba ROC. Ka kritere të normës së vërtetë pozitive dhe normës false pozitive.

E thënë thjesht, zona nën kurbën ROC njihet si AUC (Area Under the ROC Curve). Zona dy-dimensionale e kurbës ROC nga (0,0) në AUC matet (1,1). Për vlerësimin e modeleve të klasifikimit binar, përdoret si një statistikë e performancës.

33. Çka janë hiperparametrat? Çfarë i bën ato unike nga parametrat e modelit?

Një variabël i brendshëm i modelit njihet si parametër model. Duke përdorur të dhënat e trajnimit, përafrohet vlera e një parametri.

I panjohur për modelin, një hiperparametër është një variabël. Vlera nuk mund të përcaktohet nga të dhënat, kështu që ato përdoren shpesh për të llogaritur parametrat e modelit.

34. Çfarë do të thotë F1 Score, rikujtimi dhe saktësia?

Masa e konfuzionit është metrika e përdorur për të vlerësuar efektivitetin e modelit të klasifikimit. Frazat e mëposhtme mund të përdoren për të shpjeguar më mirë metrikën e konfuzionit:

TP: Pozitivët e Vërtetë – Këto janë vlerat pozitive që janë parashikuar siç duhet. Ai sugjeron që vlerat e klasës së projektuar dhe të klasës aktuale janë pozitive.

TN: Negativë të Vërtetë- Këto janë vlerat negative që janë parashikuar me saktësi. Ai sugjeron që edhe vlera e klasës aktuale edhe e klasës së parashikuar janë negative.

Këto vlera - pozitivë të rremë dhe negativë të rremë - ndodhin kur klasa juaj aktuale ndryshon nga klasa e parashikuar.

tani,

Raporti i shkallës së vërtetë pozitive (TP) me të gjitha vëzhgimet e bëra në klasën aktuale quhet rikujtim, i njohur gjithashtu si ndjeshmëri.

Tërheqja është TP/(TP+FN).

Precisioni është një masë e vlerës parashikuese pozitive, e cila krahason numrin e pozitivëve që modeli parashikon me të vërtetë me sa pozitive të sakta parashikon me saktësi.

Saktësia është TP/(TP + FP)

Metrika më e lehtë e performancës për t'u kuptuar është saktësia, e cila është vetëm proporcioni i vëzhgimeve të parashikuara siç duhet me të gjitha vëzhgimet.

Saktësia është e barabartë me (TP+TN)/(TP+FP+FN+TN).

Precisioni dhe Recall peshohen dhe mesatarizohen për të siguruar rezultatin F1. Si rezultat, ky rezultat merr në konsideratë si pozitive false ashtu edhe negative të rreme.

F1 është shpesh më e vlefshme se saktësia, veçanërisht nëse keni një shpërndarje të pabarabartë të klasës, edhe nëse në mënyrë intuitive nuk është aq e thjeshtë për t'u kuptuar sa saktësia.

Saktësia më e mirë arrihet kur kostoja e pozitivëve të rremë dhe negativëve të rremë është e krahasueshme. Është e preferueshme që të përfshihen si Precisioni ashtu edhe Recall nëse kostot e lidhura me pozitivët fals dhe negativë të rremë ndryshojnë ndjeshëm.

35. Çka është saktësisht verifikimi i kryqëzuar?

Një përqasje statistikore e rikampionimit të quajtur verifikim i kryqëzuar në mësimin e makinerive përdor disa nëngrupe të dhënash për të trajnuar dhe vlerësuar një algoritëm të mësimit të makinës në një numër raundesh.

Një grup i ri i të dhënave që nuk është përdorur për të trajnuar modelin testohet duke përdorur verifikimin e kryqëzuar për të parë se sa mirë modeli e parashikon atë. Mbi përshtatja e të dhënave parandalohet përmes verifikimit të kryqëzuar.

K-Fold Metoda më e përdorur e marrjes së mostrave e ndan të gjithë grupin e të dhënave në grupe K me madhësi të barabarta. Ai quhet verifikim i kryqëzuar.

36. Le të themi se keni zbuluar se modeli juaj ka një variancë të konsiderueshme. Cili algoritëm, sipas mendimit tuaj, është më i përshtatshmi për të trajtuar këtë situatë?

Menaxhimi i ndryshueshmërisë së lartë

Ne duhet të përdorim teknikën e bagazhit për problemet me variacione të mëdha.

Kampionimi i përsëritur i të dhënave të rastësishme do të përdoret nga algoritmi i bagazhit për të ndarë të dhënat në nëngrupe. Pasi të dhënat janë ndarë, ne mund të përdorim të dhëna të rastësishme dhe një procedurë specifike trajnimi për të gjeneruar rregulla.

Pas kësaj, sondazhi mund të përdoret për të kombinuar parashikimet e modelit.

37. Çfarë e dallon regresionin Ridge nga regresioni Lasso?

Dy metoda të rregullimit të përdorura gjerësisht janë regresioni Lasso (i quajtur edhe L1) dhe Ridge (ndonjëherë i quajtur L2). Ato përdoren për të parandaluar mbivendosjen e të dhënave.

Për të zbuluar zgjidhjen më të mirë dhe për të minimizuar kompleksitetin, këto teknika përdoren për të ndëshkuar koeficientët. Duke penalizuar totalin e vlerave absolute të koeficientëve, funksionon regresioni Lasso.

Funksioni i penalltisë në regresionin Ridge ose L2 rrjedh nga shuma e katrorëve të koeficientëve.

38. Cila është më e rëndësishme: performanca e modelit apo saktësia e modelit? Cilin dhe pse do ta favorizoni?

Kjo është një pyetje mashtruese, kështu që fillimisht duhet kuptuar se çfarë është Performanca Model. Nëse performanca përcaktohet si shpejtësi, atëherë ajo mbështetet në llojin e aplikacionit; çdo aplikim që përfshin një situatë në kohë reale do të kërkonte shpejtësi të lartë si një komponent thelbësor.

Për shembull, rezultatet më të mira të kërkimit do të bëhen më pak të vlefshme nëse rezultatet e Pyetjes kërkojnë shumë kohë për të arritur.

Nëse Performanca përdoret si një justifikim se pse saktësia dhe rikujtimi duhet t'i jepet përparësi mbi saktësinë, atëherë një rezultat F1 do të jetë më i dobishëm se sa saktësia në demonstrimin e rastit të biznesit për çdo grup të dhënash që është i pabalancuar.

39. Si do ta menaxhonit një grup të dhënash me pabarazi?

Një grup të dhënash i pabalancuar mund të përfitojë nga teknikat e kampionimit. Marrja e mostrave mund të bëhet ose në mënyrë nën ose të mbikampionuar.

Nën Sampling na lejon të zvogëlojmë madhësinë e klasës së shumicës për t'u përshtatur me klasën e pakicës, gjë që ndihmon në rritjen e shpejtësisë në lidhje me ruajtjen dhe ekzekutimin e kohës së ekzekutimit, por gjithashtu mund të rezultojë në humbjen e të dhënave të vlefshme.

Për të korrigjuar çështjen e humbjes së informacionit të shkaktuar nga marrja e mostrave të tepërta, ne zgjedhim klasën e Minoritetit; megjithatë, kjo na bën të hasim në çështje të tepërta.

Strategjitë shtesë përfshijnë:

Kampionimi i bazuar në grupe - Instancat e klasës së pakicës dhe shumicës i nënshtrohen individualisht teknikës së grupimit K-means në këtë situatë. Kjo bëhet për të gjetur grupimet e të dhënave. Më pas, çdo grup merret mbi mostrën në mënyrë që të gjitha klasat të kenë të njëjtën madhësi dhe të gjitha grupimet brenda një klase të kenë një numër të barabartë instancash.
SMOTE: Teknika Sintetike e Mbi-kampionimit të Minoritetit- Një pjesë e të dhënave nga klasa e pakicës përdoret si shembull, pas së cilës krijohen shembuj artificialë shtesë që janë të krahasueshëm me të dhe shtohen në grupin e të dhënave origjinale. Kjo metodë funksionon mirë me pikat e të dhënave numerike.

40. Si mund të dalloni mes nxitjes dhe bagazhit?

Ansamble Techniques kanë versione të njohura si bagazhim dhe rritje.

Thithja-

Për algoritmet me një variacion të lartë, bagazhi është një teknikë që përdoret për të ulur variancën. Një familje e tillë e klasifikuesve që është e prirur për paragjykim është familja e pemës së vendimit.

Lloji i të dhënave mbi të cilat janë trajnuar pemët e vendimit ka një ndikim të rëndësishëm në performancën e tyre. Për shkak të kësaj, edhe me akordim shumë të lartë, përgjithësimi i rezultateve ndonjëherë është shumë më i vështirë për t'u arritur në to.

Nëse të dhënat e trajnimit të pemëve të vendimit ndryshohen, rezultatet ndryshojnë ndjeshëm.

Si pasojë, përdoret bagazhi, në të cilin krijohen shumë pemë vendimi, secila prej të cilave është trajnuar duke përdorur një mostër të të dhënave origjinale dhe rezultati përfundimtar është mesatarja e të gjitha këtyre modeleve të ndryshme.

Nxitja:

Rritja është teknika e bërjes së parashikimeve me një sistem klasifikues n-të dobët në të cilin çdo klasifikues i dobët plotëson mangësitë e klasifikuesve të tij më të fortë. Ne i referohemi një klasifikuesi që performon keq në një grup të dhënash të caktuar si një "klasifikues i dobët".

Rritja është padyshim një proces dhe jo një algoritëm. Regresioni logjistik dhe pemët e cekëta të vendimit janë shembuj të zakonshëm të klasifikuesve të dobët.

Adaboost, Gradient Boosting dhe XGBoost janë dy algoritmet më të njohura të rritjes, megjithatë, ka shumë më tepër.

41. Shpjegoni ndryshimet midis të nxënit induktiv dhe deduktiv.

Kur mëson me shembull nga një grup shembujsh të vëzhguar, një model përdor mësimin induktiv për të arritur në një përfundim të përgjithësuar. Nga ana tjetër, me mësimin deduktiv, modeli përdor rezultatin përpara se të formojë të tijën.

Të mësuarit induktiv është procesi i nxjerrjes së përfundimeve nga vëzhgimet.

Të mësuarit deduktiv është procesi i krijimit të vëzhgimeve të bazuara në përfundime.

Përfundim

Urime! Këto janë 40 pyetjet kryesore të intervistës dhe më lart për mësimin e makinerive për të cilat tani i dini përgjigjet. Shkenca e të dhënave dhe inteligjencës artificiale profesionet do të vazhdojnë të jenë të kërkuara ndërsa teknologjia përparon.

Kandidatët që përditësojnë njohuritë e tyre për këto teknologji të fundit dhe përmirësojnë grupin e aftësive të tyre, mund të gjejnë një shumëllojshmëri të gjerë mundësish punësimi me paga konkurruese.

Ju mund të vazhdoni t'u përgjigjeni intervistave tani që keni një kuptim të fortë se si t'i përgjigjeni disa prej pyetjeve të intervistës së mësimit të makinerive të bëra gjerësisht.

Në varësi të qëllimeve tuaja, ndërmerrni hapin e mëposhtëm. Përgatituni për intervista duke vizituar Hashdork's Seria e intervistave.

Pyetjet e Intervistës për Mësimin e Makinerisë

Mbi 40 pyetjet kryesore të intervistës për mësimin e makinerisë