சிறந்த 40+ இயந்திர கற்றல் நேர்காணல் கேள்விகள் (2024)

பொருளடக்கம்[மறை][காட்டு]

1. இயந்திர கற்றல், செயற்கை நுண்ணறிவு மற்றும் ஆழ்ந்த கற்றல் ஆகியவற்றுக்கு இடையே உள்ள வேறுபாடுகளை விளக்குங்கள்.
2. இயந்திர கற்றலின் பல்வேறு வகைகளை விவரிக்கவும்.
3. சார்பு மற்றும் மாறுபாடு வர்த்தகம் என்றால் என்ன?
4. இயந்திர கற்றல் வழிமுறைகள் காலப்போக்கில் கணிசமாக உருவாகியுள்ளன. கொடுக்கப்பட்ட தரவுத் தொகுப்பைப் பயன்படுத்துவதற்கான சரியான அல்காரிதத்தை ஒருவர் எவ்வாறு தேர்வு செய்வது?
5. இணைவு மற்றும் தொடர்பு எவ்வாறு வேறுபடுகிறது?
6. இயந்திர கற்றலில், கிளஸ்டரிங் என்றால் என்ன?
7. நீங்கள் விரும்பும் இயந்திர கற்றல் அல்காரிதம் என்ன?
8. இயந்திர கற்றலில் நேரியல் பின்னடைவு: அது என்ன?
9. KNN மற்றும் k-means clustering இடையே உள்ள வேறுபாடுகளை விவரிக்கவும்.
10. "தேர்வு சார்பு" என்பது உங்களுக்கு என்ன அர்த்தம்?
11. பேய்ஸ் தேற்றம் என்றால் என்ன?
12. இயந்திர கற்றல் மாதிரியில், 'பயிற்சி தொகுப்பு' மற்றும் 'சோதனை தொகுப்பு' என்றால் என்ன?
13. இயந்திர கற்றலில் கருதுகோள் என்றால் என்ன?
14. மிஷின் லேர்னிங் அதிகப்படியான பொருத்தம் என்றால் என்ன, அதை எப்படித் தடுக்கலாம்?
15. Naive Bayes வகைப்படுத்திகள் என்றால் என்ன?
16. செலவு செயல்பாடுகள் மற்றும் இழப்பு செயல்பாடுகள் என்றால் என்ன?
17. பாரபட்சமான மாதிரியிலிருந்து ஒரு உருவாக்கும் மாதிரியை வேறுபடுத்துவது எது?
18. வகை I மற்றும் வகை II பிழைகளுக்கு இடையே உள்ள மாறுபாடுகளை விவரிக்கவும்.
19. இயந்திர கற்றலில், குழும கற்றல் நுட்பம் என்ன?
20. அளவுரு மாதிரிகள் என்றால் என்ன? ஒரு உதாரணம் கொடுங்கள்.
21. கூட்டு வடிகட்டலை விவரிக்கவும். அத்துடன் உள்ளடக்க அடிப்படையிலான வடிகட்டுதல்?
22. டைம் தொடரின் மூலம் நீங்கள் சரியாக என்ன சொல்கிறீர்கள்?
23. கிரேடியன்ட் பூஸ்டிங் மற்றும் ரேண்டம் ஃபாரஸ்ட் அல்காரிதம்களுக்கு இடையே உள்ள மாறுபாடுகளை விவரிக்கவும்.
24. உங்களுக்கு ஏன் குழப்ப அணி தேவை? அது என்ன?
25. கொள்கை கூறு பகுப்பாய்வு என்றால் என்ன?
26. பிசிஏ (முதன்மை கூறு பகுப்பாய்வு) க்கு கூறு சுழற்சி ஏன் மிகவும் முக்கியமானது?
27. முறைப்படுத்துதல் மற்றும் இயல்பாக்குதல் ஆகியவை எவ்வாறு ஒன்றுக்கொன்று வேறுபடுகின்றன?
28. இயல்பாக்கம் மற்றும் தரநிலைப்படுத்தல் ஆகியவை எவ்வாறு ஒன்றுக்கொன்று வேறுபடுகின்றன?
29. "மாறுபாடு பணவீக்க காரணி" சரியாக என்ன அர்த்தம்?
30. பயிற்சித் தொகுப்பின் அளவின் அடிப்படையில், ஒரு வகைப்படுத்தியை எவ்வாறு தேர்வு செய்வது?
31. மெஷின் லேர்னிங்கில் என்ன அல்காரிதம் "சோம்பேறி கற்றவர்" என்று குறிப்பிடப்படுகிறது மற்றும் ஏன்?
32. ROC வளைவு மற்றும் AUC என்றால் என்ன?
33. உயர் அளவுருக்கள் என்றால் என்ன? மாதிரி அளவுருக்களிலிருந்து அவற்றை தனித்துவமாக்குவது எது?
34. F1 ஸ்கோர், ரீகால் மற்றும் துல்லியம் என்றால் என்ன?
35. குறுக்கு சரிபார்ப்பு என்றால் என்ன?
36. உங்கள் மாடலில் குறிப்பிடத்தக்க மாறுபாடு இருப்பதை நீங்கள் கண்டுபிடித்ததாக வைத்துக்கொள்வோம். உங்கள் கருத்துப்படி, இந்த சூழ்நிலையை கையாள மிகவும் பொருத்தமான வழிமுறை எது?
37. ரிட்ஜ் பின்னடைவை லாஸ்ஸோ பின்னடைவிலிருந்து வேறுபடுத்துவது எது?
38. எது மிகவும் முக்கியமானது: மாதிரி செயல்திறன் அல்லது மாதிரி துல்லியம்? எது, ஏன் நீங்கள் அதை விரும்புவீர்கள்?
39. ஏற்றத்தாழ்வுகளுடன் தரவுத்தொகுப்பை எவ்வாறு நிர்வகிப்பீர்கள்?
40. ஊக்குவிப்பு மற்றும் பேக்கிங் ஆகியவற்றை நீங்கள் எவ்வாறு வேறுபடுத்தி அறியலாம்?
41. தூண்டல் மற்றும் விலக்கு கற்றலுக்கு இடையே உள்ள வேறுபாடுகளை விளக்குங்கள்.
தீர்மானம்

தனிநபர்களுக்கான தகவல் மற்றும் சேவைகளின் அணுகலை அதிகரிக்க, செயற்கை நுண்ணறிவு (AI) மற்றும் இயந்திர கற்றல் போன்ற அதிநவீன தொழில்நுட்பத்தை வணிகங்கள் பயன்படுத்துகின்றன.

இந்த தொழில்நுட்பங்கள் வங்கி, நிதி, சில்லறை வணிகம், உற்பத்தி மற்றும் சுகாதாரம் உள்ளிட்ட பல்வேறு தொழில்களால் ஏற்றுக்கொள்ளப்படுகின்றன.

தரவு விஞ்ஞானிகள், செயற்கை நுண்ணறிவு பொறியாளர்கள், இயந்திர கற்றல் பொறியாளர்கள் மற்றும் தரவு ஆய்வாளர்கள் ஆகியோருக்கு AI ஐப் பயன்படுத்துவதில் மிகவும் விரும்பப்படும் நிறுவனப் பாத்திரங்களில் ஒன்றாகும்.

இந்த இடுகை உங்களை பல்வேறு வழிகளில் வழிநடத்தும் இயந்திர கற்றல் நேர்காணல் கேள்விகள், அடிப்படை முதல் சிக்கலானது வரை, உங்கள் சிறந்த வேலையைத் தேடும் போது உங்களிடம் கேட்கப்படும் எந்த கேள்விகளுக்கும் தயாராக இருக்க உதவுகிறது.

1. இயந்திர கற்றல், செயற்கை நுண்ணறிவு மற்றும் ஆழ்ந்த கற்றல் ஆகியவற்றுக்கு இடையே உள்ள வேறுபாடுகளை விளக்குங்கள்.

செயற்கை நுண்ணறிவு பல்வேறு இயந்திர கற்றல் மற்றும் ஆழமான கற்றல் அணுகுமுறைகளைப் பயன்படுத்துகிறது, இது கணினி அமைப்புகளை தர்க்கம் மற்றும் விதிகளுடன் மனிதனைப் போன்ற நுண்ணறிவைப் பயன்படுத்தி பணிகளைச் செய்ய அனுமதிக்கிறது.

இயந்திர கற்றல் பல்வேறு புள்ளிவிவரங்கள் மற்றும் ஆழமான கற்றல் அணுகுமுறைகளைப் பயன்படுத்துகிறது, இது இயந்திரங்கள் அவற்றின் முந்தைய செயல்திறனிலிருந்து கற்றுக்கொள்ளவும், மனித மேற்பார்வையின்றி சில பணிகளைச் செய்வதில் மிகவும் திறமையானவர்களாகவும் இருக்கும்.

டீப் லேர்னிங் என்பது மென்பொருளை தன்னிடமிருந்து கற்றுக்கொள்வதற்கும் குரல் மற்றும் பட அங்கீகாரம் போன்ற பல்வேறு வணிகச் செயல்பாடுகளைச் செய்வதற்கும் அனுமதிக்கும் அல்காரிதம்களின் தொகுப்பாகும்.

அவற்றின் பல அடுக்குகளை வெளிப்படுத்தும் அமைப்புகள் நரம்பியல் வலையமைப்புகள் கற்றலுக்கான பரந்த அளவிலான தரவுகள் ஆழமான கற்றலைச் செய்ய முடியும்.

2. இயந்திர கற்றலின் பல்வேறு வகைகளை விவரிக்கவும்.

இயந்திர கற்றல் மூன்று வெவ்வேறு வகைகளில் பரவலாக உள்ளது:

மேற்பார்வையிடப்பட்ட கற்றல்: மேற்பார்வையிடப்பட்ட இயந்திரக் கற்றலில் லேபிளிடப்பட்ட அல்லது வரலாற்றுத் தரவைப் பயன்படுத்தி ஒரு மாதிரி கணிப்புகள் அல்லது தீர்ப்புகளை உருவாக்குகிறது. குறியிடப்பட்ட அல்லது குறியிடப்பட்ட தரவுத் தொகுப்புகள், அவற்றின் அர்த்தத்தை அதிகரிப்பதற்காக, லேபிளிடப்பட்ட தரவு என குறிப்பிடப்படுகின்றன.
மேற்பார்வை செய்யப்படாத கற்றல்: மேற்பார்வை செய்யப்படாத கற்றலுக்கான லேபிளிடப்பட்ட தரவு எங்களிடம் இல்லை. உள்வரும் தரவுகளில், ஒரு மாதிரி வடிவங்கள், விந்தைகள் மற்றும் தொடர்புகளைக் கண்டறிய முடியும்.
வலுவூட்டல் கற்றல்: மாதிரி முடியும் வலுவூட்டலைப் பயன்படுத்தி கற்றுக்கொள்ளுங்கள் கற்றல் மற்றும் அதன் முந்தைய நடத்தைக்காக அது பெற்ற வெகுமதிகள்.

3. சார்பு மற்றும் மாறுபாடு வர்த்தகம் என்றால் என்ன?

அதிகப்படியான பொருத்தம் என்பது சார்பின் விளைவாகும், இது ஒரு மாதிரி தரவுக்கு எந்த அளவிற்கு பொருந்துகிறது. உங்களின் தவறான அல்லது மிகவும் எளிமையான அனுமானங்களால் சார்பு ஏற்படுகிறது இயந்திர கற்றல் வழிமுறை.

மாறுபாடு என்பது உங்கள் ML அல்காரிதத்தில் உள்ள சிக்கலால் ஏற்படும் தவறுகளைக் குறிக்கிறது, இது பயிற்சி தரவு மற்றும் அதிகப்படியான பொருத்துதலில் பெரிய அளவிலான மாறுபாடுகளுக்கு உணர்திறனை உருவாக்குகிறது.

மாறுபாடு என்பது உள்ளீடுகளைப் பொறுத்து ஒரு மாதிரி எவ்வளவு மாறுபடுகிறது.

வேறு வார்த்தைகளில் கூறுவதானால், அடிப்படை மாதிரிகள் மிகவும் சார்புடையவை, ஆனால் நிலையானவை (குறைந்த மாறுபாடு). சிக்கலான மாடல்களில் அதிகப்படியான பொருத்தம் ஒரு பிரச்சனையாகும், இருப்பினும் அவை மாதிரியின் யதார்த்தத்தை (குறைந்த சார்பு) கைப்பற்றுகின்றன.

உயர் மாறுபாடு மற்றும் உயர் சார்பு இரண்டையும் தடுக்க, சிறந்த பிழைக் குறைப்புக்கு சார்பு மற்றும் மாறுபாட்டிற்கு இடையேயான வர்த்தகம் அவசியம்.

4. இயந்திர கற்றல் வழிமுறைகள் காலப்போக்கில் கணிசமாக உருவாகியுள்ளன. கொடுக்கப்பட்ட தரவுத் தொகுப்பைப் பயன்படுத்துவதற்கான சரியான அல்காரிதத்தை ஒருவர் எவ்வாறு தேர்வு செய்வது?

பயன்படுத்தப்பட வேண்டிய இயந்திர கற்றல் நுட்பம் ஒரு குறிப்பிட்ட தரவுத்தொகுப்பில் உள்ள தரவை மட்டுமே சார்ந்துள்ளது.

தரவு நேரியல் போது, நேரியல் பின்னடைவு பயன்படுத்தப்படுகிறது. தரவு நேரியல் அல்லாததைக் குறிக்கும் பட்சத்தில் பேக்கிங் முறை சிறப்பாகச் செயல்படும். வணிக நோக்கங்களுக்காக தரவு மதிப்பீடு செய்யப்பட வேண்டும் அல்லது விளக்கப்பட வேண்டும் என்றால், முடிவு மரங்கள் அல்லது SVM ஐப் பயன்படுத்தலாம்.

தரவுத்தொகுப்பில் புகைப்படங்கள், வீடியோக்கள் மற்றும் ஆடியோ இருந்தால் துல்லியமான பதிலைப் பெற நரம்பியல் நெட்வொர்க்குகள் பயனுள்ளதாக இருக்கும்.

ஒரு குறிப்பிட்ட சூழ்நிலைக்கான அல்காரிதம் தேர்வு அல்லது தரவு சேகரிப்பு என்பது ஒரு அளவீட்டில் மட்டும் செய்ய முடியாது.

சிறந்த பொருத்தம் முறையை உருவாக்கும் நோக்கத்திற்காக, நாம் முதலில் ஆய்வு தரவு பகுப்பாய்வு (EDA) ஐப் பயன்படுத்தி தரவை ஆய்வு செய்ய வேண்டும் மற்றும் தரவுத்தொகுப்பைப் பயன்படுத்துவதன் இலக்கைப் புரிந்துகொள்ள வேண்டும்.

5. இணைவு மற்றும் தொடர்பு எவ்வாறு வேறுபடுகிறது?

இரண்டு மாறிகள் எவ்வாறு ஒன்றோடொன்று இணைக்கப்பட்டுள்ளன என்பதையும் மற்றொன்றில் ஏற்படும் மாற்றங்களுக்கு பதிலளிக்கும் வகையில் ஒன்று எவ்வாறு மாறக்கூடும் என்பதையும் கோவாரியன்ஸ் மதிப்பிடுகிறது.

முடிவு நேர்மறையாக இருந்தால், மாறிகளுக்கு இடையே ஒரு நேரடி இணைப்பு இருப்பதையும், அடிப்படை மாறியின் அதிகரிப்பு அல்லது குறைவுடன் ஒன்று உயரும் அல்லது குறையும் என்பதைக் குறிக்கிறது, மற்ற எல்லா நிலைகளும் மாறாமல் இருக்கும்.

தொடர்பு இரண்டு சீரற்ற மாறிகளுக்கு இடையிலான இணைப்பை அளவிடுகிறது மற்றும் மூன்று தனித்துவமான மதிப்புகளை மட்டுமே கொண்டுள்ளது: 1, 0 மற்றும் -1.

6. இயந்திர கற்றலில், கிளஸ்டரிங் என்றால் என்ன?

தரவுகளை ஒன்றாக இணைக்கும் மேற்பார்வை செய்யப்படாத கற்றல் முறைகள் கிளஸ்டரிங் எனப்படும். தரவு புள்ளிகளின் தொகுப்புடன், கிளஸ்டரிங் நுட்பத்தைப் பயன்படுத்தலாம்.

இந்த மூலோபாயத்தைப் பயன்படுத்தி அனைத்து தரவு புள்ளிகளையும் அவற்றின் செயல்பாடுகளுக்கு ஏற்ப நீங்கள் தொகுக்கலாம்.

ஒரே வகைக்குள் வரும் தரவுப் புள்ளிகளின் அம்சங்கள் மற்றும் குணங்கள் ஒரே மாதிரியானவை, அதே சமயம் தனித்தனி குழுக்களில் வரும் தரவுப் புள்ளிகள் வேறுபட்டவை.

புள்ளிவிவரத் தரவை பகுப்பாய்வு செய்ய இந்த அணுகுமுறை பயன்படுத்தப்படலாம்.

7. நீங்கள் விரும்பும் இயந்திர கற்றல் அல்காரிதம் என்ன?

இந்தக் கேள்வியில் உங்களின் விருப்பங்களையும், தனித்துவமான திறமைகளையும், பல இயந்திரக் கற்றல் நுட்பங்களைப் பற்றிய உங்கள் விரிவான அறிவையும் நிரூபிக்க உங்களுக்கு வாய்ப்பு உள்ளது.

சிந்திக்க சில பொதுவான இயந்திர கற்றல் வழிமுறைகள் இங்கே:

நேரியல் பின்னடைவு
லாஜிஸ்டிக் பின்னடைவு
நேவ் பேய்ஸ்
முடிவு மரங்கள்
கே என்றால்
ரேண்டம் ஃபாரஸ்ட் அல்காரிதம்
கே-அருகிலுள்ள அண்டை நாடு (KNN)

8. இயந்திர கற்றலில் நேரியல் பின்னடைவு: அது என்ன?

மேற்பார்வையிடப்பட்ட இயந்திர கற்றல் அல்காரிதம் நேரியல் பின்னடைவு ஆகும்.

சார்பு மற்றும் சார்பற்ற மாறிகளுக்கு இடையே உள்ள நேரியல் தொடர்பைத் தீர்மானிக்க இது முன்கணிப்பு பகுப்பாய்வில் பயன்படுத்தப்படுகிறது.

நேரியல் பின்னடைவின் சமன்பாடு பின்வருமாறு:

Y = A + BX

எங்கே:

உள்ளீடு அல்லது சுயாதீன மாறி X எனப்படும்.
சார்பு அல்லது வெளியீடு மாறி Y ஆகும்.
X இன் குணகம் b, மற்றும் அதன் குறுக்கீடு a.

9. KNN மற்றும் k-means clustering இடையே உள்ள வேறுபாடுகளை விவரிக்கவும்.

முதன்மையான வேறுபாடு என்னவென்றால், KNN (ஒரு வகைப்பாடு முறை, மேற்பார்வையிடப்பட்ட கற்றல்) லேபிளிடப்பட்ட புள்ளிகள் தேவை, ஆனால் k- என்றால் இல்லை (கிளஸ்டரிங் அல்காரிதம், மேற்பார்வை செய்யப்படாத கற்றல்).

K-Nearest Neighbours ஐப் பயன்படுத்தி லேபிளிடப்பட்ட தரவை லேபிளிடப்படாத புள்ளியாக வகைப்படுத்தலாம். K- என்றால் க்ளஸ்டரிங் என்பது லேபிளிடப்படாத புள்ளிகளை எவ்வாறு குழுவாக்குவது என்பதை அறிய புள்ளிகளுக்கு இடையிலான சராசரி தூரத்தைப் பயன்படுத்துகிறது.

10. "தேர்வு சார்பு" என்பது உங்களுக்கு என்ன அர்த்தம்?

ஒரு பரிசோதனையின் மாதிரி கட்டத்தில் சார்பு புள்ளியியல் துல்லியமின்மை காரணமாக உள்ளது.

சோதனையில் உள்ள மற்ற குழுக்களை விட ஒரு மாதிரி குழு துல்லியமின்மையின் விளைவாக அடிக்கடி தேர்ந்தெடுக்கப்படுகிறது.

தேர்வு சார்பு அங்கீகரிக்கப்படாவிட்டால், அது தவறான முடிவுக்கு வழிவகுக்கும்.

11. பேய்ஸ் தேற்றம் என்றால் என்ன?

பிற நிகழ்தகவுகளை நாம் அறிந்திருக்கும்போது, பேய்ஸ் தேற்றத்தைப் பயன்படுத்தி நிகழ்தகவைத் தீர்மானிக்கலாம். இது வேறுவிதமாகக் கூறினால், முந்தைய தகவலின் அடிப்படையில் நிகழ்வின் பின்பகுதி நிகழ்தகவை வழங்குகிறது.

நிபந்தனை நிகழ்தகவுகளை மதிப்பிடுவதற்கான ஒரு ஒலி முறை இந்த தேற்றத்தால் வழங்கப்படுகிறது.

வகைப்பாடு முன்கணிப்பு மாடலிங் சிக்கல்களை உருவாக்குதல் மற்றும் ஒரு பயிற்சிக்கு ஒரு மாதிரியைப் பொருத்துதல் இயந்திர கற்றலில் தரவுத்தொகுப்பு, பேய்ஸின் தேற்றம் பயன்படுத்தப்படுகிறது (அதாவது நைவ் பேய்ஸ், பேய்ஸ் ஆப்டிமல் கிளாசிஃபையர்).

12. இயந்திர கற்றல் மாதிரியில், 'பயிற்சி தொகுப்பு' மற்றும் 'சோதனை தொகுப்பு' என்றால் என்ன?

பயிற்சி தொகுப்பு:

பயிற்சி தொகுப்பு பகுப்பாய்வு மற்றும் கற்றலுக்காக மாதிரிக்கு அனுப்பப்படும் நிகழ்வுகளைக் கொண்டுள்ளது.
இது மாதிரியைப் பயிற்றுவிக்கப் பயன்படுத்தப்படும் லேபிளிடப்பட்ட தரவு.
பொதுவாக, மொத்த தரவுகளில் 70% பயிற்சி தரவுத்தொகுப்பாக பயன்படுத்தப்படுகிறது.

சோதனைத் தொகுப்பு:

மாதிரியின் கருதுகோள் உருவாக்கத்தின் துல்லியத்தை மதிப்பிடுவதற்கு சோதனைத் தொகுப்பு பயன்படுத்தப்படுகிறது.
லேபிளிடப்பட்ட தரவு இல்லாமல் நாங்கள் சோதனை செய்கிறோம், பின்னர் முடிவுகளை உறுதிப்படுத்த லேபிள்களைப் பயன்படுத்துகிறோம்.
மீதமுள்ள 30% சோதனை தரவுத்தொகுப்பாக பயன்படுத்தப்படுகிறது.

13. இயந்திர கற்றலில் கருதுகோள் என்றால் என்ன?

இயந்திர கற்றல், உள்ளீட்டை வெளியீட்டுடன் இணைக்கும் கொடுக்கப்பட்ட செயல்பாட்டை நன்கு புரிந்துகொள்ள, ஏற்கனவே உள்ள தரவுத்தொகுப்புகளைப் பயன்படுத்துவதை செயல்படுத்துகிறது. இது செயல்பாடு தோராயமாக அறியப்படுகிறது.

இந்தச் சந்தர்ப்பத்தில், கொடுக்கப்பட்ட சூழ்நிலையின் அடிப்படையில் கற்பனை செய்யக்கூடிய அனைத்து அவதானிப்புகளையும் சிறந்த முறையில் மாற்றுவதற்கு, அறியப்படாத இலக்குச் செயல்பாட்டிற்கு தோராயமாகப் பயன்படுத்தப்பட வேண்டும்.

இயந்திரக் கற்றலில், கருதுகோள் என்பது இலக்கு செயல்பாட்டை மதிப்பிடுவதற்கும் பொருத்தமான உள்ளீடு-க்கு-வெளியீடு மேப்பிங்கை முடிப்பதற்கும் உதவும் ஒரு மாதிரியாகும்.

அல்காரிதம்களின் தேர்வு மற்றும் வடிவமைப்பு ஒரு மாதிரியால் குறிப்பிடப்படும் சாத்தியமான கருதுகோள்களின் இடத்தை வரையறுக்க அனுமதிக்கிறது.

ஒரு ஒற்றை கருதுகோளுக்கு, சிற்றெழுத்து h (h) பயன்படுத்தப்படுகிறது, ஆனால் தேடப்படும் முழு கருதுகோள் இடத்திற்கும் மூலதன h (H) பயன்படுத்தப்படுகிறது. இந்த குறிப்புகளை சுருக்கமாக மதிப்பாய்வு செய்வோம்:

ஒரு கருதுகோள் (h) என்பது ஒரு குறிப்பிட்ட மாதிரியாகும், இது வெளியீட்டிற்கு உள்ளீட்டின் வரைபடத்தை எளிதாக்குகிறது, இது பின்னர் மதிப்பீடு மற்றும் கணிப்புக்கு பயன்படுத்தப்படலாம்.
கருதுகோள் தொகுப்பு (H) என்பது கருதுகோள்களின் தேடக்கூடிய இடமாகும், இது வெளியீடுகளுக்கு உள்ளீடுகளை வரைபடமாக்க பயன்படுகிறது. இஷ்யூ ஃப்ரேமிங், மாடல் மற்றும் மாடல் உள்ளமைவு ஆகியவை பொதுவான வரம்புகளுக்கு சில எடுத்துக்காட்டுகள்.

14. மிஷின் லேர்னிங் அதிகப்படியான பொருத்தம் என்றால் என்ன, அதை எப்படித் தடுக்கலாம்?

ஒரு இயந்திரம் போதுமான தரவுத்தொகுப்பில் இருந்து கற்றுக்கொள்ள முயலும் போது, அதிகப்படியான பொருத்தம் ஏற்படுகிறது.

இதன் விளைவாக, அதிகப்படியான பொருத்தம் தரவு அளவோடு நேர்மாறாக தொடர்புடையது. குறுக்கு-சரிபார்ப்பு அணுகுமுறை சிறிய தரவுத்தொகுப்புகளுக்கு அதிகப்படியான பொருத்தத்தைத் தவிர்க்க அனுமதிக்கிறது. இந்த முறையில் ஒரு தரவுத்தொகுப்பு இரண்டு பகுதிகளாக பிரிக்கப்பட்டுள்ளது.

சோதனை மற்றும் பயிற்சிக்கான தரவுத்தொகுப்பு இந்த இரண்டு பகுதிகளைக் கொண்டிருக்கும். பயிற்சி தரவுத்தொகுப்பு ஒரு மாதிரியை உருவாக்கப் பயன்படுகிறது, அதே சமயம் சோதனை தரவுத்தொகுப்பு வெவ்வேறு உள்ளீடுகளைப் பயன்படுத்தி மாதிரியை மதிப்பிடுவதற்குப் பயன்படுத்தப்படுகிறது.

அதிகப்படியான பொருத்தத்தைத் தடுப்பது இதுதான்.

15. Naive Bayes வகைப்படுத்திகள் என்றால் என்ன?

பல்வேறு வகைப்பாடு முறைகள் Naive Bayes வகைப்படுத்திகளை உருவாக்குகின்றன. இந்த வகைப்படுத்திகள் எனப்படும் அல்காரிதம்களின் தொகுப்பு அனைத்தும் ஒரே அடிப்படை யோசனையில் செயல்படுகின்றன.

ஒரு அம்சத்தின் இருப்பு அல்லது இல்லாமை மற்றொரு அம்சத்தின் இருப்பு அல்லது இல்லாமைக்கு எந்தத் தாக்கத்தையும் ஏற்படுத்தாது என்பது அப்பாவி பேய்ஸ் வகைப்படுத்துபவர்களால் செய்யப்பட்ட அனுமானம்.

வேறு வார்த்தைகளில் கூறுவதானால், ஒவ்வொரு தரவுத்தொகுப்பு பண்பும் சமமான முக்கியத்துவம் வாய்ந்தது மற்றும் சுயாதீனமானது என்ற அனுமானத்தை உருவாக்குவதால், இதைத்தான் "அப்பாவி" என்று குறிப்பிடுகிறோம்.

அப்பாவியான பேய்ஸ் வகைப்படுத்திகளைப் பயன்படுத்தி வகைப்படுத்தல் செய்யப்படுகிறது. சுதந்திர முன்கணிப்பு உண்மையாக இருக்கும் போது மிகவும் சிக்கலான முன்கணிப்பாளர்களைக் காட்டிலும் அவை பயன்படுத்த எளிதானவை மற்றும் சிறந்த முடிவுகளை உருவாக்குகின்றன.

உரை பகுப்பாய்வு, ஸ்பேம் வடிகட்டுதல் மற்றும் பரிந்துரை அமைப்புகளில், அவை பயன்படுத்தப்படுகின்றன.

16. செலவு செயல்பாடுகள் மற்றும் இழப்பு செயல்பாடுகள் என்றால் என்ன?

"இழப்பு செயல்பாடு" என்ற சொற்றொடர், ஒரு தரவு மட்டுமே கணக்கில் எடுத்துக்கொள்ளப்படும்போது இழப்பைக் கணக்கிடும் செயல்முறையைக் குறிக்கிறது.

மாறாக, பல தரவுகளுக்கான மொத்த தவறுகளின் அளவைத் தீர்மானிக்க, செலவுச் செயல்பாட்டைப் பயன்படுத்துகிறோம். குறிப்பிடத்தக்க வேறுபாடு எதுவும் இல்லை.

வேறு வார்த்தைகளில் கூறுவதானால், செலவு செயல்பாடுகள் முழு பயிற்சி தரவுத்தொகுப்பிற்கான வேறுபாட்டை ஒருங்கிணைக்கிறது, இழப்பு செயல்பாடுகள் ஒரு பதிவுக்கான உண்மையான மற்றும் கணிக்கப்பட்ட மதிப்புகளுக்கு இடையிலான வேறுபாட்டைப் பிடிக்க வடிவமைக்கப்பட்டுள்ளன.

17. பாரபட்சமான மாதிரியிலிருந்து ஒரு உருவாக்கும் மாதிரியை வேறுபடுத்துவது எது?

ஒரு பாரபட்சமான மாதிரி பல தரவு வகைகளுக்கு இடையிலான வேறுபாடுகளைக் கற்றுக்கொள்கிறது. ஒரு உருவாக்கும் மாதிரியானது வெவ்வேறு தரவு வகைகளை எடுக்கிறது.

வகைப்பாடு சிக்கல்களில், பாரபட்சமான மாதிரிகள் பெரும்பாலும் மற்ற மாதிரிகளை விட சிறப்பாக செயல்படுகின்றன.

18. வகை I மற்றும் வகை II பிழைகளுக்கு இடையே உள்ள மாறுபாடுகளை விவரிக்கவும்.

தவறான நேர்மறைகள் வகை I பிழைகள் வகையின் கீழ் வரும், அதேசமயம் தவறான எதிர்மறைகள் வகை II பிழைகளின் கீழ் செல்லும் (உண்மையில் எதுவும் நடக்கவில்லை எனக் கூறுவது).

19. இயந்திர கற்றலில், குழும கற்றல் நுட்பம் என்ன?

குழும கற்றல் என்று அழைக்கப்படும் ஒரு நுட்பம் பல இயந்திர கற்றல் மாதிரிகளை கலந்து அதிக சக்திவாய்ந்த மாதிரிகளை உருவாக்குகிறது.

ஒரு மாதிரி பல்வேறு காரணங்களுக்காக மாறுபடும். பல காரணங்கள்:

பல்வேறு மக்கள் தொகை
பல்வேறு கருதுகோள்கள்
பல்வேறு மாடலிங் முறைகள்

மாதிரியின் பயிற்சி மற்றும் சோதனைத் தரவைப் பயன்படுத்தும் போது ஒரு சிக்கலைச் சந்திப்போம். சார்பு, மாறுபாடு மற்றும் குறைக்க முடியாத பிழை ஆகியவை இந்த தவறின் சாத்தியமான வகைகளாகும்.

இப்போது, மாதிரியின் சார்பு மற்றும் மாறுபாட்டிற்கு இடையிலான இந்த சமநிலையை ஒரு சார்பு-மாறுபாடு வர்த்தகம் என்று அழைக்கிறோம், அது எப்போதும் இருக்க வேண்டும். குழுமக் கற்றலைப் பயன்படுத்துவதன் மூலம் இந்த வர்த்தகம் நிறைவேற்றப்படுகிறது.

பல்வேறு குழும அணுகுமுறைகள் இருந்தாலும், பல மாதிரிகளை இணைப்பதற்கு இரண்டு பொதுவான உத்திகள் உள்ளன:

பேக்கிங் எனப்படும் ஒரு சொந்த அணுகுமுறை கூடுதல் பயிற்சித் தொகுப்புகளை உருவாக்க பயிற்சித் தொகுப்பைப் பயன்படுத்துகிறது.
பூஸ்டிங், ஒரு அதிநவீன நுட்பம்: பேக்கிங் போன்றது, ஒரு பயிற்சித் தொகுப்பிற்கான சிறந்த வெயிட்டிங் ஃபார்முலாவைக் கண்டறிய பூஸ்டிங் பயன்படுத்தப்படுகிறது.

20. அளவுரு மாதிரிகள் என்றால் என்ன? ஒரு உதாரணம் கொடுங்கள்.

அளவுரு மாதிரிகளில் ஒரு குறிப்பிட்ட அளவு அளவுருக்கள் உள்ளன. தரவைக் கணிக்க, நீங்கள் தெரிந்து கொள்ள வேண்டியது மாதிரியின் அளவுருக்கள் மட்டுமே.

பின்வரும் பொதுவான எடுத்துக்காட்டுகள்: லாஜிஸ்டிக் பின்னடைவு, நேரியல் பின்னடைவு மற்றும் நேரியல் SVMகள். அளவுரு அல்லாத மாதிரிகள் நெகிழ்வானவை, ஏனெனில் அவை வரம்பற்ற அளவுருக்களைக் கொண்டிருக்கலாம்.

மாதிரியின் அளவுருக்கள் மற்றும் கவனிக்கப்பட்ட தரவின் நிலை ஆகியவை தரவு கணிப்புகளுக்குத் தேவை. சில பொதுவான எடுத்துக்காட்டுகள் இங்கே: தலைப்பு மாதிரிகள், முடிவு மரங்கள் மற்றும் k-அருகிலுள்ள அண்டை நாடுகள்.

21. கூட்டு வடிகட்டலை விவரிக்கவும். அத்துடன் உள்ளடக்க அடிப்படையிலான வடிகட்டுதல்?

வடிவமைக்கப்பட்ட உள்ளடக்க பரிந்துரைகளை உருவாக்குவதற்கான முயற்சித்த மற்றும் உண்மையான முறை கூட்டு வடிகட்டுதல் ஆகும்.

கூட்டு வடிகட்டுதல் எனப்படும் சிபாரிசு அமைப்பு முறையானது, பகிரப்பட்ட ஆர்வங்களுடன் பயனர் விருப்பங்களை சமநிலைப்படுத்துவதன் மூலம் புதிய உள்ளடக்கத்தை முன்னறிவிக்கிறது.

உள்ளடக்க அடிப்படையிலான பரிந்துரை அமைப்புகள் கருத்தில் கொள்ளும் ஒரே விஷயம் பயனர் விருப்பத்தேர்வுகள். பயனரின் முந்தைய தேர்வுகளின் வெளிச்சத்தில், தொடர்புடைய உள்ளடக்கத்திலிருந்து புதிய பரிந்துரைகள் வழங்கப்படுகின்றன.

22. டைம் தொடரின் மூலம் நீங்கள் சரியாக என்ன சொல்கிறீர்கள்?

நேரத் தொடர் என்பது ஏறுவரிசையில் உள்ள எண்களின் தொகுப்பாகும். முன்னரே தீர்மானிக்கப்பட்ட காலப்பகுதியில், இது தேர்ந்தெடுக்கப்பட்ட தரவு புள்ளிகளின் இயக்கத்தை கண்காணிக்கிறது மற்றும் தரவு புள்ளிகளை அவ்வப்போது கைப்பற்றுகிறது.

நேரத் தொடருக்கு குறைந்தபட்ச அல்லது அதிகபட்ச நேர உள்ளீடு எதுவும் இல்லை.

தங்களின் தனிப்பட்ட தேவைகளுக்கு ஏற்ப தரவை பகுப்பாய்வு செய்ய நேரத் தொடர்கள் ஆய்வாளர்களால் அடிக்கடி பயன்படுத்தப்படுகின்றன.

23. கிரேடியன்ட் பூஸ்டிங் மற்றும் ரேண்டம் ஃபாரஸ்ட் அல்காரிதம்களுக்கு இடையே உள்ள மாறுபாடுகளை விவரிக்கவும்.

சீரற்ற காடு:

அதிக எண்ணிக்கையிலான முடிவு மரங்கள் முடிவில் ஒன்றாகக் குவிக்கப்பட்டு அவை சீரற்ற காடுகள் என்று அழைக்கப்படுகின்றன.
சாய்வு அதிகரிப்பு ஒவ்வொரு மரத்தையும் மற்றவற்றிலிருந்து சுயாதீனமாக உற்பத்தி செய்யும் போது, சீரற்ற காடு ஒவ்வொரு மரத்தையும் ஒரு நேரத்தில் உருவாக்குகிறது.
மல்டிகிளாஸ் பொருள் கண்டறிதல் சீரற்ற காடுகளுடன் நன்றாக வேலை செய்கிறது.

சாய்வு அதிகரிப்பு:

செயல்பாட்டின் முடிவில் ரேண்டம் காடுகள் முடிவெடுக்கும் மரங்களில் சேரும் போது, கிரேடியன்ட் பூஸ்டிங் மெஷின்கள் ஆரம்பத்தில் இருந்தே அவற்றை இணைக்கின்றன.
அளவுருக்கள் சரியான முறையில் சரிசெய்யப்பட்டால், கிரேடியன்ட் அதிகரிப்பு முடிவுகளின் அடிப்படையில் சீரற்ற காடுகளை மிஞ்சும், ஆனால் தரவுத் தொகுப்பில் நிறைய வெளிப்புறங்கள், முரண்பாடுகள் அல்லது சத்தம் இருந்தால் அது ஒரு சிறந்த தேர்வாக இருக்காது, ஏனெனில் இது மாதிரியை மிகைப்படுத்தலாம்.
சமச்சீரற்ற தரவு இருக்கும்போது, நிகழ்நேர இடர் மதிப்பீட்டில் உள்ளது போல், சாய்வு அதிகரிப்பு சிறப்பாக செயல்படுகிறது.

24. உங்களுக்கு ஏன் குழப்ப அணி தேவை? அது என்ன?

குழப்ப அணி எனப்படும் அட்டவணை, சில சமயங்களில் பிழை அணி என அழைக்கப்படுகிறது, உண்மையான மதிப்புகள் அறியப்பட்ட சோதனைத் தரவுகளின் தொகுப்பில் ஒரு வகைப்பாடு மாதிரி அல்லது வகைப்படுத்தி எவ்வளவு சிறப்பாக செயல்படுகிறது என்பதைக் காட்ட பரவலாகப் பயன்படுத்தப்படுகிறது.

ஒரு மாதிரி அல்லது அல்காரிதம் எவ்வாறு செயல்படுகிறது என்பதைப் பார்க்க இது நமக்கு உதவுகிறது. பல்வேறு படிப்புகளில் தவறான புரிதல்களைக் கண்டறிவதை இது எளிதாக்குகிறது.

ஒரு மாதிரி அல்லது அல்காரிதம் எவ்வளவு சிறப்பாகச் செய்யப்படுகிறது என்பதை மதிப்பிடுவதற்கான ஒரு வழியாக இது செயல்படுகிறது.

ஒரு வகைப்பாடு மாதிரியின் கணிப்புகள் ஒரு குழப்ப மேட்ரிக்ஸில் தொகுக்கப்படுகின்றன. ஒவ்வொரு வகுப்பு லேபிளின் எண்ணிக்கை மதிப்புகளும் சரியான மற்றும் தவறான கணிப்புகளின் மொத்த எண்ணிக்கையை உடைக்கப் பயன்படுத்தப்பட்டன.

இது வகைப்படுத்தி செய்த தவறுகள் மற்றும் வகைப்படுத்திகளால் ஏற்படும் பல்வேறு வகையான பிழைகள் பற்றிய விவரங்களை வழங்குகிறது.

25. கொள்கை கூறு பகுப்பாய்வு என்றால் என்ன?

ஒன்றோடொன்று தொடர்புடைய மாறிகளின் எண்ணிக்கையைக் குறைப்பதன் மூலம், தரவு சேகரிப்பின் பரிமாணத்தைக் குறைப்பதே குறிக்கோள். ஆனால் பன்முகத்தன்மையை முடிந்தவரை வைத்திருப்பது முக்கியம்.

மாறிகள் முதன்மை கூறுகள் எனப்படும் முற்றிலும் புதிய மாறிகளின் தொகுப்பாக மாற்றப்படுகின்றன.

இந்த பிசிக்கள் கோவாரியன்ஸ் மேட்ரிக்ஸின் ஈஜென்வெக்டர்கள் என்பதால் அவை ஆர்த்தோகனல் ஆகும்.

26. பிசிஏ (முதன்மை கூறு பகுப்பாய்வு) க்கு கூறு சுழற்சி ஏன் மிகவும் முக்கியமானது?

பிசிஏவில் சுழற்சி முக்கியமானது, ஏனெனில் இது ஒவ்வொரு கூறுகளாலும் பெறப்பட்ட மாறுபாடுகளுக்கு இடையேயான பிரிவை மேம்படுத்துகிறது, இது கூறுகளின் விளக்கத்தை எளிதாக்குகிறது.

கூறுகள் சுழற்றப்படாவிட்டால், கூறு மாறுபாட்டை வெளிப்படுத்த எங்களுக்கு நீட்டிக்கப்பட்ட கூறுகள் தேவை.

27. முறைப்படுத்துதல் மற்றும் இயல்பாக்குதல் ஆகியவை எவ்வாறு ஒன்றுக்கொன்று வேறுபடுகின்றன?

இயல்பாக்க:

இயல்பாக்கத்தின் போது தரவு மாற்றப்படுகிறது. குறிப்பாக குறைந்த அளவிலிருந்து அதிக அளவில் வேறுபட்ட அளவுகோல்கள் இருந்தால் தரவை இயல்பாக்க வேண்டும். அடிப்படை புள்ளிவிவரங்கள் அனைத்தும் இணக்கமாக இருக்கும்படி ஒவ்வொரு நெடுவரிசையையும் சரிசெய்யவும்.

துல்லியமான இழப்பு இல்லை என்பதை உறுதிப்படுத்த, இது பயனுள்ளதாக இருக்கும். இரைச்சலைப் புறக்கணிக்கும்போது சிக்னலைக் கண்டறிவது மாதிரிப் பயிற்சியின் நோக்கங்களில் ஒன்றாகும்.

பிழையைக் குறைக்க மாடலுக்கு முழுமையான கட்டுப்பாட்டைக் கொடுத்தால் ஓவர்ஃபிட் ஆக வாய்ப்பு உள்ளது.

முறைப்படுத்தல்:

முறைப்படுத்தலில், முன்கணிப்பு செயல்பாடு மாற்றியமைக்கப்படுகிறது. இது முறைப்படுத்தல் மூலம் சில கட்டுப்பாடுகளுக்கு உட்பட்டது, இது சிக்கலானவற்றை விட எளிமையான பொருத்துதல் செயல்பாடுகளை ஆதரிக்கிறது.

28. இயல்பாக்கம் மற்றும் தரநிலைப்படுத்தல் ஆகியவை எவ்வாறு ஒன்றுக்கொன்று வேறுபடுகின்றன?

அம்சம் அளவிடுதலுக்கு மிகவும் பரவலாகப் பயன்படுத்தப்படும் இரண்டு நுட்பங்கள் இயல்பாக்கம் மற்றும் தரப்படுத்தல் ஆகும்.

இயல்பாக்க:

[0,1] வரம்பிற்கு ஏற்ப தரவை மறுஅளவிடுவது இயல்பாக்கம் எனப்படும்.
எல்லா அளவுருக்களும் ஒரே நேர்மறை அளவைக் கொண்டிருக்க வேண்டும் என்றால், இயல்பாக்கம் உதவியாக இருக்கும், ஆனால் தரவுத் தொகுப்பின் வெளிப்புறங்கள் இழக்கப்படும்.

முறைப்படுத்தல்:

தரநிலைப்படுத்தல் செயல்முறையின் (அலகு மாறுபாடு) ஒரு பகுதியாக 0 இன் சராசரி மற்றும் 1 இன் நிலையான விலகலைக் கொண்ட தரவு மறுஅளவிடப்பட்டது.

29. "மாறுபாடு பணவீக்க காரணி" சரியாக என்ன அர்த்தம்?

ஒரே ஒரு சார்பற்ற மாறி கொண்ட மாதிரியின் மாறுபாட்டிற்கும் மாதிரியின் மாறுபாட்டிற்கும் உள்ள விகிதம் மாறுபாடு பணவீக்க காரணி (VIF) என அழைக்கப்படுகிறது.

பல பின்னடைவு மாறிகளின் தொகுப்பில் இருக்கும் மல்டிகோலினியரிட்டியின் அளவை VIF மதிப்பிடுகிறது.

ஒரு சுயாதீன மாறி மாறுபாடு கொண்ட மாதிரியின் மாறுபாடு (VIF) மாதிரி

30. பயிற்சித் தொகுப்பின் அளவின் அடிப்படையில், ஒரு வகைப்படுத்தியை எவ்வாறு தேர்வு செய்வது?

ஒரு உயர் சார்பு, குறைந்த மாறுபாடு மாதிரியானது ஒரு குறுகிய பயிற்சித் தொகுப்பில் சிறப்பாகச் செயல்படுகிறது, ஏனெனில் அதிகப்படியான பொருத்தம் குறைவாக இருக்கும். Naive Bayes ஒரு உதாரணம்.

ஒரு பெரிய பயிற்சித் தொகுப்பிற்கு மிகவும் சிக்கலான இடைவினைகளை பிரதிநிதித்துவப்படுத்த, குறைந்த சார்பு மற்றும் அதிக மாறுபாடு கொண்ட மாதிரி விரும்பத்தக்கது. லாஜிஸ்டிக் பின்னடைவு ஒரு நல்ல உதாரணம்.

31. மெஷின் லேர்னிங்கில் என்ன அல்காரிதம் "சோம்பேறி கற்றவர்" என்று குறிப்பிடப்படுகிறது மற்றும் ஏன்?

ஒரு மந்தமான கற்றல், KNN ஒரு இயந்திர கற்றல் அல்காரிதம் ஆகும். K-NN ஆனது ஒவ்வொரு முறையும் எந்த இயந்திரம் கற்ற மதிப்புகள் அல்லது மாறிகளை பயிற்சி தரவிலிருந்து கற்றுக்கொள்வதற்கு பதிலாக வகைப்படுத்த விரும்பும் தூரத்தை மாறும் வகையில் கணக்கிடுகிறது, அது பயிற்சி தரவுத்தொகுப்பை மனப்பாடம் செய்கிறது.

இது K-NN ஐ சோம்பேறியாக கற்கும் நபராக மாற்றுகிறது.

32. ROC வளைவு மற்றும் AUC என்றால் என்ன?

அனைத்து வரம்புகளிலும் ஒரு வகைப்பாடு மாதிரியின் செயல்திறன் ROC வளைவால் வரைபடமாக குறிப்பிடப்படுகிறது. இது உண்மையான நேர்மறை விகிதம் மற்றும் தவறான நேர்மறை விகித அளவுகோல்களைக் கொண்டுள்ளது.

எளிமையாகச் சொன்னால், ROC வளைவின் கீழ் உள்ள பகுதி AUC (ஆர்ஓசி வளைவின் கீழ் பகுதி) என அழைக்கப்படுகிறது. ROC வளைவின் இரு பரிமாண பகுதி (0,0) முதல் AUC வரை அளவிடப்படுகிறது (1,1). பைனரி வகைப்பாடு மாதிரிகளை மதிப்பிடுவதற்கு, இது செயல்திறன் புள்ளிவிவரமாகப் பயன்படுத்தப்படுகிறது.

33. உயர் அளவுருக்கள் என்றால் என்ன? மாதிரி அளவுருக்களிலிருந்து அவற்றை தனித்துவமாக்குவது எது?

மாதிரியின் உள் மாறி ஒரு மாதிரி அளவுரு என அழைக்கப்படுகிறது. பயிற்சி தரவைப் பயன்படுத்தி, ஒரு அளவுருவின் மதிப்பு தோராயமாக மதிப்பிடப்படுகிறது.

மாதிரி தெரியவில்லை, ஹைப்பர் பாராமீட்டர் என்பது ஒரு மாறி. தரவிலிருந்து மதிப்பைத் தீர்மானிக்க முடியாது, எனவே அவை மாதிரி அளவுருக்களைக் கணக்கிட அடிக்கடி பயன்படுத்தப்படுகின்றன.

34. F1 ஸ்கோர், ரீகால் மற்றும் துல்லியம் என்றால் என்ன?

குழப்ப அளவீடு என்பது வகைப்பாடு மாதிரியின் செயல்திறனை அளவிடுவதற்கு பயன்படுத்தப்படும் அளவீடு ஆகும். குழப்ப அளவீட்டை சிறப்பாக விளக்க பின்வரும் சொற்றொடர்களைப் பயன்படுத்தலாம்:

TP: உண்மையான நேர்மறைகள் - இவை சரியாக எதிர்பார்க்கப்பட்ட நேர்மறை மதிப்புகள். திட்டமிடப்பட்ட வர்க்கம் மற்றும் உண்மையான வர்க்கத்தின் மதிப்புகள் இரண்டும் நேர்மறையானவை என்று இது அறிவுறுத்துகிறது.

TN: உண்மை எதிர்மறைகள்- இவை துல்லியமாக முன்னறிவிக்கப்பட்ட பாதகமான மதிப்புகள். உண்மையான வர்க்கம் மற்றும் எதிர்பார்க்கப்பட்ட வர்க்கத்தின் மதிப்பு இரண்டும் எதிர்மறையானவை என்று அது அறிவுறுத்துகிறது.

இந்த மதிப்புகள்—தவறான நேர்மறைகள் மற்றும் தவறான எதிர்மறைகள்—உங்கள் உண்மையான வகுப்பு எதிர்பார்க்கப்பட்ட வகுப்பிலிருந்து வேறுபடும் போது ஏற்படும்.

இப்பொழுது,

உண்மையான நேர்மறை விகிதத்தின் (TP) விகிதம் உண்மையான வகுப்பில் செய்யப்பட்ட அனைத்து அவதானிப்புகளுக்கும் ரீகால் என்று அழைக்கப்படுகிறது, இது உணர்திறன் என்றும் அழைக்கப்படுகிறது.

ரீகால் TP/(TP+FN).

துல்லியம் என்பது நேர்மறை முன்கணிப்பு மதிப்பின் அளவீடாகும், இது மாதிரி உண்மையில் எத்தனை சரியான நேர்மறைகளை துல்லியமாக கணிக்கிறது என்பதற்கான நேர்மறைகளின் எண்ணிக்கையை ஒப்பிடுகிறது.

துல்லியமானது TP/(TP + FP)

புரிந்து கொள்ள எளிதான செயல்திறன் அளவீடு துல்லியம், இது அனைத்து அவதானிப்புகளுக்கும் சரியாக கணிக்கப்பட்ட அவதானிப்புகளின் விகிதமாகும்.

துல்லியம் சமம் (TP+TN)/(TP+FP+FN+TN).

F1 ஸ்கோரை வழங்க துல்லியம் மற்றும் ரீகால் ஆகியவை எடையும் சராசரியும் ஆகும். இதன் விளைவாக, இந்த மதிப்பெண் தவறான நேர்மறை மற்றும் தவறான எதிர்மறை இரண்டையும் கருதுகிறது.

துல்லியத்தை விட F1 அடிக்கடி மதிப்புமிக்கது, குறிப்பாக உங்களிடம் சமமற்ற வகுப்பு விநியோகம் இருந்தால், உள்ளுணர்வால் துல்லியமாக புரிந்துகொள்வது அவ்வளவு எளிதானது அல்ல.

தவறான நேர்மறை மற்றும் தவறான எதிர்மறைகளின் விலை ஒப்பிடும்போது சிறந்த துல்லியம் அடையப்படுகிறது. தவறான நேர்மறை மற்றும் தவறான எதிர்மறைகளுடன் தொடர்புடைய செலவுகள் கணிசமாக வேறுபடும் பட்சத்தில் துல்லியம் மற்றும் நினைவுபடுத்துதல் இரண்டையும் சேர்ப்பது விரும்பத்தக்கது.

35. குறுக்கு சரிபார்ப்பு என்றால் என்ன?

இயந்திர கற்றலில் குறுக்கு சரிபார்ப்பு எனப்படும் புள்ளியியல் மறு மாதிரி அணுகுமுறையானது, பல சுற்றுகளில் இயந்திர கற்றல் வழிமுறையைப் பயிற்றுவிப்பதற்கும் மதிப்பீடு செய்வதற்கும் பல தரவுத்தொகுப்பு துணைக்குழுக்களைப் பயன்படுத்துகிறது.

மாடலைப் பயிற்றுவிக்கப் பயன்படுத்தப்படாத ஒரு புதிய தொகுதி தரவு, குறுக்கு சரிபார்ப்பைப் பயன்படுத்தி, மாடல் அதை எவ்வளவு நன்றாகக் கணித்துள்ளது என்பதைப் பார்க்க. குறுக்கு சரிபார்ப்பு மூலம் தரவு மிகைப்படுத்தல் தடுக்கப்படுகிறது.

K-Fold பெரும்பாலும் பயன்படுத்தப்படும் மறு மாதிரி முறையானது முழு தரவுத்தொகுப்பையும் சம அளவுள்ள K தொகுப்புகளாகப் பிரிக்கிறது. இது குறுக்கு சரிபார்ப்பு என்று அழைக்கப்படுகிறது.

36. உங்கள் மாடலில் குறிப்பிடத்தக்க மாறுபாடு இருப்பதை நீங்கள் கண்டுபிடித்ததாக வைத்துக்கொள்வோம். உங்கள் கருத்துப்படி, இந்த சூழ்நிலையை கையாள மிகவும் பொருத்தமான வழிமுறை எது?

உயர் மாறுபாட்டை நிர்வகித்தல்

பெரிய மாறுபாடுகள் கொண்ட பிரச்சனைகளுக்கு நாம் பேக்கிங் நுட்பத்தைப் பயன்படுத்த வேண்டும்.

தரவை துணைக்குழுக்களாகப் பிரிக்க, பேக்கிங் அல்காரிதம் மூலம் சீரற்ற தரவின் தொடர்ச்சியான மாதிரிகள் பயன்படுத்தப்படும். தரவு வகுக்கப்பட்டதும், விதிகளை உருவாக்க சீரற்ற தரவு மற்றும் ஒரு குறிப்பிட்ட பயிற்சி முறையைப் பயன்படுத்தலாம்.

அதன் பிறகு, மாதிரியின் கணிப்புகளை இணைக்க வாக்குப்பதிவு பயன்படுத்தப்படலாம்.

37. ரிட்ஜ் பின்னடைவை லாஸ்ஸோ பின்னடைவிலிருந்து வேறுபடுத்துவது எது?

இரண்டு பரவலாகப் பயன்படுத்தப்படும் முறைப்படுத்தல் முறைகள் லாஸ்ஸோ (எல்1 என்றும் அழைக்கப்படுகிறது) மற்றும் ரிட்ஜ் (சில நேரங்களில் எல்2 என்றும் அழைக்கப்படுகிறது) பின்னடைவு. தரவு மிகைப்படுத்தப்படுவதைத் தடுக்க அவை பயன்படுத்தப்படுகின்றன.

சிறந்த தீர்வைக் கண்டறியவும், சிக்கலைக் குறைக்கவும், குணகங்களைத் தண்டிக்க இந்த நுட்பங்கள் பயன்படுத்தப்படுகின்றன. குணகங்களின் முழுமையான மதிப்புகளின் மொத்தத்தை தண்டிப்பதன் மூலம், லாஸ்ஸோ பின்னடைவு செயல்படுகிறது.

ரிட்ஜ் அல்லது எல்2 பின்னடைவில் உள்ள பெனால்டி செயல்பாடு குணகங்களின் சதுரங்களின் கூட்டுத்தொகையிலிருந்து பெறப்படுகிறது.

38. எது மிகவும் முக்கியமானது: மாதிரி செயல்திறன் அல்லது மாதிரி துல்லியம்? எது, ஏன் நீங்கள் அதை விரும்புவீர்கள்?

இது ஒரு ஏமாற்றும் கேள்வி, எனவே மாடல் செயல்திறன் என்றால் என்ன என்பதை முதலில் புரிந்து கொள்ள வேண்டும். செயல்திறன் வேகம் என வரையறுக்கப்பட்டால், அது பயன்பாட்டின் வகையைச் சார்ந்தது; நிகழ்நேர சூழ்நிலையை உள்ளடக்கிய எந்தவொரு பயன்பாட்டிற்கும் ஒரு முக்கிய அங்கமாக அதிக வேகம் தேவைப்படும்.

உதாரணமாக, வினவல் முடிவுகள் வருவதற்கு அதிக நேரம் எடுத்துக் கொண்டால், சிறந்த தேடல் முடிவுகள் மதிப்பு குறைந்ததாகிவிடும்.

துல்லியத்திற்கு மேல் துல்லியம் மற்றும் நினைவுகூருதல் ஏன் முன்னுரிமை அளிக்கப்பட வேண்டும் என்பதற்கான நியாயமாக செயல்திறன் பயன்படுத்தப்பட்டால், சமநிலையற்ற எந்தத் தரவுத் தொகுப்பிற்கும் வணிக வழக்கை நிரூபிப்பதில் துல்லியத்தை விட F1 மதிப்பெண் மிகவும் பயனுள்ளதாக இருக்கும்.

39. ஏற்றத்தாழ்வுகளுடன் தரவுத்தொகுப்பை எவ்வாறு நிர்வகிப்பீர்கள்?

ஒரு சமநிலையற்ற தரவுத்தொகுப்பு மாதிரி நுட்பங்களிலிருந்து பயனடையலாம். மாதிரியை ஒரு கீழ் அல்லது மிகையான முறையில் செய்யலாம்.

மாதிரியின் கீழ் சிறுபான்மை வகுப்பைப் பொருத்துவதற்கு பெரும்பான்மை வகுப்பின் அளவைச் சுருக்கலாம், இது சேமிப்பகம் மற்றும் இயக்க நேரச் செயல்பாட்டில் வேகத்தை அதிகரிக்க உதவுகிறது, ஆனால் மதிப்புமிக்க தரவை இழக்க நேரிடும்.

மிகை மாதிரியால் ஏற்படும் தகவல் இழப்பின் சிக்கலைத் தீர்க்க, நாங்கள் சிறுபான்மை வகுப்பை உயர்த்துகிறோம்; ஆயினும்கூட, இது நம்மை மிகைப்படுத்தல் சிக்கல்களில் சிக்க வைக்கிறது.

கூடுதல் உத்திகள் அடங்கும்:

க்ளஸ்டர்-அடிப்படையிலான ஓவர் சாம்ப்ளிங்- இந்த சூழ்நிலையில் சிறுபான்மை மற்றும் பெரும்பான்மை வகுப்பு நிகழ்வுகள் தனித்தனியாக கே-மீன்ஸ் கிளஸ்டரிங் நுட்பத்திற்கு உட்படுத்தப்படுகின்றன. தரவுத்தொகுப்பு கிளஸ்டர்களைக் கண்டறிய இது செய்யப்படுகிறது. பின்னர், ஒவ்வொரு கிளஸ்டரும் மிகைப்படுத்தப்பட்டு, அனைத்து வகுப்புகளும் ஒரே அளவைக் கொண்டிருக்கும் மற்றும் ஒரு வகுப்பில் உள்ள அனைத்து கிளஸ்டர்களும் சம எண்ணிக்கையிலான நிகழ்வுகளைக் கொண்டிருக்கும்.
ஸ்மோட்: செயற்கை சிறுபான்மையினரின் மிகை மாதிரி நுட்பம்- சிறுபான்மை வகுப்பிலிருந்து தரவுகளின் ஒரு துண்டு உதாரணமாகப் பயன்படுத்தப்படுகிறது, அதன் பிறகு அதனுடன் ஒப்பிடக்கூடிய கூடுதல் செயற்கை நிகழ்வுகள் தயாரிக்கப்பட்டு அசல் தரவுத்தொகுப்பில் சேர்க்கப்படும். இந்த முறை எண் தரவு புள்ளிகளுடன் நன்றாக வேலை செய்கிறது.

40. ஊக்குவிப்பு மற்றும் பேக்கிங் ஆகியவற்றை நீங்கள் எவ்வாறு வேறுபடுத்தி அறியலாம்?

குழும நுட்பங்கள் பேக்கிங் மற்றும் பூஸ்டிங் எனப்படும் பதிப்புகளைக் கொண்டுள்ளன.

பேக்கிங்-

அதிக மாறுபாடு கொண்ட அல்காரிதம்களுக்கு, பேக்கிங் என்பது மாறுபாட்டைக் குறைக்கப் பயன்படுத்தப்படும் ஒரு நுட்பமாகும். சார்புக்கு ஆளாகக்கூடிய வகைப்படுத்திகளின் குடும்பம் முடிவு மரக் குடும்பமாகும்.

முடிவு மரங்கள் பயிற்சியளிக்கப்பட்ட தரவு வகை, அவற்றின் செயல்திறனில் குறிப்பிடத்தக்க தாக்கத்தை ஏற்படுத்துகிறது. இதன் காரணமாக, மிக உயர்ந்த நுணுக்கத்துடன் கூட, விளைவுகளைப் பொதுமைப்படுத்துவது சில நேரங்களில் அவற்றைப் பெறுவது மிகவும் கடினம்.

முடிவு மரங்களின் பயிற்சி தரவு மாற்றப்பட்டால், முடிவுகள் கணிசமாக வேறுபடும்.

இதன் விளைவாக, பேக்கிங் பயன்படுத்தப்படுகிறது, இதில் பல முடிவு மரங்கள் உருவாக்கப்படுகின்றன, ஒவ்வொன்றும் அசல் தரவின் மாதிரியைப் பயன்படுத்தி பயிற்சியளிக்கப்படுகின்றன, மேலும் இறுதி முடிவு இந்த வெவ்வேறு மாதிரிகளின் சராசரியாகும்.

ஊக்கமளிக்கிறது:

பூஸ்டிங் என்பது ஒரு n-பலவீனமான வகைப்படுத்தி அமைப்புடன் கணிப்புகளை உருவாக்கும் நுட்பமாகும், இதில் ஒவ்வொரு பலவீனமான வகைப்படுத்தியும் அதன் வலிமையான வகைப்படுத்திகளின் குறைபாடுகளை ஈடுசெய்கிறது. கொடுக்கப்பட்ட தரவுத் தொகுப்பில் மோசமாகச் செயல்படும் வகைப்படுத்தியை “பலவீனமான வகைப்படுத்தி” என்று குறிப்பிடுகிறோம்.

அதிகரிப்பது என்பது ஒரு வழிமுறையை விட ஒரு செயல்முறையாகும். தளவாட பின்னடைவு மற்றும் ஆழமற்ற முடிவு மரங்கள் பலவீனமான வகைப்படுத்திகளுக்கு பொதுவான எடுத்துக்காட்டுகள்.

Adaboost, Gradient Boosting மற்றும் XGBoost ஆகியவை இரண்டு மிகவும் பிரபலமான பூஸ்டிங் அல்காரிதம்கள், இருப்பினும், இன்னும் பல உள்ளன.

41. தூண்டல் மற்றும் விலக்கு கற்றலுக்கு இடையே உள்ள வேறுபாடுகளை விளக்குங்கள்.

கவனிக்கப்பட்ட எடுத்துக்காட்டுகளின் தொகுப்பிலிருந்து உதாரணம் மூலம் கற்றுக் கொள்ளும்போது, ஒரு மாதிரியானது ஒரு பொதுவான முடிவுக்கு வர தூண்டல் கற்றலைப் பயன்படுத்துகிறது. மறுபுறம், துப்பறியும் கற்றலுடன், மாதிரியானது அதன் சொந்தத்தை உருவாக்கும் முன் முடிவைப் பயன்படுத்துகிறது.

தூண்டல் கற்றல் என்பது அவதானிப்புகளிலிருந்து முடிவுகளை எடுக்கும் செயல்முறையாகும்.

துப்பறியும் கற்றல் என்பது அனுமானங்களின் அடிப்படையில் அவதானிப்புகளை உருவாக்கும் செயல்முறையாகும்.

தீர்மானம்

வாழ்த்துக்கள்! மெஷின் லேர்னிங்கிற்கான முதல் 40 மற்றும் அதற்கு மேற்பட்ட நேர்காணல் கேள்விகளுக்கான பதில்கள் உங்களுக்குத் தெரியும். தரவு அறிவியல் மற்றும் செயற்கை நுண்ணறிவு தொழில்நுட்பம் முன்னேறும்போது தொழில்களுக்கு தொடர்ந்து தேவை இருக்கும்.

இந்த அதிநவீன தொழில்நுட்பங்களைப் பற்றிய அறிவைப் புதுப்பித்து, தங்கள் திறமையை மேம்படுத்தும் வேட்பாளர்கள் போட்டி ஊதியத்துடன் பல்வேறு வகையான வேலை வாய்ப்புகளைக் காணலாம்.

பரவலாக கேட்கப்படும் இயந்திர கற்றல் நேர்காணல் கேள்விகளுக்கு எவ்வாறு பதிலளிப்பது என்பது பற்றிய உறுதியான புரிதல் உங்களுக்கு இருப்பதால், நேர்காணல்களுக்குப் பதிலளிப்பதைத் தொடரலாம்.

உங்கள் இலக்குகளைப் பொறுத்து, பின்வரும் படிகளை எடுக்கவும். ஹாஷ்டோர்க்கிற்குச் சென்று நேர்காணலுக்குத் தயாராகுங்கள் நேர்காணல் தொடர்.

சிறந்த 40+ இயந்திர கற்றல் நேர்காணல் கேள்விகள்