ಪರಿವಿಡಿ[ಮರೆಮಾಡಿ][ತೋರಿಸಿ]
ಯಾವುದೇ ರೀತಿಯ ಕಾರ್ಪೊರೇಟ್ ಚಟುವಟಿಕೆಯ ಪ್ರಾಥಮಿಕ ಮಾನದಂಡವೆಂದರೆ ಮಾಹಿತಿಯ ಪರಿಣಾಮಕಾರಿ ಬಳಕೆ. ಕೆಲವು ಹಂತದಲ್ಲಿ, ರಚಿಸಲಾದ ಡೇಟಾದ ಪ್ರಮಾಣವು ಮೂಲ ಸಂಸ್ಕರಣೆಯ ಸಾಮರ್ಥ್ಯವನ್ನು ಮೀರುತ್ತದೆ.
ಅಲ್ಲಿಯೇ ಯಂತ್ರ ಕಲಿಕೆ ಅಲ್ಗಾರಿದಮ್ಗಳು ಕಾರ್ಯರೂಪಕ್ಕೆ ಬರುತ್ತವೆ. ಆದಾಗ್ಯೂ, ಇವುಗಳಲ್ಲಿ ಯಾವುದಾದರೂ ಸಂಭವಿಸುವ ಮೊದಲು, ಮಾಹಿತಿಯನ್ನು ಅಧ್ಯಯನ ಮಾಡಬೇಕು ಮತ್ತು ಅರ್ಥೈಸಿಕೊಳ್ಳಬೇಕು. ಸಂಕ್ಷಿಪ್ತವಾಗಿ ಹೇಳುವುದಾದರೆ, ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡದ ಯಂತ್ರ ಕಲಿಕೆಯನ್ನು ಇದಕ್ಕಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ.
ಈ ಲೇಖನದಲ್ಲಿ, ಅದರ ಅಲ್ಗಾರಿದಮ್ಗಳು, ಬಳಕೆಯ ಪ್ರಕರಣಗಳು ಮತ್ತು ಹೆಚ್ಚಿನವುಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ನಾವು ಆಳವಾದ ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡದ ಯಂತ್ರ ಕಲಿಕೆಯನ್ನು ಪರಿಶೀಲಿಸುತ್ತೇವೆ.
ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡದ ಯಂತ್ರ ಕಲಿಕೆ ಎಂದರೇನು?
ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡದ ಯಂತ್ರ ಕಲಿಕೆ ಅಲ್ಗಾರಿದಮ್ಗಳು ತಿಳಿದಿರುವ ಅಥವಾ ಲೇಬಲ್ ಮಾಡಲಾದ ಪರಿಣಾಮವನ್ನು ಹೊಂದಿರದ ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ಮಾದರಿಗಳನ್ನು ಗುರುತಿಸುತ್ತವೆ. ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡಲಾಯಿತು ಯಂತ್ರ ಕಲಿಕೆ ಕ್ರಮಾವಳಿಗಳು ಲೇಬಲ್ ಮಾಡಿದ ಔಟ್ಪುಟ್ ಅನ್ನು ಹೊಂದಿರಿ.
ಔಟ್ಪುಟ್ ಡೇಟಾದ ಮೌಲ್ಯ/ಉತ್ತರ ಏನೆಂದು ನಿಮಗೆ ತಿಳಿದಿಲ್ಲದ ಕಾರಣ, ಹಿಂಜರಿತ ಅಥವಾ ವರ್ಗೀಕರಣ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸಲು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡದ ಯಂತ್ರ ಕಲಿಕೆಯ ವಿಧಾನಗಳನ್ನು ಏಕೆ ಬಳಸಲಾಗುವುದಿಲ್ಲ ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಈ ವ್ಯತ್ಯಾಸವನ್ನು ತಿಳಿದುಕೊಳ್ಳುವುದು ನಿಮಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ. ನಿಮಗೆ ಮೌಲ್ಯ/ಉತ್ತರ ತಿಳಿದಿಲ್ಲದಿದ್ದರೆ ನೀವು ಸಾಮಾನ್ಯವಾಗಿ ಅಲ್ಗಾರಿದಮ್ ಅನ್ನು ತರಬೇತಿ ಮಾಡಲು ಸಾಧ್ಯವಿಲ್ಲ.
ಮೇಲಾಗಿ, ಡೇಟಾದ ಮೂಲಭೂತ ರಚನೆಯನ್ನು ಗುರುತಿಸಲು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡದ ಕಲಿಕೆಯನ್ನು ಬಳಸಬಹುದು. ಈ ಅಲ್ಗಾರಿದಮ್ಗಳು ಮಾನವನ ಪರಸ್ಪರ ಕ್ರಿಯೆಯ ಅಗತ್ಯವಿಲ್ಲದೇ ಗುಪ್ತ ಮಾದರಿಗಳು ಅಥವಾ ಡೇಟಾ ಗುಂಪುಗಳನ್ನು ಪತ್ತೆ ಮಾಡುತ್ತವೆ.
ಮಾಹಿತಿಯಲ್ಲಿನ ಸಾಮ್ಯತೆ ಮತ್ತು ವ್ಯತಿರಿಕ್ತತೆಯನ್ನು ಪತ್ತೆಹಚ್ಚುವ ಅದರ ಸಾಮರ್ಥ್ಯವು ಪರಿಶೋಧನಾತ್ಮಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ, ಅಡ್ಡ-ಮಾರಾಟ ತಂತ್ರಗಳು, ಗ್ರಾಹಕ ವಿಭಜನೆ ಮತ್ತು ಚಿತ್ರ ಗುರುತಿಸುವಿಕೆಗೆ ಉತ್ತಮ ಆಯ್ಕೆಯಾಗಿದೆ.
ಕೆಳಗಿನ ಸನ್ನಿವೇಶವನ್ನು ಪರಿಗಣಿಸಿ: ನೀವು ಕಿರಾಣಿ ಅಂಗಡಿಯಲ್ಲಿದ್ದೀರಿ ಮತ್ತು ನೀವು ಹಿಂದೆಂದೂ ನೋಡಿರದ ಗುರುತಿಸಲಾಗದ ಹಣ್ಣನ್ನು ನೋಡಿ. ಅದರ ರೂಪ, ಗಾತ್ರ ಅಥವಾ ಬಣ್ಣದ ನಿಮ್ಮ ಅವಲೋಕನಗಳ ಆಧಾರದ ಮೇಲೆ ನೀವು ಇತರ ಹಣ್ಣುಗಳಿಗಿಂತ ಭಿನ್ನವಾಗಿರುವ ಅಜ್ಞಾತ ಹಣ್ಣನ್ನು ಸುಲಭವಾಗಿ ಗುರುತಿಸಬಹುದು.
ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡದ ಯಂತ್ರ ಕಲಿಕೆ ಅಲ್ಗಾರಿದಮ್ಗಳು
ಕ್ಲಸ್ಟರಿಂಗ್
ಕ್ಲಸ್ಟರಿಂಗ್ ನಿಸ್ಸಂದೇಹವಾಗಿ ಹೆಚ್ಚು ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲಾಗುವ ಮೇಲ್ವಿಚಾರಣೆಯಿಲ್ಲದ ಕಲಿಕೆಯ ವಿಧಾನವಾಗಿದೆ. ಈ ವಿಧಾನವು ಸಂಬಂಧಿತ ಡೇಟಾ ಐಟಂಗಳನ್ನು ಯಾದೃಚ್ಛಿಕವಾಗಿ ರಚಿಸಲಾದ ಕ್ಲಸ್ಟರ್ಗಳಲ್ಲಿ ಇರಿಸುತ್ತದೆ.
ಸ್ವತಃ, ML ಮಾದರಿಯು ವರ್ಗೀಕರಿಸದ ಡೇಟಾ ರಚನೆಯಲ್ಲಿ ಯಾವುದೇ ಮಾದರಿಗಳು, ಹೋಲಿಕೆಗಳು ಮತ್ತು/ಅಥವಾ ವ್ಯತ್ಯಾಸಗಳನ್ನು ಕಂಡುಹಿಡಿಯುತ್ತದೆ. ಡೇಟಾದಲ್ಲಿ ಯಾವುದೇ ನೈಸರ್ಗಿಕ ಗುಂಪುಗಳು ಅಥವಾ ವರ್ಗಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಮಾದರಿಯು ಸಾಧ್ಯವಾಗುತ್ತದೆ.
ವಿಧಗಳು
ಬಳಸಬಹುದಾದ ಹಲವಾರು ರೀತಿಯ ಕ್ಲಸ್ಟರಿಂಗ್ಗಳಿವೆ. ಮೊದಲು ಪ್ರಮುಖವಾದವುಗಳನ್ನು ನೋಡೋಣ.
- ಎಕ್ಸ್ಕ್ಲೂಸಿವ್ ಕ್ಲಸ್ಟರಿಂಗ್, ಕೆಲವೊಮ್ಮೆ "ಹಾರ್ಡ್" ಕ್ಲಸ್ಟರಿಂಗ್ ಎಂದು ಕರೆಯಲ್ಪಡುತ್ತದೆ, ಇದು ಒಂದು ರೀತಿಯ ಗ್ರೂಪಿಂಗ್ ಆಗಿದ್ದು ಇದರಲ್ಲಿ ಒಂದು ಡೇಟಾದ ತುಣುಕು ಕೇವಲ ಒಂದು ಕ್ಲಸ್ಟರ್ಗೆ ಸೇರಿದೆ.
- ಅತಿಕ್ರಮಿಸುವ ಕ್ಲಸ್ಟರಿಂಗ್, ಸಾಮಾನ್ಯವಾಗಿ "ಸಾಫ್ಟ್" ಕ್ಲಸ್ಟರಿಂಗ್ ಎಂದು ಕರೆಯಲ್ಪಡುತ್ತದೆ, ಡೇಟಾ ವಸ್ತುಗಳು ಒಂದಕ್ಕಿಂತ ಹೆಚ್ಚು ಕ್ಲಸ್ಟರ್ಗಳಿಗೆ ವಿವಿಧ ಹಂತಗಳಿಗೆ ಸೇರಲು ಅನುಮತಿಸುತ್ತದೆ. ಇದಲ್ಲದೆ, ಸಂಭವನೀಯ ಕ್ಲಸ್ಟರಿಂಗ್ ಅನ್ನು "ಮೃದು" ಕ್ಲಸ್ಟರಿಂಗ್ ಅಥವಾ ಸಾಂದ್ರತೆಯ ಅಂದಾಜು ಸಮಸ್ಯೆಗಳನ್ನು ನಿಭಾಯಿಸಲು ಬಳಸಬಹುದು, ಹಾಗೆಯೇ ಕೆಲವು ಕ್ಲಸ್ಟರ್ಗಳಿಗೆ ಸೇರಿದ ಡೇಟಾ ಬಿಂದುಗಳ ಸಂಭವನೀಯತೆ ಅಥವಾ ಸಂಭವನೀಯತೆಯನ್ನು ನಿರ್ಣಯಿಸಲು.
- ಗುಂಪಿನ ಡೇಟಾ ಐಟಂಗಳ ಶ್ರೇಣಿಯನ್ನು ರಚಿಸುವುದು ಶ್ರೇಣೀಕೃತ ಕ್ಲಸ್ಟರಿಂಗ್ನ ಗುರಿಯಾಗಿದೆ, ಹೆಸರೇ ಸೂಚಿಸುವಂತೆ. ಕ್ಲಸ್ಟರ್ಗಳನ್ನು ಉತ್ಪಾದಿಸಲು ಕ್ರಮಾನುಗತವನ್ನು ಆಧರಿಸಿ ಡೇಟಾ ಐಟಂಗಳನ್ನು ಡಿಕನ್ಸ್ಟ್ರಕ್ಟ್ ಮಾಡಲಾಗಿದೆ ಅಥವಾ ಸಂಯೋಜಿಸಲಾಗಿದೆ.
ಪ್ರಕರಣಗಳನ್ನು ಬಳಸಿ:
- ಅಸಂಗತತೆ ಪತ್ತೆ:
ಕ್ಲಸ್ಟರಿಂಗ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಡೇಟಾದಲ್ಲಿ ಯಾವುದೇ ರೀತಿಯ ಔಟ್ಲೈಯರ್ ಅನ್ನು ಕಂಡುಹಿಡಿಯಬಹುದು. ಸಾರಿಗೆ ಮತ್ತು ಲಾಜಿಸ್ಟಿಕ್ಸ್ನಲ್ಲಿರುವ ಕಂಪನಿಗಳು, ಉದಾಹರಣೆಗೆ, ಲಾಜಿಸ್ಟಿಕಲ್ ಅಡೆತಡೆಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಅಥವಾ ಹಾನಿಗೊಳಗಾದ ಯಾಂತ್ರಿಕ ಭಾಗಗಳನ್ನು (ಮುನ್ಸೂಚಕ ನಿರ್ವಹಣೆ) ಬಹಿರಂಗಪಡಿಸಲು ಅಸಂಗತತೆ ಪತ್ತೆಹಚ್ಚುವಿಕೆಯನ್ನು ಬಳಸಿಕೊಳ್ಳಬಹುದು.
ಹಣಕಾಸು ಸಂಸ್ಥೆಗಳು ಮೋಸದ ವಹಿವಾಟುಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಮತ್ತು ತ್ವರಿತವಾಗಿ ಪ್ರತಿಕ್ರಿಯಿಸಲು ತಂತ್ರಜ್ಞಾನವನ್ನು ಬಳಸಬಹುದು, ಸಂಭಾವ್ಯವಾಗಿ ಬಹಳಷ್ಟು ಹಣವನ್ನು ಉಳಿಸಬಹುದು. ನಮ್ಮ ವೀಡಿಯೊವನ್ನು ನೋಡುವ ಮೂಲಕ ಅಸಹಜತೆಗಳು ಮತ್ತು ವಂಚನೆಗಳನ್ನು ಗುರುತಿಸುವ ಕುರಿತು ಇನ್ನಷ್ಟು ತಿಳಿಯಿರಿ.
- ಗ್ರಾಹಕರು ಮತ್ತು ಮಾರುಕಟ್ಟೆಗಳ ವಿಭಾಗ:
ಕ್ಲಸ್ಟರಿಂಗ್ ಅಲ್ಗಾರಿದಮ್ಗಳು ಒಂದೇ ರೀತಿಯ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಹೊಂದಿರುವ ಜನರನ್ನು ಗುಂಪು ಮಾಡಲು ಮತ್ತು ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿ ಮಾರ್ಕೆಟಿಂಗ್ ಮತ್ತು ಉದ್ದೇಶಿತ ಉಪಕ್ರಮಗಳಿಗಾಗಿ ಗ್ರಾಹಕ ವ್ಯಕ್ತಿಗಳನ್ನು ರಚಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
ಕೆ-ಅಂದರೆ
K- ಎಂದರೆ ಒಂದು ಕ್ಲಸ್ಟರಿಂಗ್ ವಿಧಾನವಾಗಿದ್ದು ಇದನ್ನು ವಿಭಜನೆ ಅಥವಾ ವಿಭಜನೆ ಎಂದೂ ಕರೆಯಲಾಗುತ್ತದೆ. ಇದು ಡೇಟಾ ಬಿಂದುಗಳನ್ನು ಕೆ ಎಂದು ಕರೆಯಲ್ಪಡುವ ಪೂರ್ವನಿರ್ಧರಿತ ಸಂಖ್ಯೆಯ ಕ್ಲಸ್ಟರ್ಗಳಾಗಿ ವಿಭಜಿಸುತ್ತದೆ.
K- ಮೀನ್ಸ್ ವಿಧಾನದಲ್ಲಿ, ನಿಮ್ಮ ಡೇಟಾದಲ್ಲಿ ನೀವು ಎಷ್ಟು ಕ್ಲಸ್ಟರ್ಗಳನ್ನು ಗುರುತಿಸಲು ಬಯಸುತ್ತೀರಿ ಎಂಬುದನ್ನು ನೀವು ಕಂಪ್ಯೂಟರ್ಗೆ ತಿಳಿಸುವುದರಿಂದ K ಇನ್ಪುಟ್ ಆಗಿದೆ. ಪ್ರತಿಯೊಂದು ಡೇಟಾ ಐಟಂ ಅನ್ನು ತರುವಾಯ ಸೆಂಟ್ರಾಯ್ಡ್ (ಚಿತ್ರದಲ್ಲಿ ಕಪ್ಪು ಚುಕ್ಕೆಗಳು) ಎಂದು ಕರೆಯಲ್ಪಡುವ ಹತ್ತಿರದ ಕ್ಲಸ್ಟರ್ ಕೇಂದ್ರಕ್ಕೆ ನಿಯೋಜಿಸಲಾಗಿದೆ.
ಎರಡನೆಯದು ಡೇಟಾ ಶೇಖರಣಾ ಸ್ಥಳಗಳಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಕ್ಲಸ್ಟರಿಂಗ್ ತಂತ್ರವನ್ನು ಕ್ಲಸ್ಟರ್ಗಳು ಚೆನ್ನಾಗಿ ವ್ಯಾಖ್ಯಾನಿಸುವವರೆಗೆ ಹಲವಾರು ಬಾರಿ ಮಾಡಬಹುದು.
ಅಸ್ಪಷ್ಟ ಕೆ-ಎಂದರೆ
ಅಸ್ಪಷ್ಟ ಕೆ-ಮೀನ್ಸ್ ಎನ್ನುವುದು ಕೆ-ಮೀನ್ಸ್ ತಂತ್ರದ ವಿಸ್ತರಣೆಯಾಗಿದೆ, ಇದನ್ನು ಅತಿಕ್ರಮಿಸುವ ಕ್ಲಸ್ಟರಿಂಗ್ ಮಾಡಲು ಬಳಸಲಾಗುತ್ತದೆ. ಕೆ-ಎಂದರೆ ತಂತ್ರಕ್ಕಿಂತ ಭಿನ್ನವಾಗಿ, ಅಸ್ಪಷ್ಟವಾದ ಕೆ-ಅಂದರೆ ಡೇಟಾ ಪಾಯಿಂಟ್ಗಳು ಪ್ರತಿಯೊಂದಕ್ಕೂ ವಿಭಿನ್ನ ಮಟ್ಟದ ಸಾಮೀಪ್ಯದೊಂದಿಗೆ ಅನೇಕ ಕ್ಲಸ್ಟರ್ಗಳಿಗೆ ಸೇರಿರಬಹುದು ಎಂದು ಸೂಚಿಸುತ್ತದೆ.
ಡೇಟಾ ಬಿಂದುಗಳು ಮತ್ತು ಕ್ಲಸ್ಟರ್ನ ಸೆಂಟ್ರಾಯ್ಡ್ ನಡುವಿನ ಅಂತರವನ್ನು ಸಾಮೀಪ್ಯವನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಲು ಬಳಸಲಾಗುತ್ತದೆ. ಪರಿಣಾಮವಾಗಿ, ವಿವಿಧ ಕ್ಲಸ್ಟರ್ಗಳು ಅತಿಕ್ರಮಿಸುವ ಸಂದರ್ಭಗಳು ಇರಬಹುದು.
ಗಾಸಿಯನ್ ಮಿಶ್ರಣ ಮಾದರಿಗಳು
ಗಾಸಿಯನ್ ಮಿಶ್ರಣ ಮಾದರಿಗಳು (GMMs) ಸಂಭವನೀಯ ಕ್ಲಸ್ಟರಿಂಗ್ನಲ್ಲಿ ಬಳಸಲಾಗುವ ಒಂದು ವಿಧಾನವಾಗಿದೆ. ಸರಾಸರಿ ಮತ್ತು ವ್ಯತ್ಯಾಸವು ತಿಳಿದಿಲ್ಲವಾದ್ದರಿಂದ, ಮಾದರಿಗಳು ನಿಗದಿತ ಸಂಖ್ಯೆಯ ಗಾಸಿಯನ್ ವಿತರಣೆಗಳು ಇವೆ ಎಂದು ಊಹಿಸುತ್ತವೆ, ಪ್ರತಿಯೊಂದೂ ವಿಭಿನ್ನ ಕ್ಲಸ್ಟರ್ ಅನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತದೆ.
ನಿರ್ದಿಷ್ಟ ಡೇಟಾ ಪಾಯಿಂಟ್ ಯಾವ ಕ್ಲಸ್ಟರ್ಗೆ ಸೇರಿದೆ ಎಂಬುದನ್ನು ನಿರ್ಧರಿಸಲು, ವಿಧಾನವನ್ನು ಮೂಲಭೂತವಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ.
ಶ್ರೇಣೀಕೃತ ಕ್ಲಸ್ಟರಿಂಗ್
ಕ್ರಮಾನುಗತ ಕ್ಲಸ್ಟರಿಂಗ್ ತಂತ್ರವು ವಿಭಿನ್ನ ಕ್ಲಸ್ಟರ್ಗೆ ನಿಯೋಜಿಸಲಾದ ಪ್ರತಿಯೊಂದು ಡೇಟಾ ಪಾಯಿಂಟ್ನೊಂದಿಗೆ ಪ್ರಾರಂಭವಾಗಬಹುದು. ಒಂದಕ್ಕೊಂದು ಹತ್ತಿರವಿರುವ ಎರಡು ಸಮೂಹಗಳು ನಂತರ ಒಂದೇ ಕ್ಲಸ್ಟರ್ ಆಗಿ ಮಿಶ್ರಣಗೊಳ್ಳುತ್ತವೆ. ಒಂದು ಕ್ಲಸ್ಟರ್ ಮಾತ್ರ ಮೇಲ್ಭಾಗದಲ್ಲಿ ಉಳಿಯುವವರೆಗೆ ಪುನರಾವರ್ತಿತ ವಿಲೀನವು ಮುಂದುವರಿಯುತ್ತದೆ.
ಈ ವಿಧಾನವನ್ನು ಬಾಟಮ್-ಅಪ್ ಅಥವಾ ಒಟ್ಟುಗೂಡಿಸುವಿಕೆ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ನೀವು ಎಲ್ಲಾ ಡೇಟಾ ಐಟಂಗಳನ್ನು ಒಂದೇ ಕ್ಲಸ್ಟರ್ಗೆ ಜೋಡಿಸಿ ಮತ್ತು ನಂತರ ಪ್ರತಿ ಡೇಟಾ ಐಟಂ ಅನ್ನು ಪ್ರತ್ಯೇಕ ಕ್ಲಸ್ಟರ್ನಂತೆ ನಿಯೋಜಿಸುವವರೆಗೆ ವಿಭಜನೆಗಳನ್ನು ನಡೆಸಿದರೆ, ವಿಧಾನವನ್ನು ಟಾಪ್-ಡೌನ್ ಅಥವಾ ವಿಭಾಜಕ ಕ್ರಮಾನುಗತ ಕ್ಲಸ್ಟರಿಂಗ್ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ.
ಅಪ್ರಿಯೊರಿ ಅಲ್ಗಾರಿದಮ್
ಮಾರ್ಕೆಟ್ ಬ್ಯಾಸ್ಕೆಟ್ ವಿಶ್ಲೇಷಣೆಯು ಅಪ್ರಿಯೊರಿ ಅಲ್ಗಾರಿದಮ್ಗಳನ್ನು ಜನಪ್ರಿಯಗೊಳಿಸಿತು, ಇದರಿಂದಾಗಿ ಸಂಗೀತ ವೇದಿಕೆಗಳು ಮತ್ತು ಆನ್ಲೈನ್ ಸ್ಟೋರ್ಗಳಿಗೆ ವಿವಿಧ ಶಿಫಾರಸು ಎಂಜಿನ್ಗಳು ದೊರೆಯುತ್ತವೆ.
ಒಂದು ಉತ್ಪನ್ನವನ್ನು ಇನ್ನೊಂದರ ಸೇವನೆಯ ಆಧಾರದ ಮೇಲೆ ಸೇವಿಸುವ ಸಾಧ್ಯತೆಯನ್ನು ಊಹಿಸಲು, ಆಗಾಗ್ಗೆ ಐಟಂಸೆಟ್ಗಳು ಅಥವಾ ಐಟಂಗಳ ಗುಂಪುಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ವಹಿವಾಟಿನ ಡೇಟಾಸೆಟ್ಗಳಲ್ಲಿ ಅವುಗಳನ್ನು ಬಳಸಲಾಗುತ್ತದೆ.
ಉದಾಹರಣೆಗೆ, ನಾನು "ಕೌಂಟಿಂಗ್ ಸ್ಟಾರ್ಸ್" ನೊಂದಿಗೆ Spotify ನಲ್ಲಿ OneRepublic ನ ರೇಡಿಯೊವನ್ನು ಪ್ಲೇ ಮಾಡಲು ಪ್ರಾರಂಭಿಸಿದರೆ, ಈ ಚಾನಲ್ನಲ್ಲಿರುವ ಇತರ ಹಾಡುಗಳಲ್ಲಿ ಒಂದಾದ "ಬ್ಯಾಡ್ ಲೈಯರ್" ನಂತಹ ಇಮ್ಯಾಜಿನ್ ಡ್ರ್ಯಾಗನ್ ಹಾಡು ಖಂಡಿತವಾಗಿಯೂ ಇರುತ್ತದೆ.
ಇದು ನನ್ನ ಹಿಂದಿನ ಆಲಿಸುವ ಅಭ್ಯಾಸಗಳು ಹಾಗೂ ಇತರರ ಆಲಿಸುವ ಮಾದರಿಗಳನ್ನು ಆಧರಿಸಿದೆ. ಅಪ್ರಿಯೊರಿ ವಿಧಾನಗಳು ಹ್ಯಾಶ್ ಟ್ರೀ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಐಟಂಸೆಟ್ಗಳನ್ನು ಎಣಿಕೆ ಮಾಡುತ್ತವೆ, ಡೇಟಾಸೆಟ್ ಅಗಲವನ್ನು ಮೊದಲು ದಾಟುತ್ತವೆ.
ಆಯಾಮದ ಕಡಿತ
ಆಯಾಮದ ಕಡಿತವು ಒಂದು ರೀತಿಯ ಮೇಲ್ವಿಚಾರಣೆಯಿಲ್ಲದ ಕಲಿಕೆಯಾಗಿದ್ದು ಅದು ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ವೈಶಿಷ್ಟ್ಯಗಳ ಸಂಖ್ಯೆ ಅಥವಾ ಆಯಾಮಗಳನ್ನು ಕಡಿಮೆ ಮಾಡಲು ತಂತ್ರಗಳ ಸಂಗ್ರಹವನ್ನು ಬಳಸುತ್ತದೆ. ಸ್ಪಷ್ಟಪಡಿಸಲು ನಮಗೆ ಅನುಮತಿಸಿ.
ನಿಮ್ಮದನ್ನು ರಚಿಸುವಾಗ ಸಾಧ್ಯವಾದಷ್ಟು ಡೇಟಾವನ್ನು ಸೇರಿಸಲು ಇದು ಪ್ರಲೋಭನಕಾರಿಯಾಗಿದೆ ಯಂತ್ರ ಕಲಿಕೆಗಾಗಿ ಡೇಟಾಸೆಟ್. ನಮ್ಮನ್ನು ತಪ್ಪಾಗಿ ಗ್ರಹಿಸಬೇಡಿ: ಹೆಚ್ಚು ಡೇಟಾ ಸಾಮಾನ್ಯವಾಗಿ ಹೆಚ್ಚು ನಿಖರವಾದ ಸಂಶೋಧನೆಗಳನ್ನು ನೀಡುತ್ತದೆಯಾದ್ದರಿಂದ ಈ ತಂತ್ರವು ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ.
ಡೇಟಾವನ್ನು N- ಆಯಾಮದ ಜಾಗದಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗಿದೆ ಎಂದು ಊಹಿಸಿ, ಪ್ರತಿಯೊಂದು ವೈಶಿಷ್ಟ್ಯವು ವಿಭಿನ್ನ ಆಯಾಮವನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತದೆ. ಸಾಕಷ್ಟು ಡೇಟಾ ಇದ್ದರೆ ನೂರಾರು ಆಯಾಮಗಳು ಇರಬಹುದು.
ಗುಣಲಕ್ಷಣಗಳನ್ನು ಪ್ರತಿನಿಧಿಸುವ ಕಾಲಮ್ಗಳು ಮತ್ತು ಡೇಟಾ ಐಟಂಗಳನ್ನು ಪ್ರತಿನಿಧಿಸುವ ಸಾಲುಗಳೊಂದಿಗೆ ಎಕ್ಸೆಲ್ ಸ್ಪ್ರೆಡ್ಶೀಟ್ಗಳನ್ನು ಪರಿಗಣಿಸಿ. ಹಲವಾರು ಆಯಾಮಗಳು ಇದ್ದಾಗ, ML ಅಲ್ಗಾರಿದಮ್ಗಳು ಕಳಪೆಯಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸಬಹುದು ಮತ್ತು ಡೇಟಾ ದೃಶ್ಯೀಕರಣ ಕಷ್ಟವಾಗಬಹುದು.
ಆದ್ದರಿಂದ ಇದು ಗುಣಲಕ್ಷಣಗಳು ಅಥವಾ ಆಯಾಮಗಳನ್ನು ಮಿತಿಗೊಳಿಸಲು ತಾರ್ಕಿಕವಾಗಿಸುತ್ತದೆ ಮತ್ತು ಕೇವಲ ಸಂಬಂಧಿತ ಮಾಹಿತಿಯನ್ನು ತಿಳಿಸುತ್ತದೆ. ಆಯಾಮದ ಕಡಿತವು ಅಷ್ಟೇ. ಡೇಟಾಸೆಟ್ನ ಸಮಗ್ರತೆಗೆ ಧಕ್ಕೆಯಾಗದಂತೆ ನಿರ್ವಹಣಾ ಪ್ರಮಾಣದ ಡೇಟಾ ಇನ್ಪುಟ್ಗಳನ್ನು ಇದು ಅನುಮತಿಸುತ್ತದೆ.
ಪ್ರಧಾನ ಘಟಕ ವಿಶ್ಲೇಷಣೆ (ಪಿಸಿಎ)
ಮುಖ್ಯ ಘಟಕ ವಿಶ್ಲೇಷಣೆಯು ಆಯಾಮದ ಕಡಿತ ವಿಧಾನವಾಗಿದೆ. ಬೃಹತ್ ಡೇಟಾಸೆಟ್ಗಳಲ್ಲಿನ ವೈಶಿಷ್ಟ್ಯಗಳ ಸಂಖ್ಯೆಯನ್ನು ಕಡಿಮೆ ಮಾಡಲು ಇದನ್ನು ಬಳಸಲಾಗುತ್ತದೆ, ನಿಖರತೆಯನ್ನು ತ್ಯಾಗ ಮಾಡದೆ ಹೆಚ್ಚಿನ ಡೇಟಾ ಸರಳತೆಗೆ ಕಾರಣವಾಗುತ್ತದೆ.
ವೈಶಿಷ್ಟ್ಯದ ಹೊರತೆಗೆಯುವಿಕೆ ಎಂದು ಕರೆಯಲ್ಪಡುವ ವಿಧಾನದಿಂದ ಡೇಟಾಸೆಟ್ ಕಂಪ್ರೆಷನ್ ಅನ್ನು ಸಾಧಿಸಲಾಗುತ್ತದೆ. ಮೂಲ ಸೆಟ್ನಿಂದ ಅಂಶಗಳನ್ನು ಹೊಸ, ಚಿಕ್ಕದಕ್ಕೆ ಸಂಯೋಜಿಸಲಾಗಿದೆ ಎಂದು ಇದು ಸೂಚಿಸುತ್ತದೆ. ಈ ಹೊಸ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಪ್ರಾಥಮಿಕ ಘಟಕಗಳು ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ.
ಸಹಜವಾಗಿ, ನಿಮ್ಮ ಮೇಲ್ವಿಚಾರಣೆಯಿಲ್ಲದ ಕಲಿಕೆಯ ಅಪ್ಲಿಕೇಶನ್ಗಳಲ್ಲಿ ನೀವು ಬಳಸಬಹುದಾದ ಹೆಚ್ಚುವರಿ ಅಲ್ಗಾರಿದಮ್ಗಳಿವೆ. ಮೇಲೆ ಪಟ್ಟಿ ಮಾಡಲಾದವುಗಳು ಹೆಚ್ಚು ಪ್ರಚಲಿತವಾಗಿದೆ, ಅದಕ್ಕಾಗಿಯೇ ಅವುಗಳನ್ನು ಹೆಚ್ಚು ವಿವರವಾಗಿ ಚರ್ಚಿಸಲಾಗಿದೆ.
ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡದ ಕಲಿಕೆಯ ಅಪ್ಲಿಕೇಶನ್
- ವಸ್ತು ಗುರುತಿಸುವಿಕೆಯಂತಹ ದೃಶ್ಯ ಗ್ರಹಿಕೆ ಕಾರ್ಯಗಳಿಗಾಗಿ ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡದ ಕಲಿಕೆಯ ವಿಧಾನಗಳನ್ನು ಬಳಸಿಕೊಳ್ಳಲಾಗುತ್ತದೆ.
- ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡದ ಯಂತ್ರ ಕಲಿಕೆಯು ಚಿತ್ರ ಗುರುತಿಸುವಿಕೆ, ವರ್ಗೀಕರಣ ಮತ್ತು ವಿಭಜನೆಯಂತಹ ವೈದ್ಯಕೀಯ ಚಿತ್ರಣ ವ್ಯವಸ್ಥೆಗಳಿಗೆ ನಿರ್ಣಾಯಕ ಅಂಶಗಳನ್ನು ನೀಡುತ್ತದೆ, ಇದನ್ನು ವಿಕಿರಣಶಾಸ್ತ್ರ ಮತ್ತು ರೋಗಶಾಸ್ತ್ರದಲ್ಲಿ ರೋಗಿಗಳನ್ನು ತ್ವರಿತವಾಗಿ ಮತ್ತು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ರೋಗನಿರ್ಣಯ ಮಾಡಲು ಬಳಸಲಾಗುತ್ತದೆ.
- ಮೇಲ್ವಿಚಾರಣೆಯಿಲ್ಲದ ಕಲಿಕೆಯು ಗ್ರಾಹಕರ ನಡವಳಿಕೆಯ ಹಿಂದಿನ ಡೇಟಾವನ್ನು ಬಳಸಿಕೊಂಡು ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿ ಅಡ್ಡ-ಮಾರಾಟ ತಂತ್ರಗಳನ್ನು ರಚಿಸಲು ಬಳಸಬಹುದಾದ ಡೇಟಾ ಪ್ರವೃತ್ತಿಯನ್ನು ಗುರುತಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಚೆಕ್ಔಟ್ ಪ್ರಕ್ರಿಯೆಯ ಸಮಯದಲ್ಲಿ, ಕ್ಲೈಂಟ್ಗಳಿಗೆ ಸರಿಯಾದ ಆಡ್-ಆನ್ಗಳನ್ನು ಸೂಚಿಸಲು ಆನ್ಲೈನ್ ವ್ಯಾಪಾರಗಳು ಇದನ್ನು ಬಳಸುತ್ತವೆ.
- ಮೇಲ್ವಿಚಾರಣೆಯಿಲ್ಲದ ಕಲಿಕೆಯ ವಿಧಾನಗಳು ಅಗಾಧ ಪ್ರಮಾಣದ ದತ್ತಾಂಶದ ಮೂಲಕ ಹೊರಗಿರುವವರನ್ನು ಹುಡುಕಬಹುದು. ಈ ಅಸಹಜತೆಗಳು ಅಸಮರ್ಪಕ ಉಪಕರಣಗಳು, ಮಾನವ ತಪ್ಪುಗಳು ಅಥವಾ ಭದ್ರತಾ ಉಲ್ಲಂಘನೆಗಳ ಸೂಚನೆಯನ್ನು ಹೆಚ್ಚಿಸಬಹುದು.
ಮೇಲ್ವಿಚಾರಣೆಯಿಲ್ಲದ ಕಲಿಕೆಯೊಂದಿಗೆ ಸಮಸ್ಯೆಗಳು
ಪ್ರಮುಖ ಒಳನೋಟಗಳನ್ನು ಕಂಡುಹಿಡಿಯುವ ಸಾಮರ್ಥ್ಯದಿಂದ ಮೇಲ್ವಿಚಾರಣೆಯಿಲ್ಲದ ಕಲಿಕೆಯು ವಿವಿಧ ರೀತಿಯಲ್ಲಿ ಆಕರ್ಷಕವಾಗಿದೆ ದುಬಾರಿ ಡೇಟಾ ಲೇಬಲಿಂಗ್ ಅನ್ನು ತಪ್ಪಿಸಲು ಡೇಟಾ ಕಾರ್ಯಾಚರಣೆ. ಆದಾಗ್ಯೂ, ತರಬೇತಿ ನೀಡಲು ಈ ತಂತ್ರವನ್ನು ಬಳಸಲು ಹಲವಾರು ನ್ಯೂನತೆಗಳಿವೆ ಯಂತ್ರ ಕಲಿಕಾ ಮಾದರಿಗಳು ಎಂದು ನೀವು ತಿಳಿದಿರಬೇಕು. ಕೆಲವು ಉದಾಹರಣೆಗಳು ಇಲ್ಲಿವೆ.
- ಇನ್ಪುಟ್ ಡೇಟಾವು ಪ್ರತಿಕ್ರಿಯೆ ಕೀಲಿಗಳಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುವ ಲೇಬಲ್ಗಳನ್ನು ಹೊಂದಿಲ್ಲದಿರುವುದರಿಂದ, ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡದ ಕಲಿಕೆಯ ಮಾದರಿಗಳ ಫಲಿತಾಂಶಗಳು ಕಡಿಮೆ ನಿಖರವಾಗಿರಬಹುದು.
- ಮೇಲ್ವಿಚಾರಣೆಯಿಲ್ಲದ ಕಲಿಕೆಯು ಬೃಹತ್ ಡೇಟಾಸೆಟ್ಗಳೊಂದಿಗೆ ಆಗಾಗ್ಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ, ಇದು ಕಂಪ್ಯೂಟೇಶನಲ್ ಸಂಕೀರ್ಣತೆಯನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ.
- ಈ ವಿಧಾನವು ಮಾನವರಿಂದ ಔಟ್ಪುಟ್ ದೃಢೀಕರಣದ ಅಗತ್ಯವಿದೆ, ವಿಚಾರಣೆಯ ವಿಷಯದಲ್ಲಿ ಆಂತರಿಕ ಅಥವಾ ಬಾಹ್ಯ ತಜ್ಞರು.
- ಅಲ್ಗಾರಿದಮ್ಗಳು ತರಬೇತಿಯ ಹಂತದಲ್ಲಿ ಪ್ರತಿಯೊಂದು ಸಂಭವನೀಯ ಸನ್ನಿವೇಶವನ್ನು ಪರೀಕ್ಷಿಸಬೇಕು ಮತ್ತು ಲೆಕ್ಕಾಚಾರ ಮಾಡಬೇಕು, ಇದು ಸ್ವಲ್ಪ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ.
ತೀರ್ಮಾನ
ನಿರ್ದಿಷ್ಟ ಮಾರುಕಟ್ಟೆಯಲ್ಲಿ ಸ್ಪರ್ಧಾತ್ಮಕ ಅಂಚನ್ನು ಸ್ಥಾಪಿಸಲು ಪರಿಣಾಮಕಾರಿ ಡೇಟಾ ಬಳಕೆಯಾಗಿದೆ.
ನಿಮ್ಮ ಗುರಿ ಪ್ರೇಕ್ಷಕರ ಆದ್ಯತೆಗಳನ್ನು ಪರೀಕ್ಷಿಸಲು ಅಥವಾ ನಿರ್ದಿಷ್ಟ ಚಿಕಿತ್ಸೆಗೆ ನಿರ್ದಿಷ್ಟ ಸೋಂಕು ಹೇಗೆ ಪ್ರತಿಕ್ರಿಯಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ನಿರ್ಧರಿಸಲು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡದ ಯಂತ್ರ ಕಲಿಕೆ ಅಲ್ಗಾರಿದಮ್ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ನೀವು ಡೇಟಾವನ್ನು ವಿಭಾಗಿಸಬಹುದು.
ಹಲವಾರು ಪ್ರಾಯೋಗಿಕ ಅನ್ವಯಗಳಿವೆ, ಮತ್ತು ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳು, ಎಂಜಿನಿಯರ್ಗಳು ಮತ್ತು ವಾಸ್ತುಶಿಲ್ಪಿಗಳು ನಿಮ್ಮ ಗುರಿಗಳನ್ನು ವ್ಯಾಖ್ಯಾನಿಸಲು ಮತ್ತು ನಿಮ್ಮ ಕಂಪನಿಗೆ ಅನನ್ಯ ML ಪರಿಹಾರಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು ನಿಮಗೆ ಸಹಾಯ ಮಾಡಬಹುದು.
ಪ್ರತ್ಯುತ್ತರ ನೀಡಿ