ಆಬ್ಜೆಕ್ಟ್ ಡಿಟೆಕ್ಷನ್ ಎನ್ನುವುದು ಚಿತ್ರದ ವರ್ಗೀಕರಣದ ಒಂದು ವಿಧವಾಗಿದೆ, ಇದರಲ್ಲಿ ನರಗಳ ಜಾಲವು ಚಿತ್ರದಲ್ಲಿನ ಐಟಂಗಳನ್ನು ನಿರೀಕ್ಷಿಸುತ್ತದೆ ಮತ್ತು ಅವುಗಳ ಸುತ್ತಲೂ ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ಗಳನ್ನು ಸೆಳೆಯುತ್ತದೆ. ಪೂರ್ವನಿಗದಿಪಡಿಸಿದ ವರ್ಗಗಳ ಸೆಟ್ಗೆ ಅನುಗುಣವಾಗಿ ಚಿತ್ರದಲ್ಲಿ ವಿಷಯಗಳನ್ನು ಪತ್ತೆಹಚ್ಚುವುದು ಮತ್ತು ಸ್ಥಳೀಕರಿಸುವುದನ್ನು ಆಬ್ಜೆಕ್ಟ್ ಡಿಟೆಕ್ಷನ್ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ.
ಆಬ್ಜೆಕ್ಟ್ ಡಿಟೆಕ್ಷನ್ (ಆಬ್ಜೆಕ್ಟ್ ರೆಕಗ್ನಿಷನ್ ಎಂದೂ ಕರೆಯುತ್ತಾರೆ) ಕಂಪ್ಯೂಟರ್ ವಿಷನ್ನ ನಿರ್ದಿಷ್ಟವಾಗಿ ಮಹತ್ವದ ಸಬ್ಡೊಮೇನ್ ಆಗಿದೆ ಏಕೆಂದರೆ ಪತ್ತೆಹಚ್ಚುವಿಕೆ, ಗುರುತಿಸುವಿಕೆ ಮತ್ತು ಸ್ಥಳೀಕರಣದಂತಹ ಕಾರ್ಯಗಳು ನೈಜ-ಪ್ರಪಂಚದ ಸಂದರ್ಭಗಳಲ್ಲಿ ವಿಶಾಲವಾದ ಅನ್ವಯವನ್ನು ಕಂಡುಕೊಳ್ಳುತ್ತವೆ.
YOLO ವಿಧಾನವು ಈ ಕಾರ್ಯಗಳನ್ನು ಮಾಡಲು ನಿಮಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಈ ಪ್ರಬಂಧದಲ್ಲಿ, YOLO ಏನು, ಅದು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ, ವಿಭಿನ್ನ ಬದಲಾವಣೆಗಳು ಮತ್ತು ಹೆಚ್ಚಿನವುಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ನಾವು ಅದನ್ನು ಹತ್ತಿರದಿಂದ ನೋಡುತ್ತೇವೆ.
ಹಾಗಾದರೆ, YOLO ಎಂದರೇನು?
YOLO ಛಾಯಾಚಿತ್ರಗಳಲ್ಲಿ ನೈಜ-ಸಮಯದ ವಸ್ತು ಗುರುತಿಸುವಿಕೆ ಮತ್ತು ಗುರುತಿಸುವಿಕೆಗೆ ಒಂದು ವಿಧಾನವಾಗಿದೆ. ಇದು ಯು ಓನ್ಲಿ ಲುಕ್ ಒನ್ಸ್ ಎಂಬುದರ ಸಂಕ್ಷಿಪ್ತ ರೂಪವಾಗಿದೆ. ರೆಡ್ಮಂಡ್ ಮತ್ತು ಇತರರು. ಕಂಪ್ಯೂಟರ್ ವಿಷನ್ ಮತ್ತು ಪ್ಯಾಟರ್ನ್ ರೆಕಗ್ನಿಷನ್ (CVPR) ಕುರಿತ IEEE/CVF ಕಾನ್ಫರೆನ್ಸ್ನಲ್ಲಿ 2015 ರಲ್ಲಿ ಆರಂಭದಲ್ಲಿ ಪ್ರಕಟವಾದ ಕಾಗದದಲ್ಲಿ ವಿಧಾನವನ್ನು ಪ್ರಸ್ತಾಪಿಸಿದರು.
ಓಪನ್ ಸಿವಿ ಪೀಪಲ್ಸ್ ಚಾಯ್ಸ್ ಪ್ರಶಸ್ತಿಯನ್ನು ಪತ್ರಿಕೆಗೆ ನೀಡಲಾಯಿತು. ಹಿಂದಿನ ಆಬ್ಜೆಕ್ಟ್ ಐಡೆಂಟಿಫಿಕೇಶನ್ ವಿಧಾನಗಳಿಗಿಂತ ಭಿನ್ನವಾಗಿ, ಪತ್ತೆ ಮಾಡಲು ವರ್ಗೀಕರಣಗಳನ್ನು ಮರುಬಳಕೆ ಮಾಡಿತು, YOLO ಅಂತ್ಯದಿಂದ ಅಂತ್ಯದ ಬಳಕೆಯನ್ನು ಪ್ರಸ್ತಾಪಿಸುತ್ತದೆ ನರಮಂಡಲ ಅದು ಏಕಕಾಲದಲ್ಲಿ ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ಗಳು ಮತ್ತು ವರ್ಗ ಸಂಭವನೀಯತೆಗಳನ್ನು ಊಹಿಸುತ್ತದೆ.
ವಸ್ತು ಗುರುತಿಸುವಿಕೆಗೆ ಮೂಲಭೂತವಾಗಿ ಹೊಸ ವಿಧಾನವನ್ನು ತೆಗೆದುಕೊಳ್ಳುವ ಮೂಲಕ YOLO ಅತ್ಯಾಧುನಿಕ ಫಲಿತಾಂಶಗಳನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ, ಹಿಂದಿನ ನೈಜ-ಸಮಯದ ವಸ್ತು ಪತ್ತೆ ವಿಧಾನಗಳನ್ನು ಸುಲಭವಾಗಿ ಮೀರಿಸುತ್ತದೆ.
YOLO ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತಿದೆ
YOLO ವಿಧಾನವು ಚಿತ್ರವನ್ನು N ಗ್ರಿಡ್ಗಳಾಗಿ ವಿಭಜಿಸುತ್ತದೆ, ಪ್ರತಿಯೊಂದೂ ಸಮಾನ ಗಾತ್ರದ SxS ಆಯಾಮದ ವಲಯವನ್ನು ಹೊಂದಿರುತ್ತದೆ. ಈ ಪ್ರತಿಯೊಂದು N ಗ್ರಿಡ್ಗಳು ಅದನ್ನು ಒಳಗೊಂಡಿರುವ ವಸ್ತುವನ್ನು ಪತ್ತೆಹಚ್ಚುವ ಮತ್ತು ಪತ್ತೆಹಚ್ಚುವ ಉಸ್ತುವಾರಿಯನ್ನು ಹೊಂದಿರುತ್ತವೆ.
ಈ ಗ್ರಿಡ್ಗಳು, ಪ್ರತಿಯಾಗಿ, ಕೋಶ ನಿರ್ದೇಶಾಂಕಗಳಿಗೆ ಸಂಬಂಧಿಸಿದಂತೆ B ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ ನಿರ್ದೇಶಾಂಕಗಳನ್ನು ಮುನ್ಸೂಚಿಸುತ್ತದೆ, ಹಾಗೆಯೇ ಐಟಂ ಹೆಸರು ಮತ್ತು ಕೋಶದಲ್ಲಿ ಇರುವ ವಸ್ತುವಿನ ಸಂಭವನೀಯತೆ. ವಿವಿಧ ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ ಮುನ್ನೋಟಗಳೊಂದಿಗೆ ಒಂದೇ ಐಟಂ ಅನ್ನು ಊಹಿಸುವ ಅನೇಕ ಕೋಶಗಳ ಕಾರಣದಿಂದಾಗಿ, ಈ ತಂತ್ರವು ಲೆಕ್ಕಾಚಾರವನ್ನು ಗಣನೀಯವಾಗಿ ಕಡಿಮೆ ಮಾಡುತ್ತದೆ ಏಕೆಂದರೆ ಪತ್ತೆ ಮತ್ತು ಗುರುತಿಸುವಿಕೆ ಎರಡನ್ನೂ ಚಿತ್ರದಿಂದ ಕೋಶಗಳಿಂದ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ.
ಆದಾಗ್ಯೂ, ಇದು ಬಹಳಷ್ಟು ನಕಲಿ ಭವಿಷ್ಯವಾಣಿಗಳನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ. ಈ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು, YOLO ನಾನ್-ಮ್ಯಾಕ್ಸಿಮಲ್ ಸಪ್ರೆಶನ್ ಅನ್ನು ಬಳಸುತ್ತದೆ. ಗರಿಷ್ಠವಲ್ಲದ ಸಪ್ರೆಶನ್ನಲ್ಲಿ ಕಡಿಮೆ ಸಂಭವನೀಯತೆ ಸ್ಕೋರ್ಗಳೊಂದಿಗೆ ಎಲ್ಲಾ ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ಗಳನ್ನು YOLO ನಿಗ್ರಹಿಸುತ್ತದೆ.
YOLO ಪ್ರತಿ ಆಯ್ಕೆಯೊಂದಿಗೆ ಲಿಂಕ್ ಮಾಡಲಾದ ಸಂಭವನೀಯತೆ ಸ್ಕೋರ್ಗಳನ್ನು ಪರಿಶೀಲಿಸುವ ಮೂಲಕ ಮತ್ತು ಹೆಚ್ಚಿನ ಸ್ಕೋರ್ನೊಂದಿಗೆ ಒಂದನ್ನು ಆಯ್ಕೆ ಮಾಡುವ ಮೂಲಕ ಇದನ್ನು ಮಾಡುತ್ತದೆ. ಪ್ರಸ್ತುತ ಹೆಚ್ಚಿನ ಸಂಭವನೀಯತೆಯ ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ನೊಂದಿಗೆ ಒಕ್ಕೂಟದ ಮೇಲೆ ದೊಡ್ಡ ಛೇದನವನ್ನು ಹೊಂದಿರುವ ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ಗಳನ್ನು ನಂತರ ನಿಗ್ರಹಿಸಲಾಗುತ್ತದೆ.
ಬೌಂಡಿಂಗ್ ಪೆಟ್ಟಿಗೆಗಳು ಪೂರ್ಣಗೊಳ್ಳುವವರೆಗೆ ಈ ಪ್ರಕ್ರಿಯೆಯು ಮುಂದುವರಿಯುತ್ತದೆ.
YOLO ನ ವಿವಿಧ ಮಾರ್ಪಾಡುಗಳು
ನಾವು ಕೆಲವು ಸಾಮಾನ್ಯ YOLO ಆವೃತ್ತಿಗಳನ್ನು ನೋಡುತ್ತೇವೆ. ನಾವೀಗ ಆರಂಭಿಸೋಣ.
1. YOLOv1
ಆರಂಭಿಕ YOLO ಆವೃತ್ತಿಯನ್ನು 2015 ರಲ್ಲಿ ಪ್ರಕಟಣೆಯಲ್ಲಿ ಘೋಷಿಸಲಾಯಿತು "ನೀವು ಒಮ್ಮೆ ಮಾತ್ರ ನೋಡಿ: ಏಕೀಕೃತ, ನೈಜ-ಸಮಯದ ವಸ್ತು ಪತ್ತೆ” ಜೋಸೆಫ್ ರೆಡ್ಮನ್, ಸಂತೋಷ್ ದಿವ್ವಾಲಾ, ರಾಸ್ ಗಿರ್ಶಿಕ್ ಮತ್ತು ಅಲಿ ಫರ್ಹಾದಿ ಅವರಿಂದ.
ಅದರ ವೇಗ, ನಿಖರತೆ ಮತ್ತು ಕಲಿಕೆಯ ಸಾಮರ್ಥ್ಯದಿಂದಾಗಿ, YOLO ತ್ವರಿತವಾಗಿ ವಸ್ತು ಗುರುತಿಸುವಿಕೆಯ ಪ್ರದೇಶದಲ್ಲಿ ಪ್ರಾಬಲ್ಯ ಸಾಧಿಸಿತು ಮತ್ತು ಹೆಚ್ಚು ವ್ಯಾಪಕವಾಗಿ ಬಳಸುವ ಅಲ್ಗಾರಿದಮ್ ಆಯಿತು. ಆಬ್ಜೆಕ್ಟ್ ಡಿಟೆಕ್ಷನ್ ಅನ್ನು ವರ್ಗೀಕರಣದ ಸಮಸ್ಯೆಯಾಗಿ ಪರಿಹರಿಸುವ ಬದಲು, ಲೇಖಕರು ಭೌಗೋಳಿಕವಾಗಿ ಪ್ರತ್ಯೇಕಿಸಲಾದ ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ಗಳು ಮತ್ತು ಸಂಬಂಧಿತ ವರ್ಗ ಸಂಭವನೀಯತೆಗಳೊಂದಿಗೆ ಹಿಂಜರಿತದ ಸಮಸ್ಯೆಯಾಗಿ ಅದನ್ನು ಸಂಪರ್ಕಿಸಿದರು, ಅದನ್ನು ಅವರು ಒಂದೇ ಬಳಸಿ ಪರಿಹರಿಸಿದರು. ನರಮಂಡಲ.
YOLOv1 ನೈಜ-ಸಮಯದಲ್ಲಿ ಪ್ರತಿ ಸೆಕೆಂಡಿಗೆ 45 ಫ್ರೇಮ್ಗಳಲ್ಲಿ ಫೋಟೋಗಳನ್ನು ಸಂಸ್ಕರಿಸುತ್ತದೆ, ಆದರೆ ಸಣ್ಣ ರೂಪಾಂತರವಾದ ಫಾಸ್ಟ್ YOLO, ಪ್ರತಿ ಸೆಕೆಂಡಿಗೆ 155 ಫ್ರೇಮ್ಗಳಲ್ಲಿ ಸಂಸ್ಕರಿಸಲ್ಪಟ್ಟಿದೆ ಮತ್ತು ಇತರ ನೈಜ-ಸಮಯದ ಡಿಟೆಕ್ಟರ್ಗಳ ಎಂಎಪಿಗಿಂತ ದ್ವಿಗುಣವಾಗಿದೆ.
2. YOLOv2
ಒಂದು ವರ್ಷದ ನಂತರ, 2016 ರಲ್ಲಿ, ಜೋಸೆಫ್ ರೆಡ್ಮನ್ ಮತ್ತು ಅಲಿ ಫರ್ಹಾದಿ ಪತ್ರಿಕೆಯಲ್ಲಿ YOLOv2 (YOLO9000 ಎಂದೂ ಕರೆಯುತ್ತಾರೆ) ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದರು.YOLO9000: ಉತ್ತಮ, ವೇಗವಾಗಿ, ಬಲಶಾಲಿ. "
ನೈಜ ಸಮಯದಲ್ಲಿ ಚಾಲನೆಯಲ್ಲಿರುವಾಗಲೂ ಸಹ 9000 ವಿಭಿನ್ನ ಐಟಂ ವರ್ಗಗಳನ್ನು ಮುನ್ಸೂಚಿಸುವ ಮಾದರಿಯ ಸಾಮರ್ಥ್ಯವು 9000 ಎಂಬ ಹೆಸರನ್ನು ಗಳಿಸಿತು. ಹೊಸ ಮಾದರಿಯ ಆವೃತ್ತಿಯು ಏಕಕಾಲದಲ್ಲಿ ಆಬ್ಜೆಕ್ಟ್ ಡಿಟೆಕ್ಷನ್ ಮತ್ತು ವರ್ಗೀಕರಣದ ಡೇಟಾಸೆಟ್ಗಳ ಮೇಲೆ ತರಬೇತಿ ಪಡೆದಿದೆ, ಆದರೆ ಇದು ಡಾರ್ಕ್ನೆಟ್-19 ಅನ್ನು ಹೊಸ ಬೇಸ್ಲೈನ್ನಂತೆ ಪಡೆದುಕೊಂಡಿದೆ. ಮಾದರಿ.
YOLOv2 ಕೂಡ ಒಂದು ದೊಡ್ಡ ಯಶಸ್ಸನ್ನು ಕಂಡಿತು ಮತ್ತು ಶೀಘ್ರವಾಗಿ ಮುಂದಿನ ಅತ್ಯಾಧುನಿಕ ವಸ್ತು ಗುರುತಿಸುವಿಕೆ ಮಾದರಿಯಾಯಿತು, ಇತರ ಇಂಜಿನಿಯರ್ಗಳು ಅಲ್ಗಾರಿದಮ್ನೊಂದಿಗೆ ಪ್ರಯೋಗ ಮಾಡಲು ಪ್ರಾರಂಭಿಸಿದರು ಮತ್ತು ತಮ್ಮದೇ ಆದ ವಿಶಿಷ್ಟವಾದ YOLO ಆವೃತ್ತಿಗಳನ್ನು ಉತ್ಪಾದಿಸಿದರು. ಅವುಗಳಲ್ಲಿ ಕೆಲವನ್ನು ಪತ್ರಿಕೆಯ ವಿವಿಧ ಹಂತಗಳಲ್ಲಿ ಚರ್ಚಿಸಲಾಗುವುದು.
3. YOLOv3
ಪತ್ರಿಕೆಯಲ್ಲಿ "YOLOv3: ಹೆಚ್ಚುತ್ತಿರುವ ಸುಧಾರಣೆ,” ಜೋಸೆಫ್ ರೆಡ್ಮನ್ ಮತ್ತು ಅಲಿ ಫರ್ಹಾಡಿ ಅವರು 2018 ರಲ್ಲಿ ಅಲ್ಗಾರಿದಮ್ನ ಹೊಸ ಆವೃತ್ತಿಯನ್ನು ಪ್ರಕಟಿಸಿದ್ದಾರೆ. ಇದನ್ನು ಡಾರ್ಕ್ನೆಟ್-53 ಆರ್ಕಿಟೆಕ್ಚರ್ನಲ್ಲಿ ನಿರ್ಮಿಸಲಾಗಿದೆ. ಸ್ವತಂತ್ರ ಲಾಜಿಸ್ಟಿಕ್ ವರ್ಗೀಕರಣಗಳು YOLOv3 ನಲ್ಲಿ ಸಾಫ್ಟ್ಮ್ಯಾಕ್ಸ್ ಸಕ್ರಿಯಗೊಳಿಸುವ ಕಾರ್ಯವಿಧಾನವನ್ನು ಬದಲಾಯಿಸಿದವು.
ತರಬೇತಿ ಸಮಯದಲ್ಲಿ ಬೈನರಿ ಕ್ರಾಸ್-ಎಂಟ್ರೊಪಿ ನಷ್ಟವನ್ನು ಬಳಸಲಾಯಿತು. ಡಾರ್ಕ್ನೆಟ್-19 ಅನ್ನು ವರ್ಧಿಸಲಾಗಿದೆ ಮತ್ತು ಡಾರ್ಕ್ನೆಟ್-53 ಎಂದು ಮರುನಾಮಕರಣ ಮಾಡಲಾಗಿದೆ, ಇದು ಈಗ 53 ಕನ್ವಲ್ಯೂಷನಲ್ ಲೇಯರ್ಗಳನ್ನು ಹೊಂದಿದೆ. ಅದರ ಹೊರತಾಗಿ, ಮುನ್ನೋಟಗಳನ್ನು ಮೂರು ವಿಭಿನ್ನ ಮಾಪಕಗಳಲ್ಲಿ ಮಾಡಲಾಯಿತು, ಇದು YOLOv3 ಸಣ್ಣ ವಿಷಯಗಳನ್ನು ಊಹಿಸುವಲ್ಲಿ ಅದರ ನಿಖರತೆಯನ್ನು ಹೆಚ್ಚಿಸಲು ಸಹಾಯ ಮಾಡಿತು.
YOLOv3 ಜೋಸೆಫ್ ರೆಡ್ಮನ್ನ ಅಂತಿಮ YOLO ಆವೃತ್ತಿಯಾಗಿದೆ, ಏಕೆಂದರೆ ಅವನು ತನ್ನ ಕೆಲಸವು ಪ್ರಪಂಚದ ಮೇಲೆ ಹಾನಿಕಾರಕ ಪ್ರಭಾವವನ್ನು ಬೀರುವುದನ್ನು ತಪ್ಪಿಸಲು ಯಾವುದೇ ಹೆಚ್ಚಿನ YOLO ಸುಧಾರಣೆಗಳಲ್ಲಿ (ಅಥವಾ ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿ ಪ್ರದೇಶದಲ್ಲಿ) ಕೆಲಸ ಮಾಡದಿರಲು ನಿರ್ಧರಿಸಿದನು. ವಿಶಿಷ್ಟವಾದ ವಸ್ತು-ಪತ್ತೆ ವಾಸ್ತುಶಿಲ್ಪಗಳನ್ನು ನಿರ್ಮಿಸಲು ಇದನ್ನು ಈಗ ಹೆಚ್ಚಾಗಿ ಆರಂಭಿಕ ಹಂತವಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ.
4. ಯೋಲೋವ್4
ಅಲೆಕ್ಸಿ ಬೊಚ್ಕೊವ್ಸ್ಕಿ, ಚಿಯೆನ್-ಯಾವೊ ವಾಂಗ್ ಮತ್ತು ಹಾಂಗ್-ಯುವಾನ್ ಮಾರ್ಕ್ ಲಿಯಾವೊ ಪ್ರಕಟಿಸಿದರು "YOLOv4: ಆಬ್ಜೆಕ್ಟ್ ಡಿಟೆಕ್ಷನ್ನ ಅತ್ಯುತ್ತಮ ವೇಗ ಮತ್ತು ನಿಖರತೆ” ಏಪ್ರಿಲ್ 2020 ರಲ್ಲಿ, ಇದು YOLO ಅಲ್ಗಾರಿದಮ್ನ ನಾಲ್ಕನೇ ಪುನರಾವರ್ತನೆಯಾಗಿದೆ.
ತೂಕದ ಉಳಿದ ಸಂಪರ್ಕಗಳು, ಅಡ್ಡ-ಹಂತ-ಭಾಗಶಃ ಸಂಪರ್ಕಗಳು, ಕ್ರಾಸ್ ಮಿನಿ-ಬ್ಯಾಚ್ ಸಾಮಾನ್ಯೀಕರಣ, ಸ್ವಯಂ-ವಿರೋಧಿ ತರಬೇತಿ, ಮಿಶ್ ಸಕ್ರಿಯಗೊಳಿಸುವಿಕೆ, ಡ್ರಾಪ್ ಬ್ಲಾಕ್ ಮತ್ತು CIoU ನಷ್ಟವನ್ನು SPDarknet53 ಆರ್ಕಿಟೆಕ್ಚರ್ನ ಭಾಗವಾಗಿ ಪರಿಚಯಿಸಲಾಗಿದೆ.
YOLOv4 YOLO ಕುಟುಂಬದ ವಂಶಸ್ಥರು, ಆದಾಗ್ಯೂ, ಇದನ್ನು ಪ್ರತ್ಯೇಕ ವಿಜ್ಞಾನಿಗಳು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದಾರೆ (ಜೋಸೆಫ್ ರೆಡ್ಮನ್ ಮತ್ತು ಅಲಿ ಫರ್ಹಾದಿ ಅಲ್ಲ). SPDarknet53 ಬೆನ್ನೆಲುಬು, ಪ್ರಾದೇಶಿಕ ಪಿರಮಿಡ್ ಪೂಲಿಂಗ್, ಕುತ್ತಿಗೆಯಂತೆ PANet ಮಾರ್ಗ-ಒಗ್ಗೂಡಿಸುವಿಕೆ ಮತ್ತು YOLOv3 ಹೆಡ್ ಅದರ ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ರೂಪಿಸುತ್ತದೆ.
ಇದರ ಪರಿಣಾಮವಾಗಿ, ಅದರ ಪೋಷಕ YOLOv3 ಗೆ ಹೋಲಿಸಿದರೆ, YOLOv4 10% ಹೆಚ್ಚಿನ ಸರಾಸರಿ ನಿಖರತೆ ಮತ್ತು 12% ಉತ್ತಮ ಫ್ರೇಮ್ಗಳನ್ನು ಪ್ರತಿ ಸೆಕೆಂಡಿಗೆ ಸಾಧಿಸುತ್ತದೆ.
5. YOLOv5
YOLOv5 COCO ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ಪೂರ್ವ-ತರಬೇತಿ ಪಡೆದ YOLO ಮಾದರಿಯ ಆಧಾರದ ಮೇಲೆ ಆಬ್ಜೆಕ್ಟ್ ಐಡೆಂಟಿಫಿಕೇಶನ್ ಮಾಡೆಲ್ಗಳು ಮತ್ತು ಅಲ್ಗಾರಿದಮ್ಗಳ ವ್ಯಾಪ್ತಿಯನ್ನು ಒಳಗೊಂಡಿರುವ ಓಪನ್ ಸೋರ್ಸ್ ಪ್ರಾಜೆಕ್ಟ್ ಆಗಿದೆ.
YOLOv5 ಎಂಬುದು ಸಂಯುಕ್ತ-ಪ್ರಮಾಣದ ವಸ್ತು ಗುರುತಿಸುವಿಕೆಯ ಮಾದರಿಗಳ ಸಂಗ್ರಹವಾಗಿದೆ TTA, ಮಾಡೆಲ್ ಅಸೆಂಬ್ಲಿ, ಹೈಪರ್ಪ್ಯಾರಾಮೀಟರ್ ಅಭಿವೃದ್ಧಿ ಮತ್ತು ONNX, CoreML ಮತ್ತು TFLite ಗೆ ರಫ್ತು ಮಾಡಲು ಸುಲಭವಾದ ಸಾಮರ್ಥ್ಯಗಳೊಂದಿಗೆ COCO ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ತರಬೇತಿ ನೀಡಲಾಗಿದೆ. YOLOv5 ಯಾವುದೇ ವಿಶಿಷ್ಟ ವಿಧಾನಗಳನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸದ ಅಥವಾ ಅಭಿವೃದ್ಧಿಪಡಿಸದ ಕಾರಣ, ಔಪಚಾರಿಕ ಕಾಗದವನ್ನು ಬಿಡುಗಡೆ ಮಾಡಲು ಸಾಧ್ಯವಾಗಲಿಲ್ಲ. ಇದು ಸರಳವಾಗಿ YOLOv3 ನ PyTorch ವಿಸ್ತರಣೆಯಾಗಿದೆ.
ಅಲ್ಟ್ರಾನಿಟಿಕ್ಸ್ ತನ್ನ ಪ್ರಾಯೋಜಕತ್ವದ ಅಡಿಯಲ್ಲಿ "ಹೊಸ YOLO" ಆವೃತ್ತಿಯನ್ನು ಪ್ರಚಾರ ಮಾಡಲು ಈ ಸನ್ನಿವೇಶವನ್ನು ಬಳಸಿಕೊಂಡಿತು. ಐದು ಪೂರ್ವ-ತರಬೇತಿ ಮಾದರಿಗಳನ್ನು ಸಹ ಪ್ರವೇಶಿಸಬಹುದಾದ ಕಾರಣ, YOLOv5 ಮುಖಪುಟವು ಸಾಕಷ್ಟು ಸರಳವಾಗಿದೆ ಮತ್ತು ವೃತ್ತಿಪರವಾಗಿ ರಚನಾತ್ಮಕವಾಗಿದೆ ಮತ್ತು YOLOv5 ಮಾದರಿಗಳನ್ನು ತರಬೇತಿ ಮತ್ತು ಬಳಸಿಕೊಳ್ಳುವಲ್ಲಿ ಹಲವಾರು ಪಾಠಗಳು ಮತ್ತು ಸಲಹೆಗಳನ್ನು ಹೊಂದಿದೆ.
YOLO ಮಿತಿಗಳು
YOLO ಅನ್ನು ಪರಿಹರಿಸಲು ಉತ್ತಮ ತಂತ್ರವೆಂದು ತೋರುತ್ತದೆಯಾದರೂ ವಸ್ತು ಪತ್ತೆ ಸಮಸ್ಯೆಗಳು, ಇದು ಹಲವಾರು ನ್ಯೂನತೆಗಳನ್ನು ಹೊಂದಿದೆ. ಏಕೆಂದರೆ ಪ್ರತಿಯೊಂದು ಗ್ರಿಡ್ ಒಂದು ಐಟಂ ಅನ್ನು ಮಾತ್ರ ಗುರುತಿಸಬಲ್ಲದು, YOLO ಗೆ ಗುಂಪುಗಳಲ್ಲಿ ಕಂಡುಬರುವ ಚಿತ್ರಗಳಲ್ಲಿ ಚಿಕ್ಕ ವಿಷಯಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಮತ್ತು ಪ್ರತ್ಯೇಕಿಸಲು ಕಷ್ಟವಾಗುತ್ತದೆ. ಇರುವೆಗಳ ಸಮೂಹದಂತಹ ಹಿಂಡುಗಳಲ್ಲಿನ ಸಣ್ಣ ವಸ್ತುಗಳನ್ನು ಗುರುತಿಸಲು ಮತ್ತು ಪತ್ತೆಹಚ್ಚಲು YOLO ಗೆ ಕಷ್ಟವಾಗುತ್ತದೆ.
ವೇಗದ RCNN ನಂತಹ ಗಮನಾರ್ಹವಾಗಿ ನಿಧಾನವಾದ ವಸ್ತು ಗುರುತಿಸುವಿಕೆ ವಿಧಾನಗಳಿಗೆ ಹೋಲಿಸಿದರೆ, YOLO ಅಂತೆಯೇ ಕಡಿಮೆ ನಿಖರತೆಯಿಂದ ನಿರೂಪಿಸಲ್ಪಟ್ಟಿದೆ.
YOLOv5 ಅನ್ನು ಬಳಸಲು ಪ್ರಾರಂಭಿಸಿ
YOLOv5 ಕ್ರಿಯೆಯನ್ನು ನೋಡಲು ನೀವು ಆಸಕ್ತಿ ಹೊಂದಿದ್ದರೆ, ಪರಿಶೀಲಿಸಿ ಅಧಿಕೃತ GitHub ಮತ್ತು PyTorch ನಲ್ಲಿ YOLOv5.
ತೀರ್ಮಾನ
YOLOv5 ನ ಆರಂಭಿಕ ಆವೃತ್ತಿಯು ಅತ್ಯಂತ ತ್ವರಿತ, ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಬಳಸಲು ಸರಳವಾಗಿದೆ. YOLOv5 YOLO ಕುಟುಂಬಕ್ಕೆ ಯಾವುದೇ ಹೊಸ ಮಾದರಿಯ ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ಸೇರಿಸದಿದ್ದರೂ, ಇದು ಹೊಸ PyTorch ತರಬೇತಿ ಮತ್ತು ನಿಯೋಜನೆಯ ಚೌಕಟ್ಟನ್ನು ಒದಗಿಸುತ್ತದೆ ಅದು ವಸ್ತು ಪತ್ತೆಕಾರಕಗಳಿಗೆ ಕಲೆಯ ಸ್ಥಿತಿಯನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ.
ಇದಲ್ಲದೆ, YOLOv5 ಅತ್ಯಂತ ಬಳಕೆದಾರ ಸ್ನೇಹಿಯಾಗಿದೆ ಮತ್ತು ಬೆಸ್ಪೋಕ್ ವಸ್ತುಗಳ ಮೇಲೆ ಬಳಸಲು ಸಿದ್ಧವಾಗಿದೆ.
ಪ್ರತ್ಯುತ್ತರ ನೀಡಿ