YOLO ਨਾਲ ਜਾਣ-ਪਛਾਣ: ਰੀਅਲ ਟਾਈਮ ਆਬਜੈਕਟ ਖੋਜ

ਵਿਸ਼ਾ - ਸੂਚੀ[ਛੁਪਾਓ][ਦਿਖਾਓ]

ਤਾਂ, ਯੋਲੋ ਕੀ ਹੈ?
YOLO ਕੰਮ ਕਰ ਰਿਹਾ ਹੈ
YOLO ਦੇ ਵੱਖ-ਵੱਖ ਰੂਪ+-
YOLO ਸੀਮਾਵਾਂ
YOLOv5 ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰੋ
ਸਿੱਟਾ

ਆਬਜੈਕਟ ਖੋਜ ਚਿੱਤਰ ਵਰਗੀਕਰਨ ਦੀ ਇੱਕ ਕਿਸਮ ਹੈ ਜਿਸ ਵਿੱਚ ਇੱਕ ਤੰਤੂ ਨੈੱਟਵਰਕ ਇੱਕ ਚਿੱਤਰ ਵਿੱਚ ਆਈਟਮਾਂ ਦਾ ਅਨੁਮਾਨ ਲਗਾਉਂਦਾ ਹੈ ਅਤੇ ਉਹਨਾਂ ਦੇ ਆਲੇ ਦੁਆਲੇ ਬਾਊਂਡਿੰਗ ਬਾਕਸ ਖਿੱਚਦਾ ਹੈ। ਇੱਕ ਚਿੱਤਰ ਵਿੱਚ ਚੀਜ਼ਾਂ ਦਾ ਪਤਾ ਲਗਾਉਣਾ ਅਤੇ ਸਥਾਨੀਕਰਨ ਕਰਨਾ ਜੋ ਕਲਾਸਾਂ ਦੇ ਇੱਕ ਪ੍ਰੀਸੈਟ ਸੈੱਟ ਦੇ ਅਨੁਕੂਲ ਹੈ ਨੂੰ ਆਬਜੈਕਟ ਖੋਜ ਕਿਹਾ ਜਾਂਦਾ ਹੈ।

ਆਬਜੈਕਟ ਖੋਜ (ਜਿਸ ਨੂੰ ਆਬਜੈਕਟ ਪਛਾਣ ਵਜੋਂ ਵੀ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ) ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਦਾ ਇੱਕ ਖਾਸ ਤੌਰ 'ਤੇ ਮਹੱਤਵਪੂਰਨ ਉਪ-ਡੋਮੇਨ ਹੈ ਕਿਉਂਕਿ ਖੋਜ, ਪਛਾਣ, ਅਤੇ ਸਥਾਨੀਕਰਨ ਵਰਗੇ ਕਾਰਜ ਅਸਲ-ਸੰਸਾਰ ਦੇ ਸੰਦਰਭਾਂ ਵਿੱਚ ਵਿਆਪਕ ਕਾਰਜ ਲੱਭਦੇ ਹਨ।

YOLO ਪਹੁੰਚ ਇਹਨਾਂ ਕੰਮਾਂ ਨੂੰ ਕਰਨ ਵਿੱਚ ਤੁਹਾਡੀ ਮਦਦ ਕਰ ਸਕਦੀ ਹੈ। ਇਸ ਲੇਖ ਵਿੱਚ, ਅਸੀਂ YOLO 'ਤੇ ਇੱਕ ਡੂੰਘਾਈ ਨਾਲ ਵਿਚਾਰ ਕਰਾਂਗੇ, ਜਿਸ ਵਿੱਚ ਇਹ ਕੀ ਹੈ, ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ, ਵੱਖ-ਵੱਖ ਭਿੰਨਤਾਵਾਂ, ਅਤੇ ਹੋਰ ਬਹੁਤ ਕੁਝ ਸ਼ਾਮਲ ਹੈ।

ਤਾਂ, ਯੋਲੋ ਕੀ ਹੈ?

YOLO ਤਸਵੀਰਾਂ ਵਿੱਚ ਅਸਲ-ਸਮੇਂ ਦੀ ਵਸਤੂ ਦੀ ਪਛਾਣ ਅਤੇ ਪਛਾਣ ਲਈ ਇੱਕ ਢੰਗ ਹੈ। ਇਹ ਯੂ ਓਨਲੀ ਵਨ ਵਾਰ ਲਈ ਇੱਕ ਸੰਖੇਪ ਰੂਪ ਹੈ। ਰੈੱਡਮੰਡ ਐਟ ਅਲ. ਨੇ ਇੱਕ ਪੇਪਰ ਵਿੱਚ ਪਹੁੰਚ ਦਾ ਪ੍ਰਸਤਾਵ ਕੀਤਾ ਜੋ ਕਿ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਅਤੇ ਪੈਟਰਨ ਮਾਨਤਾ (CVPR) 'ਤੇ IEEE/CVF ਕਾਨਫਰੰਸ ਵਿੱਚ 2015 ਵਿੱਚ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ ਗਿਆ ਸੀ।

ਪੇਪਰ ਨੂੰ ਓਪਨਸੀਵੀ ਪੀਪਲਜ਼ ਚੁਆਇਸ ਅਵਾਰਡ ਦਿੱਤਾ ਗਿਆ। ਪਿਛਲੀ ਆਬਜੈਕਟ ਪਛਾਣ ਵਿਧੀਆਂ ਦੇ ਉਲਟ, ਜੋ ਖੋਜ ਕਰਨ ਲਈ ਵਰਗੀਕਰਣਾਂ ਨੂੰ ਦੁਬਾਰਾ ਤਿਆਰ ਕਰਦੇ ਹਨ, YOLO ਇੱਕ ਅੰਤ-ਤੋਂ-ਅੰਤ ਦੀ ਵਰਤੋਂ ਦਾ ਪ੍ਰਸਤਾਵ ਕਰਦਾ ਹੈ ਨਿਊਰਲ ਨੈਟਵਰਕ ਜੋ ਕਿ ਬਾਊਂਡਿੰਗ ਬਾਕਸ ਅਤੇ ਕਲਾਸ ਪ੍ਰੋਬੇਬਿਲਿਟੀਜ਼ ਦੀ ਇੱਕੋ ਸਮੇਂ ਭਵਿੱਖਬਾਣੀ ਕਰਦਾ ਹੈ।

YOLO ਵਸਤੂ ਪਛਾਣ ਲਈ ਬੁਨਿਆਦੀ ਤੌਰ 'ਤੇ ਨਵੀਂ ਪਹੁੰਚ ਅਪਣਾ ਕੇ, ਪਿਛਲੀਆਂ ਰੀਅਲ-ਟਾਈਮ ਵਸਤੂ ਖੋਜ ਵਿਧੀਆਂ ਨੂੰ ਆਸਾਨੀ ਨਾਲ ਪਛਾੜ ਕੇ ਅਤਿ-ਆਧੁਨਿਕ ਨਤੀਜੇ ਪੇਸ਼ ਕਰਦਾ ਹੈ।

YOLO ਕੰਮ ਕਰ ਰਿਹਾ ਹੈ

YOLO ਵਿਧੀ ਤਸਵੀਰ ਨੂੰ N ਗਰਿੱਡਾਂ ਵਿੱਚ ਵੰਡਦੀ ਹੈ, ਹਰ ਇੱਕ ਬਰਾਬਰ ਆਕਾਰ ਦੇ SxS ਅਯਾਮੀ ਸੈਕਟਰ ਨਾਲ। ਇਹਨਾਂ ਵਿੱਚੋਂ ਹਰ ਇੱਕ N ਗਰਿੱਡ ਉਸ ਵਸਤੂ ਨੂੰ ਖੋਜਣ ਅਤੇ ਲੱਭਣ ਦਾ ਇੰਚਾਰਜ ਹੈ ਜੋ ਇਸ ਵਿੱਚ ਹੈ।

ਯੋਲੋ ਆਰਕੀਟੈਕਚਰ

ਇਹ ਗਰਿੱਡ, ਬਦਲੇ ਵਿੱਚ, ਸੈੱਲ ਕੋਆਰਡੀਨੇਟਸ ਦੇ ਨਾਲ-ਨਾਲ ਆਈਟਮ ਦਾ ਨਾਮ ਅਤੇ ਸੈੱਲ ਵਿੱਚ ਮੌਜੂਦ ਆਬਜੈਕਟ ਦੀ ਸੰਭਾਵਨਾ ਦੇ ਅਨੁਸਾਰ B ਬਾਊਂਡਿੰਗ ਬਾਕਸ ਕੋਆਰਡੀਨੇਟਸ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਦੇ ਹਨ। ਭਿੰਨ-ਭਿੰਨ ਬਾਉਂਡਿੰਗ ਬਾਕਸ ਪੂਰਵ-ਅਨੁਮਾਨਾਂ ਦੇ ਨਾਲ ਇੱਕੋ ਆਈਟਮ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਵਾਲੇ ਬਹੁਤ ਸਾਰੇ ਸੈੱਲਾਂ ਦੇ ਕਾਰਨ, ਇਹ ਤਕਨੀਕ ਗਣਨਾ ਨੂੰ ਕਾਫ਼ੀ ਘਟਾਉਂਦੀ ਹੈ ਕਿਉਂਕਿ ਖੋਜ ਅਤੇ ਮਾਨਤਾ ਦੋਵਾਂ ਨੂੰ ਤਸਵੀਰ ਦੇ ਸੈੱਲਾਂ ਦੁਆਰਾ ਸੰਭਾਲਿਆ ਜਾਂਦਾ ਹੈ।

ਹਾਲਾਂਕਿ, ਇਹ ਬਹੁਤ ਸਾਰੀਆਂ ਡੁਪਲੀਕੇਟ ਭਵਿੱਖਬਾਣੀਆਂ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਇਸ ਸਮੱਸਿਆ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ, YOLO ਗੈਰ-ਵੱਧ ਤੋਂ ਵੱਧ ਦਮਨ ਵਰਤਦਾ ਹੈ। YOLO ਗੈਰ-ਅਧਿਕਤਮ ਦਮਨ ਵਿੱਚ ਘੱਟ ਸੰਭਾਵਨਾ ਸਕੋਰਾਂ ਦੇ ਨਾਲ ਸਾਰੇ ਬਾਊਂਡਿੰਗ ਬਾਕਸ ਨੂੰ ਦਬਾ ਦਿੰਦਾ ਹੈ।

YOLO ਇਹ ਹਰੇਕ ਵਿਕਲਪ ਨਾਲ ਜੁੜੇ ਸੰਭਾਵੀ ਸਕੋਰਾਂ ਦੀ ਜਾਂਚ ਕਰਕੇ ਅਤੇ ਉੱਚਤਮ ਸਕੋਰ ਵਾਲੇ ਇੱਕ ਨੂੰ ਚੁਣ ਕੇ ਕਰਦਾ ਹੈ। ਮੌਜੂਦਾ ਉੱਚ ਸੰਭਾਵਨਾ ਬਾਉਂਡਿੰਗ ਬਾਕਸ ਦੇ ਨਾਲ ਯੂਨੀਅਨ ਉੱਤੇ ਸਭ ਤੋਂ ਵੱਡੇ ਇੰਟਰਸੈਕਸ਼ਨ ਵਾਲੇ ਬਾਊਂਡਿੰਗ ਬਾਕਸ ਫਿਰ ਦਬਾ ਦਿੱਤੇ ਜਾਂਦੇ ਹਨ।

YOLO ਕੰਮ ਕਰ ਰਿਹਾ ਹੈ

ਇਹ ਪ੍ਰਕਿਰਿਆ ਉਦੋਂ ਤੱਕ ਜਾਰੀ ਰਹਿੰਦੀ ਹੈ ਜਦੋਂ ਤੱਕ ਬਾਊਂਡਿੰਗ ਬਾਕਸ ਪੂਰੇ ਨਹੀਂ ਹੋ ਜਾਂਦੇ।

YOLO ਦੇ ਵੱਖ-ਵੱਖ ਰੂਪ

ਅਸੀਂ ਕੁਝ ਸਭ ਤੋਂ ਆਮ YOLO ਸੰਸਕਰਣਾਂ ਨੂੰ ਦੇਖਾਂਗੇ। ਆਓ ਸ਼ੁਰੂ ਕਰੀਏ।

1. YOLOv1

ਸ਼ੁਰੂਆਤੀ YOLO ਸੰਸਕਰਣ ਦੀ ਘੋਸ਼ਣਾ 2015 ਵਿੱਚ ਪ੍ਰਕਾਸ਼ਨ ਵਿੱਚ ਕੀਤੀ ਗਈ ਸੀ "ਤੁਸੀਂ ਸਿਰਫ਼ ਇੱਕ ਵਾਰ ਦੇਖੋ: ਯੂਨੀਫਾਈਡ, ਰੀਅਲ-ਟਾਈਮ ਆਬਜੈਕਟ ਖੋਜ"ਜੋਸੇਫ ਰੈਡਮਨ, ਸੰਤੋਸ਼ ਦਿਵਵਾਲਾ, ਰੌਸ ਗਿਰਸ਼ਿਕ, ਅਤੇ ਅਲੀ ਫਰਹਾਦੀ ਦੁਆਰਾ।

ਆਪਣੀ ਗਤੀ, ਸ਼ੁੱਧਤਾ, ਅਤੇ ਸਿੱਖਣ ਦੀ ਯੋਗਤਾ ਦੇ ਕਾਰਨ, YOLO ਨੇ ਵਸਤੂ ਪਛਾਣ ਦੇ ਖੇਤਰ ਵਿੱਚ ਤੇਜ਼ੀ ਨਾਲ ਹਾਵੀ ਹੋ ਗਿਆ ਅਤੇ ਸਭ ਤੋਂ ਵੱਧ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਐਲਗੋਰਿਦਮ ਬਣ ਗਿਆ। ਆਬਜੈਕਟ ਖੋਜ ਨੂੰ ਇੱਕ ਵਰਗੀਕਰਨ ਮੁੱਦੇ ਵਜੋਂ ਸੰਬੋਧਿਤ ਕਰਨ ਦੀ ਬਜਾਏ, ਲੇਖਕਾਂ ਨੇ ਇਸ ਨੂੰ ਭੂਗੋਲਿਕ ਤੌਰ 'ਤੇ ਵੱਖ ਕੀਤੇ ਬਾਊਂਡਿੰਗ ਬਾਕਸਾਂ ਅਤੇ ਸੰਬੰਧਿਤ ਕਲਾਸ ਸੰਭਾਵਨਾਵਾਂ ਦੇ ਨਾਲ ਇੱਕ ਰਿਗਰੈਸ਼ਨ ਸਮੱਸਿਆ ਦੇ ਰੂਪ ਵਿੱਚ ਸੰਪਰਕ ਕੀਤਾ, ਜਿਸ ਨੂੰ ਉਹਨਾਂ ਨੇ ਇੱਕ ਸਿੰਗਲ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਹੱਲ ਕੀਤਾ। ਨਿਊਰਲ ਨੈਟਵਰਕ.

ਯੋਲੋਵ 1

YOLOv1 ਨੇ ਰੀਅਲ-ਟਾਈਮ ਵਿੱਚ 45 ਫ੍ਰੇਮ ਪ੍ਰਤੀ ਸਕਿੰਟ 'ਤੇ ਫੋਟੋਆਂ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕੀਤਾ, ਜਦੋਂ ਕਿ ਇੱਕ ਛੋਟਾ ਰੂਪ, ਫਾਸਟ ਯੋਲੋ, 155 ਫਰੇਮ ਪ੍ਰਤੀ ਸਕਿੰਟ 'ਤੇ ਪ੍ਰੋਸੈਸ ਕੀਤਾ ਗਿਆ ਅਤੇ ਫਿਰ ਵੀ ਦੂਜੇ ਰੀਅਲ-ਟਾਈਮ ਡਿਟੈਕਟਰਾਂ ਤੋਂ ਦੁੱਗਣਾ mAP ਪ੍ਰਾਪਤ ਕੀਤਾ।

2. YOLOv2

ਇੱਕ ਸਾਲ ਬਾਅਦ, 2016 ਵਿੱਚ, ਜੋਸਫ਼ ਰੇਡਮੋਨ ਅਤੇ ਅਲੀ ਫਰਹਾਦੀ ਨੇ ਪੇਪਰ ਵਿੱਚ YOLOv2 (ਯੋਲੋ 9000 ਵਜੋਂ ਵੀ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ) ਜਾਰੀ ਕੀਤਾ।YOLO9000: ਬਿਹਤਰ, ਤੇਜ਼, ਮਜ਼ਬੂਤ. "

ਰੀਅਲ-ਟਾਈਮ ਵਿੱਚ ਚੱਲਦੇ ਹੋਏ ਵੀ 9000 ਵੱਖਰੀਆਂ ਆਈਟਮਾਂ ਸ਼੍ਰੇਣੀਆਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਦੀ ਮਾਡਲ ਦੀ ਸਮਰੱਥਾ ਨੇ ਇਸਨੂੰ 9000 ਦਾ ਅਹੁਦਾ ਹਾਸਲ ਕੀਤਾ। ਨਾ ਸਿਰਫ਼ ਨਵੇਂ ਮਾਡਲ ਸੰਸਕਰਣ ਨੂੰ ਇੱਕੋ ਸਮੇਂ ਵਸਤੂ ਖੋਜ ਅਤੇ ਵਰਗੀਕਰਨ ਡੇਟਾਸੈਟਾਂ 'ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ, ਸਗੋਂ ਇਸ ਨੂੰ ਨਵੀਂ ਬੇਸਲਾਈਨ ਵਜੋਂ ਡਾਰਕਨੈੱਟ-19 ਵੀ ਮਿਲਿਆ। ਮਾਡਲ.

ਯੋਲੋਵ 2

ਕਿਉਂਕਿ YOLOv2 ਵੀ ਇੱਕ ਵੱਡੀ ਸਫਲਤਾ ਸੀ ਅਤੇ ਜਲਦੀ ਹੀ ਅਗਲਾ ਅਤਿ-ਆਧੁਨਿਕ ਵਸਤੂ ਪਛਾਣ ਮਾਡਲ ਬਣ ਗਿਆ, ਦੂਜੇ ਇੰਜੀਨੀਅਰਾਂ ਨੇ ਐਲਗੋਰਿਦਮ ਨਾਲ ਪ੍ਰਯੋਗ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤਾ ਅਤੇ ਆਪਣੇ ਖੁਦ ਦੇ, ਵਿਲੱਖਣ YOLO ਸੰਸਕਰਣ ਤਿਆਰ ਕੀਤੇ। ਉਹਨਾਂ ਵਿੱਚੋਂ ਕੁਝ ਦੀ ਪੇਪਰ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਬਿੰਦੂਆਂ 'ਤੇ ਚਰਚਾ ਕੀਤੀ ਜਾਵੇਗੀ।

3. YOLOv3

ਪੇਪਰ ਵਿੱਚ "YOLOv3: ਇੱਕ ਵਧਿਆ ਹੋਇਆ ਸੁਧਾਰ,” ਜੋਸੇਫ ਰੈਡਮਨ ਅਤੇ ਅਲੀ ਫਰਹਾਦੀ ਨੇ 2018 ਵਿੱਚ ਐਲਗੋਰਿਦਮ ਦਾ ਇੱਕ ਨਵਾਂ ਸੰਸਕਰਣ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ। ਇਹ ਡਾਰਕਨੈੱਟ-53 ਆਰਕੀਟੈਕਚਰ ਉੱਤੇ ਬਣਾਇਆ ਗਿਆ ਸੀ। ਸੁਤੰਤਰ ਲੌਜਿਸਟਿਕ ਵਰਗੀਕਰਣਾਂ ਨੇ YOLOv3 ਵਿੱਚ ਸੌਫਟਮੈਕਸ ਐਕਟੀਵੇਸ਼ਨ ਵਿਧੀ ਨੂੰ ਬਦਲ ਦਿੱਤਾ ਹੈ।

ਸਿਖਲਾਈ ਦੌਰਾਨ ਬਾਈਨਰੀ ਕਰਾਸ-ਐਂਟ੍ਰੋਪੀ ਨੁਕਸਾਨ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਗਈ ਸੀ। ਡਾਰਕਨੈੱਟ-19 ਨੂੰ ਵਧਾਇਆ ਗਿਆ ਅਤੇ ਇਸਨੂੰ ਡਾਰਕਨੈੱਟ-53 ਦਾ ਨਾਮ ਦਿੱਤਾ ਗਿਆ, ਜਿਸ ਵਿੱਚ ਹੁਣ 53 ਕਨਵੋਲਿਊਸ਼ਨਲ ਲੇਅਰ ਹਨ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਭਵਿੱਖਬਾਣੀਆਂ ਤਿੰਨ ਵੱਖ-ਵੱਖ ਪੈਮਾਨਿਆਂ 'ਤੇ ਕੀਤੀਆਂ ਗਈਆਂ ਸਨ, ਜਿਨ੍ਹਾਂ ਨੇ ਛੋਟੀਆਂ ਚੀਜ਼ਾਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਵਿੱਚ YOLOv3 ਦੀ ਸ਼ੁੱਧਤਾ ਨੂੰ ਵਧਾਉਣ ਵਿੱਚ ਮਦਦ ਕੀਤੀ।

ਯੋਲੋਵ 3

YOLOv3 ਜੋਸੇਫ ਰੈੱਡਮੋਨ ਦਾ ਅੰਤਮ YOLO ਸੰਸਕਰਣ ਸੀ, ਕਿਉਂਕਿ ਉਸਨੇ ਆਪਣੇ ਕੰਮ ਦੇ ਵਿਸ਼ਵ 'ਤੇ ਨੁਕਸਾਨਦੇਹ ਪ੍ਰਭਾਵ ਤੋਂ ਬਚਣ ਲਈ ਕਿਸੇ ਹੋਰ YOLO ਸੁਧਾਰਾਂ (ਜਾਂ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਖੇਤਰ ਵਿੱਚ ਵੀ) 'ਤੇ ਕੰਮ ਨਾ ਕਰਨ ਦੀ ਚੋਣ ਕੀਤੀ। ਇਹ ਹੁਣ ਜ਼ਿਆਦਾਤਰ ਵਿਲੱਖਣ ਆਬਜੈਕਟ-ਖੋਜ ਆਰਕੀਟੈਕਚਰ ਬਣਾਉਣ ਲਈ ਸ਼ੁਰੂਆਤੀ ਬਿੰਦੂ ਵਜੋਂ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ।

4. ਯੋਲੋਵ4

ਅਲੈਕਸੀ ਬੋਚਕੋਵਸਕੀ, ਚਿਏਨ-ਯਾਓ ਵੈਂਗ, ਅਤੇ ਹਾਂਗ-ਯੁਆਨ ਮਾਰਕ ਲਿਆਓ ਨੇ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ "YOLOv4: ਵਸਤੂ ਖੋਜਣ ਦੀ ਅਨੁਕੂਲ ਗਤੀ ਅਤੇ ਸ਼ੁੱਧਤਾ” ਅਪ੍ਰੈਲ 2020 ਵਿੱਚ, ਜੋ ਕਿ YOLO ਐਲਗੋਰਿਦਮ ਦਾ ਚੌਥਾ ਦੁਹਰਾਓ ਸੀ।

SPDarknet53 ਆਰਕੀਟੈਕਚਰ ਦੇ ਹਿੱਸੇ ਵਜੋਂ ਵਜ਼ਨ ਵਾਲੇ ਬਚੇ ਕੁਨੈਕਸ਼ਨ, ਕਰਾਸ-ਸਟੇਜ-ਅੰਸ਼ਕ ਕੁਨੈਕਸ਼ਨ, ਕਰਾਸ ਮਿੰਨੀ-ਬੈਚ ਸਧਾਰਣਕਰਨ, ਸਵੈ-ਵਿਰੋਧੀ ਸਿਖਲਾਈ, ਮਿਸ਼ ਐਕਟੀਵੇਸ਼ਨ, ਡ੍ਰੌਪ ਬਲਾਕ, ਅਤੇ CIoU ਨੁਕਸਾਨ ਨੂੰ ਪੇਸ਼ ਕੀਤਾ ਗਿਆ ਸੀ।

ਯੋਲੋਵ 4

YOLOv4 YOLO ਪਰਿਵਾਰ ਦਾ ਇੱਕ ਵੰਸ਼ਜ ਹੈ, ਹਾਲਾਂਕਿ, ਇਸਨੂੰ ਵੱਖਰੇ ਵਿਗਿਆਨੀਆਂ ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਸੀ (ਜੋਸਫ ਰੈਡਮਨ ਅਤੇ ਅਲੀ ਫਰਹਾਦੀ ਨਹੀਂ)। SPDarknet53 ਬੈਕਬੋਨ, ਸਥਾਨਿਕ ਪਿਰਾਮਿਡ ਪੂਲਿੰਗ, ਗਰਦਨ ਦੇ ਤੌਰ 'ਤੇ PANet ਪਾਥ-ਏਗਰੀਗੇਸ਼ਨ, ਅਤੇ YOLOv3 ਹੈੱਡ ਇਸਦੀ ਆਰਕੀਟੈਕਚਰ ਬਣਾਉਂਦੇ ਹਨ।

ਨਤੀਜੇ ਵਜੋਂ, ਜਦੋਂ ਇਸਦੇ ਮਾਤਾ-ਪਿਤਾ ਨਾਲ ਤੁਲਨਾ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, YOLOv3, YOLOv4 10% ਉੱਚ ਔਸਤ ਸ਼ੁੱਧਤਾ ਅਤੇ 12% ਬਿਹਤਰ ਫਰੇਮ ਪ੍ਰਤੀ ਸਕਿੰਟ ਮੈਟ੍ਰਿਕਸ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ।

5. YOLOv5

ਯੋਲੋਵ 5 ਇੱਕ ਓਪਨ-ਸੋਰਸ ਪ੍ਰੋਜੈਕਟ ਹੈ ਜਿਸ ਵਿੱਚ YOLO ਮਾਡਲ ਦੇ ਆਧਾਰ 'ਤੇ ਵਸਤੂ ਪਛਾਣ ਮਾਡਲ ਅਤੇ ਐਲਗੋਰਿਦਮ ਦੀ ਇੱਕ ਸ਼੍ਰੇਣੀ ਸ਼ਾਮਲ ਹੈ ਜੋ COCO ਡੇਟਾਸੈਟ 'ਤੇ ਪ੍ਰੀ-ਟ੍ਰੇਨ ਕੀਤਾ ਗਿਆ ਹੈ।

YOLOv5 ਮਿਸ਼ਰਿਤ-ਸਕੇਲ ਆਬਜੈਕਟ ਪਛਾਣ ਮਾਡਲਾਂ ਦਾ ਸੰਗ੍ਰਹਿ ਹੈ TTA, ਮਾਡਲ ਅਸੈਂਬਲੀ, ਹਾਈਪਰਪੈਰਾਮੀਟਰ ਵਿਕਾਸ, ਅਤੇ ONNX, CoreML, ਅਤੇ TFLite ਨੂੰ ਨਿਰਯਾਤ ਲਈ ਆਸਾਨ ਸਮਰੱਥਾਵਾਂ ਦੇ ਨਾਲ COCO ਡੇਟਾਸੈਟ 'ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਹੈ। ਕਿਉਂਕਿ YOLOv5 ਕਿਸੇ ਵਿਲੱਖਣ ਪਹੁੰਚ ਨੂੰ ਲਾਗੂ ਜਾਂ ਵਿਕਸਤ ਨਹੀਂ ਕਰਦਾ ਹੈ, ਇਸ ਲਈ ਰਸਮੀ ਕਾਗਜ਼ ਜਾਰੀ ਨਹੀਂ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਇਹ ਸਿਰਫ਼ YOLOv3 ਦਾ PyTorch ਐਕਸਟੈਂਸ਼ਨ ਹੈ।

YOLOv5 ਪਰਿਵਰਤਨ

ਅਲਟ੍ਰਾਨੈਟਿਕਸ ਨੇ ਆਪਣੀ ਸਪਾਂਸਰਸ਼ਿਪ ਦੇ ਅਧੀਨ "ਨਵੇਂ ਯੋਲੋ" ਸੰਸਕਰਣ ਦਾ ਪ੍ਰਚਾਰ ਕਰਨ ਲਈ ਇਸ ਦ੍ਰਿਸ਼ ਦੀ ਵਰਤੋਂ ਕੀਤੀ। ਕਿਉਂਕਿ ਇੱਥੇ ਪੰਜ ਪ੍ਰੀ-ਟ੍ਰੇਂਡ ਮਾਡਲ ਵੀ ਪਹੁੰਚਯੋਗ ਹਨ, YOLOv5 ਹੋਮਪੇਜ ਕਾਫ਼ੀ ਸਿੱਧਾ ਅਤੇ ਪੇਸ਼ੇਵਰ ਤੌਰ 'ਤੇ ਢਾਂਚਾਗਤ ਅਤੇ ਲਿਖਿਆ ਗਿਆ ਹੈ, ਜਿਸ ਵਿੱਚ ਸਿਖਲਾਈ ਅਤੇ YOLOv5 ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਬਾਰੇ ਬਹੁਤ ਸਾਰੇ ਪਾਠ ਅਤੇ ਸੁਝਾਅ ਹਨ।

YOLOv5 ਸਪੀਡ

YOLO ਸੀਮਾਵਾਂ

ਹਾਲਾਂਕਿ YOLO ਹੱਲ ਕਰਨ ਲਈ ਸਭ ਤੋਂ ਵੱਡੀ ਤਕਨੀਕ ਜਾਪਦੀ ਹੈ ਵਸਤੂ ਖੋਜ ਸਮੱਸਿਆਵਾਂ, ਇਸ ਦੀਆਂ ਕਈ ਕਮੀਆਂ ਹਨ। ਕਿਉਂਕਿ ਹਰੇਕ ਗਰਿੱਡ ਸਿਰਫ਼ ਇੱਕ ਆਈਟਮ ਦੀ ਪਛਾਣ ਕਰ ਸਕਦਾ ਹੈ, YOLO ਨੂੰ ਸਮੂਹਾਂ ਵਿੱਚ ਹੋਣ ਵਾਲੀਆਂ ਤਸਵੀਰਾਂ ਵਿੱਚ ਛੋਟੀਆਂ ਚੀਜ਼ਾਂ ਨੂੰ ਖੋਜਣ ਅਤੇ ਵੱਖ ਕਰਨ ਵਿੱਚ ਮੁਸ਼ਕਲ ਆਉਂਦੀ ਹੈ। ਝੁੰਡਾਂ ਵਿੱਚ ਛੋਟੀਆਂ ਚੀਜ਼ਾਂ, ਜਿਵੇਂ ਕਿ ਕੀੜੀਆਂ ਦਾ ਝੁੰਡ, ਯੋਲੋ ਲਈ ਪਛਾਣਨਾ ਅਤੇ ਲੱਭਣਾ ਮੁਸ਼ਕਲ ਹੁੰਦਾ ਹੈ।

ਜਦੋਂ ਫਾਸਟ RCNN ਵਰਗੀਆਂ ਮਹੱਤਵਪੂਰਨ ਤੌਰ 'ਤੇ ਹੌਲੀ ਆਬਜੈਕਟ ਪਛਾਣ ਵਿਧੀਆਂ ਨਾਲ ਤੁਲਨਾ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਤਾਂ YOLO ਵੀ ਘੱਟ ਸ਼ੁੱਧਤਾ ਦੁਆਰਾ ਦਰਸਾਇਆ ਜਾਂਦਾ ਹੈ।

YOLOv5 ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰੋ

ਜੇਕਰ ਤੁਸੀਂ ਇੱਕ YOLOv5 ਨੂੰ ਐਕਸ਼ਨ ਵਿੱਚ ਦੇਖਣ ਵਿੱਚ ਦਿਲਚਸਪੀ ਰੱਖਦੇ ਹੋ, ਤਾਂ ਦੇਖੋ ਅਧਿਕਾਰਤ GitHub ਅਤੇ PyTorch ਵਿੱਚ YOLOv5.

ਸਿੱਟਾ

YOLOv5 ਦਾ ਸ਼ੁਰੂਆਤੀ ਸੰਸਕਰਣ ਬਹੁਤ ਤੇਜ਼, ਕਾਰਜਕੁਸ਼ਲ, ਅਤੇ ਵਰਤੋਂ ਵਿੱਚ ਆਸਾਨ ਹੈ। ਜਦੋਂ ਕਿ YOLOv5 YOLO ਪਰਿਵਾਰ ਵਿੱਚ ਕੋਈ ਨਵਾਂ ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ ਨਹੀਂ ਜੋੜਦਾ ਹੈ, ਇਹ ਇੱਕ ਨਵਾਂ PyTorch ਸਿਖਲਾਈ ਅਤੇ ਤੈਨਾਤੀ ਫਰੇਮਵਰਕ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ ਜੋ ਆਬਜੈਕਟ ਖੋਜਕਰਤਾਵਾਂ ਲਈ ਕਲਾ ਦੀ ਸਥਿਤੀ ਨੂੰ ਵਧਾਉਂਦਾ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, YOLOv5 ਬਹੁਤ ਉਪਭੋਗਤਾ-ਅਨੁਕੂਲ ਹੈ ਅਤੇ "ਬਾਕਸ ਤੋਂ ਬਾਹਰ" ਬੇਸਪੋਕ ਵਸਤੂਆਂ 'ਤੇ ਵਰਤਣ ਲਈ ਤਿਆਰ ਹੈ।

ਯੋਲੋ ਦੀ ਜਾਣ-ਪਛਾਣ: ਰੀਅਲ ਟਾਈਮ ਆਬਜੈਕਟ ਖੋਜ

ਤਾਂ, ਯੋਲੋ ਕੀ ਹੈ?

YOLO ਕੰਮ ਕਰ ਰਿਹਾ ਹੈ