ਇਹ ਜਾਣਨਾ ਤਸੱਲੀਬਖਸ਼ ਹੈ ਕਿ ਅਸੀਂ ਰੋਬੋਟਾਂ ਨੂੰ ਉਦਾਹਰਨ ਦੇ ਕੇ ਸਿੱਖਣ ਅਤੇ ਉਹਨਾਂ ਦੇ ਆਲੇ ਦੁਆਲੇ ਨੂੰ ਸਮਝਣ ਦੀ ਸਾਡੀਆਂ ਪੈਦਾਇਸ਼ੀ ਕਾਬਲੀਅਤਾਂ ਨਾਲ ਪ੍ਰਭਾਵਿਤ ਕਰਨ ਵਿੱਚ ਕਾਮਯਾਬ ਰਹੇ ਹਾਂ। ਬੁਨਿਆਦੀ ਚੁਣੌਤੀ ਉਹ ਹੈ ਜੋ ਕੰਪਿਊਟਰਾਂ ਨੂੰ "ਵੇਖਣਾ" ਸਿਖਾਉਂਦੇ ਹਨ ਜਿਵੇਂ ਕਿ ਮਨੁੱਖਾਂ ਨੂੰ ਬਹੁਤ ਜ਼ਿਆਦਾ ਸਮਾਂ ਅਤੇ ਮਿਹਨਤ ਦੀ ਲੋੜ ਹੋਵੇਗੀ।
ਹਾਲਾਂਕਿ, ਜਦੋਂ ਅਸੀਂ ਵਿਹਾਰਕ ਮੁੱਲ 'ਤੇ ਵਿਚਾਰ ਕਰਦੇ ਹਾਂ ਜੋ ਇਹ ਹੁਨਰ ਵਰਤਮਾਨ ਵਿੱਚ ਸੰਸਥਾਵਾਂ ਅਤੇ ਉੱਦਮਾਂ ਨੂੰ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਤਾਂ ਕੋਸ਼ਿਸ਼ ਸਾਰਥਕ ਹੈ। ਇਸ ਲੇਖ ਵਿੱਚ, ਤੁਸੀਂ ਚਿੱਤਰ ਵਰਗੀਕਰਣ, ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ, ਅਤੇ ਇਸਦੇ ਵਿਹਾਰਕ ਲਾਗੂਕਰਨ ਬਾਰੇ ਸਿੱਖੋਗੇ। ਆਓ ਸ਼ੁਰੂ ਕਰੀਏ।
ਚਿੱਤਰ ਵਰਗੀਕਰਨ ਕੀ ਹੈ?
ਇੱਕ ਵਿੱਚ ਇੱਕ ਚਿੱਤਰ ਨੂੰ ਫੀਡ ਕਰਨ ਦਾ ਕੰਮ ਨਿਊਰਲ ਨੈਟਵਰਕ ਅਤੇ ਇਸ ਨੂੰ ਉਸ ਤਸਵੀਰ ਲਈ ਲੇਬਲ ਦੇ ਕੁਝ ਰੂਪ ਦਾ ਆਉਟਪੁੱਟ ਕਰਨਾ ਚਿੱਤਰ ਪਛਾਣ ਵਜੋਂ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ। ਨੈੱਟਵਰਕ ਦਾ ਆਉਟਪੁੱਟ ਲੇਬਲ ਪਹਿਲਾਂ ਤੋਂ ਪਰਿਭਾਸ਼ਿਤ ਕਲਾਸ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੋਵੇਗਾ।
ਤਸਵੀਰ ਲਈ ਕਈ ਕਲਾਸਾਂ ਨਿਰਧਾਰਤ ਕੀਤੀਆਂ ਜਾ ਸਕਦੀਆਂ ਹਨ, ਜਾਂ ਸਿਰਫ਼ ਇੱਕ। ਜਦੋਂ ਸਿਰਫ ਇੱਕ ਸ਼੍ਰੇਣੀ ਹੁੰਦੀ ਹੈ, ਤਾਂ "ਮਾਨਤਾ" ਸ਼ਬਦ ਅਕਸਰ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਜਦੋਂ ਕਈ ਸ਼੍ਰੇਣੀਆਂ ਹੁੰਦੀਆਂ ਹਨ, ਤਾਂ "ਵਰਗੀਕਰਨ" ਸ਼ਬਦ ਅਕਸਰ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ।
ਵਸਤੂ ਖੋਜ ਤਸਵੀਰ ਵਰਗੀਕਰਣ ਦਾ ਇੱਕ ਸਬਸੈੱਟ ਹੈ ਜਿਸ ਵਿੱਚ ਵਸਤੂਆਂ ਦੇ ਖਾਸ ਉਦਾਹਰਨਾਂ ਦਾ ਪਤਾ ਲਗਾਇਆ ਜਾਂਦਾ ਹੈ ਜਿਵੇਂ ਕਿ ਜਾਨਵਰਾਂ, ਵਾਹਨਾਂ, ਜਾਂ ਮਨੁੱਖਾਂ ਵਰਗੀਆਂ ਕਿਸੇ ਖਾਸ ਸ਼੍ਰੇਣੀ ਨਾਲ ਸਬੰਧਤ ਹਨ।
ਚਿੱਤਰ ਵਰਗੀਕਰਨ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ?
ਕੰਪਿਊਟਰ ਦੁਆਰਾ ਪਿਕਸਲ ਦੇ ਰੂਪ ਵਿੱਚ ਇੱਕ ਚਿੱਤਰ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇਹ ਚਿੱਤਰ ਨੂੰ ਮੈਟ੍ਰਿਕਸ ਦੇ ਸੰਗ੍ਰਹਿ ਦੇ ਰੂਪ ਵਿੱਚ ਵਰਤ ਕੇ ਇਸਨੂੰ ਪੂਰਾ ਕਰਦਾ ਹੈ, ਜਿਸਦਾ ਆਕਾਰ ਚਿੱਤਰ ਰੈਜ਼ੋਲੂਸ਼ਨ ਦੁਆਰਾ ਨਿਰਧਾਰਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਸਿੱਧੇ ਤੌਰ 'ਤੇ, ਤਸਵੀਰ ਵਰਗੀਕਰਣ ਕੰਪਿਊਟਰ ਦੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਤੋਂ ਐਲਗੋਰਿਦਮ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਅੰਕੜਾ ਡੇਟਾ ਦਾ ਅਧਿਐਨ ਹੈ।
ਚਿੱਤਰ ਵਰਗੀਕਰਨ ਡਿਜੀਟਲ ਚਿੱਤਰ ਪ੍ਰੋਸੈਸਿੰਗ ਵਿੱਚ ਪਹਿਲਾਂ ਤੋਂ ਨਿਰਧਾਰਤ ਸਮੂਹਾਂ, ਜਾਂ "ਕਲਾਸਾਂ" ਵਿੱਚ ਪਿਕਸਲਾਂ ਨੂੰ ਸਮੂਹਿਕ ਕਰਕੇ ਪੂਰਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਐਲਗੋਰਿਦਮ ਚਿੱਤਰ ਨੂੰ ਧਿਆਨ ਦੇਣ ਯੋਗ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਉਤਰਾਧਿਕਾਰ ਵਿੱਚ ਵੰਡਦੇ ਹਨ, ਜੋ ਅੰਤਮ ਵਰਗੀਕਰਣ ਲਈ ਬੋਝ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ।
ਇਹ ਗੁਣ ਵਰਗੀਕਰਣਕਰਤਾ ਨੂੰ ਚਿੱਤਰ ਦੇ ਅਰਥ ਅਤੇ ਸੰਭਾਵੀ ਵਰਗੀਕਰਨ ਬਾਰੇ ਸੂਚਿਤ ਕਰਦੇ ਹਨ। ਕਿਉਂਕਿ ਤਸਵੀਰ ਨੂੰ ਵਰਗੀਕਰਨ ਕਰਨ ਦੀਆਂ ਬਾਕੀ ਪ੍ਰਕਿਰਿਆਵਾਂ ਇਸ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀਆਂ ਹਨ, ਵਿਸ਼ੇਸ਼ਤਾ ਕੱਢਣ ਦਾ ਤਰੀਕਾ ਸਭ ਤੋਂ ਨਾਜ਼ੁਕ ਪੜਾਅ ਹੈ।
The ਡਾਟਾ ਪ੍ਰਦਾਨ ਕੀਤਾ ਐਲਗੋਰਿਦਮ ਨੂੰ ਚਿੱਤਰ ਵਰਗੀਕਰਣ ਵਿੱਚ ਵੀ ਮਹੱਤਵਪੂਰਨ ਹੈ, ਖਾਸ ਕਰਕੇ ਨਿਰੀਖਣ ਕੀਤੇ ਵਰਗੀਕਰਨ। ਕਲਾਸ ਅਤੇ ਘੱਟ ਤਸਵੀਰ ਅਤੇ ਐਨੋਟੇਸ਼ਨ ਕੁਆਲਿਟੀ ਦੇ ਆਧਾਰ 'ਤੇ ਡਾਟਾ ਅਸੰਤੁਲਨ ਦੇ ਨਾਲ ਇੱਕ ਭਿਆਨਕ ਡੇਟਾਸੈਟ ਦੀ ਤੁਲਨਾ ਵਿੱਚ, ਇੱਕ ਚੰਗੀ ਤਰ੍ਹਾਂ ਅਨੁਕੂਲਿਤ ਵਰਗੀਕਰਨ ਡੇਟਾਸੈਟ ਪ੍ਰਸ਼ੰਸਾਯੋਗ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ।
python ਵਿੱਚ Tensorflow ਅਤੇ Keras ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਚਿੱਤਰ ਵਰਗੀਕਰਨ
ਅਸੀਂ ਦੀ ਵਰਤੋਂ ਕਰਾਂਗੇ CIFAR-10 ਡੇਟਾਸੈਟ (ਜਿਸ ਵਿੱਚ ਹਵਾਈ ਜਹਾਜ਼, ਹਵਾਈ ਜਹਾਜ਼, ਪੰਛੀ ਅਤੇ ਹੋਰ 7 ਚੀਜ਼ਾਂ ਸ਼ਾਮਲ ਹਨ)।
1. ਇੰਸਟਾਲ ਕਰਨ ਦੀਆਂ ਲੋੜਾਂ
ਹੇਠਾਂ ਦਿੱਤਾ ਕੋਡ ਸਾਰੀਆਂ ਸ਼ਰਤਾਂ ਨੂੰ ਸਥਾਪਿਤ ਕਰੇਗਾ।
2. ਆਯਾਤ ਨਿਰਭਰਤਾਵਾਂ
Python ਵਿੱਚ ਇੱਕ train.py ਫਾਈਲ ਬਣਾਓ। ਹੇਠਾਂ ਦਿੱਤਾ ਕੋਡ Tensorflow ਅਤੇ Keras ਨਿਰਭਰਤਾਵਾਂ ਨੂੰ ਆਯਾਤ ਕਰੇਗਾ।
3. ਸ਼ੁਰੂਆਤੀ ਪੈਰਾਮੀਟਰ
CIFAR-10 ਵਿੱਚ ਸਿਰਫ਼ 10 ਚਿੱਤਰ ਸ਼੍ਰੇਣੀਆਂ ਸ਼ਾਮਲ ਹਨ, ਇਸਲਈ ਗਿਣਤੀ ਕਲਾਸਾਂ ਸਿਰਫ਼ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਲਈ ਸ਼੍ਰੇਣੀਆਂ ਦੀ ਸੰਖਿਆ ਦਾ ਹਵਾਲਾ ਦਿੰਦੀਆਂ ਹਨ।
4. ਡੇਟਾਸੈਟ ਲੋਡ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ
ਫੰਕਸ਼ਨ ਡੇਟਾਸੈਟ ਨੂੰ ਲੋਡ ਕਰਨ ਲਈ ਟੈਂਸਰਫਲੋ ਡੇਟਾਸੇਟਸ ਮੋਡੀਊਲ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ, ਅਤੇ ਅਸੀਂ ਇਸ ਬਾਰੇ ਕੁਝ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਜਾਣਕਾਰੀ ਨੂੰ ਸਹੀ 'ਤੇ ਸੈੱਟ ਕਰਦੇ ਹਾਂ। ਤੁਸੀਂ ਇਹ ਦੇਖਣ ਲਈ ਇਸਨੂੰ ਪ੍ਰਿੰਟ ਕਰ ਸਕਦੇ ਹੋ ਕਿ ਖੇਤਰ ਅਤੇ ਉਹਨਾਂ ਦੇ ਮੁੱਲ ਕੀ ਹਨ, ਅਤੇ ਅਸੀਂ ਸਿਖਲਾਈ ਅਤੇ ਟੈਸਟਿੰਗ ਸੈੱਟਾਂ ਵਿੱਚ ਨਮੂਨਿਆਂ ਦੀ ਗਿਣਤੀ ਨੂੰ ਮੁੜ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਜਾਣਕਾਰੀ ਦੀ ਵਰਤੋਂ ਕਰਾਂਗੇ।
5. ਮਾਡਲ ਬਣਾਉਣਾ
ਹੁਣ ਅਸੀਂ ਤਿੰਨ ਲੇਅਰਾਂ ਬਣਾਵਾਂਗੇ, ਹਰ ਇੱਕ ਵਿੱਚ ਮੈਕਸ-ਪੂਲਿੰਗ ਅਤੇ ReLU ਐਕਟੀਵੇਸ਼ਨ ਫੰਕਸ਼ਨ ਦੇ ਨਾਲ ਦੋ ਕਨਵਨੈੱਟ ਸ਼ਾਮਲ ਹੋਣਗੇ, ਇਸਦੇ ਬਾਅਦ ਇੱਕ ਪੂਰੀ ਤਰ੍ਹਾਂ ਜੁੜਿਆ 1024-ਯੂਨਿਟ ਸਿਸਟਮ ਹੋਵੇਗਾ। ResNet50 ਜਾਂ Xception ਦੇ ਮੁਕਾਬਲੇ, ਜੋ ਕਿ ਅਤਿ-ਆਧੁਨਿਕ ਮਾਡਲ ਹਨ, ਇਹ ਮੁਕਾਬਲਤਨ ਛੋਟਾ ਮਾਡਲ ਹੋ ਸਕਦਾ ਹੈ।
6. ਮਾਡਲ ਦੀ ਸਿਖਲਾਈ
ਮੈਂ ਹਰੇਕ ਯੁੱਗ ਵਿੱਚ ਸ਼ੁੱਧਤਾ ਅਤੇ ਨੁਕਸਾਨ ਨੂੰ ਮਾਪਣ ਲਈ ਟੈਂਸਰਬੋਰਡ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਅਤੇ ਡੇਟਾ ਨੂੰ ਆਯਾਤ ਕਰਨ ਅਤੇ ਮਾਡਲ ਬਣਾਉਣ ਤੋਂ ਬਾਅਦ ਸਾਨੂੰ ਇੱਕ ਸੁੰਦਰ ਡਿਸਪਲੇ ਪ੍ਰਦਾਨ ਕੀਤਾ। ਹੇਠ ਦਿੱਤੇ ਕੋਡ ਨੂੰ ਚਲਾਓ; ਤੁਹਾਡੇ CPU/GPU 'ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹੋਏ, ਸਿਖਲਾਈ ਨੂੰ ਕਈ ਮਿੰਟ ਲੱਗਣਗੇ।
ਟੈਂਸਰਬੋਰਡ ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ, ਮੌਜੂਦਾ ਡਾਇਰੈਕਟਰੀ ਵਿੱਚ ਟਰਮੀਨਲ ਜਾਂ ਕਮਾਂਡ ਪ੍ਰੋਂਪਟ ਵਿੱਚ ਸਿਰਫ਼ ਹੇਠਾਂ ਦਿੱਤੀ ਕਮਾਂਡ ਟਾਈਪ ਕਰੋ:
ਤੁਸੀਂ ਦੇਖੋਗੇ ਕਿ ਪ੍ਰਮਾਣਿਕਤਾ ਦਾ ਨੁਕਸਾਨ ਘਟ ਰਿਹਾ ਹੈ ਅਤੇ ਸ਼ੁੱਧਤਾ ਲਗਭਗ 81% ਤੱਕ ਵੱਧ ਰਹੀ ਹੈ। ਇਹ ਸ਼ਾਨਦਾਰ ਹੈ!
ਮਾਡਲ ਦੀ ਜਾਂਚ ਕਰ ਰਿਹਾ ਹੈ
ਜਦੋਂ ਸਿਖਲਾਈ ਖਤਮ ਹੋ ਜਾਂਦੀ ਹੈ, ਅੰਤਮ ਮਾਡਲ ਅਤੇ ਵਜ਼ਨ ਨਤੀਜੇ ਫੋਲਡਰ ਵਿੱਚ ਸੁਰੱਖਿਅਤ ਕੀਤੇ ਜਾਂਦੇ ਹਨ, ਸਾਨੂੰ ਇੱਕ ਵਾਰ ਸਿਖਲਾਈ ਦੇਣ ਅਤੇ ਜਦੋਂ ਵੀ ਅਸੀਂ ਚੁਣਦੇ ਹਾਂ ਪੂਰਵ-ਅਨੁਮਾਨ ਲਗਾਉਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੇ ਹਾਂ। test.py ਨਾਮਕ ਇੱਕ ਨਵੀਂ ਪਾਈਥਨ ਫਾਈਲ ਵਿੱਚ ਕੋਡ ਦੀ ਪਾਲਣਾ ਕਰੋ।
7. ਜਾਂਚ ਲਈ ਉਪਯੋਗਤਾਵਾਂ ਨੂੰ ਆਯਾਤ ਕਰਨਾ
8. ਪਾਈਥਨ ਡਾਇਰੈਕਟਰੀ ਬਣਾਉਣਾ
ਇੱਕ Python ਡਿਕਸ਼ਨਰੀ ਬਣਾਓ ਜੋ ਹਰੇਕ ਪੂਰਨ ਅੰਕ ਮੁੱਲ ਨੂੰ ਡੇਟਾਸੈਟ ਦੇ ਉਚਿਤ ਲੇਬਲ ਵਿੱਚ ਅਨੁਵਾਦ ਕਰਦਾ ਹੈ:
9. ਟੈਸਟ ਡਾਟਾ ਅਤੇ ਮਾਡਲ ਲੋਡ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ
ਹੇਠਾਂ ਦਿੱਤਾ ਕੋਡ ਟੈਸਟ ਡੇਟਾ ਅਤੇ ਮਾਡਲ ਨੂੰ ਲੋਡ ਕਰੇਗਾ।
10. ਮੁਲਾਂਕਣ ਅਤੇ ਭਵਿੱਖਬਾਣੀ
ਹੇਠਾਂ ਦਿੱਤਾ ਕੋਡ ਡੱਡੂ ਦੀਆਂ ਤਸਵੀਰਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰੇਗਾ ਅਤੇ ਭਵਿੱਖਬਾਣੀਆਂ ਕਰੇਗਾ।
11. ਨਤੀਜੇ
ਮਾਡਲ ਨੇ 80.62% ਸ਼ੁੱਧਤਾ ਨਾਲ ਡੱਡੂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕੀਤੀ।
ਸਿੱਟਾ
ਠੀਕ ਹੈ, ਅਸੀਂ ਇਸ ਪਾਠ ਨੂੰ ਪੂਰਾ ਕਰ ਲਿਆ ਹੈ। ਜਦੋਂ ਕਿ 80.62% ਥੋੜੇ ਜਿਹੇ CNN ਲਈ ਚੰਗਾ ਨਹੀਂ ਹੈ, ਮੈਂ ਤੁਹਾਨੂੰ ਮਾਡਲ ਨੂੰ ਬਦਲਣ ਜਾਂ ਵਧੀਆ ਨਤੀਜਿਆਂ ਲਈ ResNet50, Xception, ਜਾਂ ਹੋਰ ਅਤਿ ਆਧੁਨਿਕ ਮਾਡਲਾਂ ਨੂੰ ਦੇਖਣ ਦੀ ਜ਼ੋਰਦਾਰ ਸਲਾਹ ਦਿੰਦਾ ਹਾਂ।
ਹੁਣ ਜਦੋਂ ਤੁਸੀਂ ਕੇਰਾਸ ਵਿੱਚ ਆਪਣਾ ਪਹਿਲਾ ਚਿੱਤਰ ਪਛਾਣ ਨੈੱਟਵਰਕ ਬਣਾਇਆ ਹੈ, ਤੁਹਾਨੂੰ ਇਹ ਪਤਾ ਲਗਾਉਣ ਲਈ ਮਾਡਲ ਨਾਲ ਪ੍ਰਯੋਗ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਵੱਖ-ਵੱਖ ਮਾਪਦੰਡ ਇਸਦੇ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਿਤ ਕਰਦੇ ਹਨ।
ਕੋਈ ਜਵਾਬ ਛੱਡਣਾ