ਵੀਡੀਓ ਗੇਮਾਂ ਦੁਨੀਆ ਭਰ ਦੇ ਅਰਬਾਂ ਖਿਡਾਰੀਆਂ ਨੂੰ ਚੁਣੌਤੀ ਪ੍ਰਦਾਨ ਕਰਦੀਆਂ ਰਹਿੰਦੀਆਂ ਹਨ। ਹੋ ਸਕਦਾ ਹੈ ਕਿ ਤੁਸੀਂ ਅਜੇ ਇਹ ਨਹੀਂ ਜਾਣਦੇ ਹੋ, ਪਰ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਐਲਗੋਰਿਦਮ ਨੇ ਵੀ ਚੁਣੌਤੀ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤਾ ਹੈ।
ਇਹ ਦੇਖਣ ਲਈ ਕਿ ਕੀ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਵਿਧੀਆਂ ਵੀਡੀਓ ਗੇਮਾਂ 'ਤੇ ਲਾਗੂ ਕੀਤੀਆਂ ਜਾ ਸਕਦੀਆਂ ਹਨ, ਇਸ ਸਮੇਂ AI ਦੇ ਖੇਤਰ ਵਿੱਚ ਖੋਜ ਦੀ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਮਾਤਰਾ ਹੈ। ਇਸ ਖੇਤਰ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਤਰੱਕੀ ਇਹ ਦਰਸਾਉਂਦੀ ਹੈ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਏਜੰਟਾਂ ਦੀ ਵਰਤੋਂ ਮਨੁੱਖੀ ਖਿਡਾਰੀ ਦੀ ਨਕਲ ਕਰਨ ਜਾਂ ਇੱਥੋਂ ਤੱਕ ਕਿ ਬਦਲਣ ਲਈ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ।
ਦੇ ਭਵਿੱਖ ਲਈ ਇਸਦਾ ਕੀ ਅਰਥ ਹੈ ਵੀਡੀਓ ਖੇਡ?
ਕੀ ਇਹ ਪ੍ਰੋਜੈਕਟ ਸਿਰਫ਼ ਮਜ਼ੇ ਲਈ ਹਨ, ਜਾਂ ਕੀ ਇੱਥੇ ਡੂੰਘੇ ਕਾਰਨ ਹਨ ਕਿ ਇੰਨੇ ਸਾਰੇ ਖੋਜਕਰਤਾ ਖੇਡਾਂ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਤ ਕਰ ਰਹੇ ਹਨ?
ਇਹ ਲੇਖ ਸੰਖੇਪ ਵਿੱਚ ਵੀਡੀਓ ਗੇਮਾਂ ਵਿੱਚ AI ਦੇ ਇਤਿਹਾਸ ਦੀ ਪੜਚੋਲ ਕਰੇਗਾ। ਬਾਅਦ ਵਿੱਚ, ਅਸੀਂ ਤੁਹਾਨੂੰ ਕੁਝ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਤਕਨੀਕਾਂ ਦੀ ਇੱਕ ਸੰਖੇਪ ਜਾਣਕਾਰੀ ਦੇਵਾਂਗੇ ਜੋ ਅਸੀਂ ਗੇਮਾਂ ਨੂੰ ਹਰਾਉਣ ਲਈ ਸਿੱਖਣ ਲਈ ਵਰਤ ਸਕਦੇ ਹਾਂ। ਅਸੀਂ ਫਿਰ ਦੇ ਕੁਝ ਸਫਲ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਦੇਖਾਂਗੇ ਤੰਤੂ ਜਾਲ ਖਾਸ ਵੀਡੀਓ ਗੇਮਾਂ ਨੂੰ ਸਿੱਖਣ ਅਤੇ ਮੁਹਾਰਤ ਹਾਸਲ ਕਰਨ ਲਈ।
ਗੇਮਿੰਗ ਵਿੱਚ AI ਦਾ ਸੰਖੇਪ ਇਤਿਹਾਸ
ਇਸ ਤੋਂ ਪਹਿਲਾਂ ਕਿ ਅਸੀਂ ਇਹ ਜਾਣੀਏ ਕਿ ਨਿਊਰਲ ਨੈੱਟ ਵੀਡੀਓ ਗੇਮਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਆਦਰਸ਼ ਐਲਗੋਰਿਦਮ ਕਿਉਂ ਬਣ ਗਏ ਹਨ, ਆਓ ਸੰਖੇਪ ਵਿੱਚ ਦੇਖੀਏ ਕਿ ਕਿਵੇਂ ਕੰਪਿਊਟਰ ਵਿਗਿਆਨੀਆਂ ਨੇ AI ਵਿੱਚ ਆਪਣੀ ਖੋਜ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਲਈ ਵੀਡੀਓ ਗੇਮਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਹੈ।
ਤੁਸੀਂ ਇਹ ਦਲੀਲ ਦੇ ਸਕਦੇ ਹੋ ਕਿ, ਇਸਦੀ ਸ਼ੁਰੂਆਤ ਤੋਂ, ਵੀਡੀਓ ਗੇਮਾਂ AI ਵਿੱਚ ਦਿਲਚਸਪੀ ਰੱਖਣ ਵਾਲੇ ਖੋਜਕਰਤਾਵਾਂ ਲਈ ਖੋਜ ਦਾ ਇੱਕ ਗਰਮ ਖੇਤਰ ਰਿਹਾ ਹੈ।
ਹਾਲਾਂਕਿ ਮੂਲ ਰੂਪ ਵਿੱਚ ਇੱਕ ਵੀਡੀਓ ਗੇਮ ਨਹੀਂ ਹੈ, AI ਦੇ ਸ਼ੁਰੂਆਤੀ ਦਿਨਾਂ ਵਿੱਚ ਸ਼ਤਰੰਜ ਇੱਕ ਵੱਡਾ ਫੋਕਸ ਰਿਹਾ ਹੈ। 1951 ਵਿੱਚ, ਡਾ. ਡਾਇਟ੍ਰਿਚ ਪ੍ਰਿੰਜ਼ ਨੇ ਫੇਰਾਂਟੀ ਮਾਰਕ 1 ਡਿਜੀਟਲ ਕੰਪਿਊਟਰ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇੱਕ ਸ਼ਤਰੰਜ ਖੇਡਣ ਦਾ ਪ੍ਰੋਗਰਾਮ ਲਿਖਿਆ। ਇਹ ਉਸ ਯੁੱਗ ਵਿੱਚ ਵਾਪਸ ਆ ਗਿਆ ਸੀ ਜਦੋਂ ਇਹਨਾਂ ਭਾਰੀ ਕੰਪਿਊਟਰਾਂ ਨੂੰ ਕਾਗਜ਼ੀ ਟੇਪ ਤੋਂ ਪ੍ਰੋਗਰਾਮਾਂ ਨੂੰ ਪੜ੍ਹਨਾ ਪੈਂਦਾ ਸੀ।
ਪ੍ਰੋਗਰਾਮ ਆਪਣੇ ਆਪ ਵਿੱਚ ਇੱਕ ਪੂਰੀ ਸ਼ਤਰੰਜ ਏਆਈ ਨਹੀਂ ਸੀ. ਕੰਪਿਊਟਰ ਦੀਆਂ ਸੀਮਾਵਾਂ ਦੇ ਕਾਰਨ, ਪ੍ਰਿੰਜ਼ ਸਿਰਫ਼ ਇੱਕ ਅਜਿਹਾ ਪ੍ਰੋਗਰਾਮ ਬਣਾ ਸਕਦਾ ਸੀ ਜੋ ਮੈਟ-ਇਨ-ਟੂ ਸ਼ਤਰੰਜ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਦਾ ਸੀ। ਔਸਤਨ, ਪ੍ਰੋਗਰਾਮ ਨੂੰ ਗੋਰੇ ਅਤੇ ਕਾਲੇ ਖਿਡਾਰੀਆਂ ਲਈ ਹਰ ਸੰਭਵ ਚਾਲ ਦੀ ਗਣਨਾ ਕਰਨ ਲਈ 15-20 ਮਿੰਟ ਲੱਗੇ।
ਸ਼ਤਰੰਜ ਅਤੇ ਚੈਕਰਸ AI ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ 'ਤੇ ਕੰਮ ਪੂਰੇ ਦਹਾਕਿਆਂ ਦੌਰਾਨ ਲਗਾਤਾਰ ਸੁਧਾਰ ਹੋਇਆ ਹੈ। ਇਹ ਤਰੱਕੀ 1997 ਵਿੱਚ ਆਪਣੇ ਸਿਖਰ 'ਤੇ ਪਹੁੰਚ ਗਈ ਜਦੋਂ IBM ਦੇ ਡੀਪ ਬਲੂ ਨੇ ਛੇ-ਗੇਮਾਂ ਦੇ ਮੈਚਾਂ ਦੀ ਇੱਕ ਜੋੜੀ ਵਿੱਚ ਰੂਸੀ ਸ਼ਤਰੰਜ ਦੇ ਗ੍ਰੈਂਡਮਾਸਟਰ ਗੈਰੀ ਕਾਸਪਾਰੋਵ ਨੂੰ ਹਰਾਇਆ। ਅੱਜ ਕੱਲ੍ਹ, ਸ਼ਤਰੰਜ ਇੰਜਣ ਜੋ ਤੁਸੀਂ ਆਪਣੇ ਮੋਬਾਈਲ ਫੋਨ 'ਤੇ ਲੱਭ ਸਕਦੇ ਹੋ, ਦੀਪ ਬਲੂ ਨੂੰ ਹਰਾ ਸਕਦੇ ਹਨ।
ਵੀਡੀਓ ਆਰਕੇਡ ਗੇਮਾਂ ਦੇ ਸੁਨਹਿਰੀ ਯੁੱਗ ਦੌਰਾਨ ਏਆਈ ਵਿਰੋਧੀਆਂ ਨੇ ਪ੍ਰਸਿੱਧੀ ਪ੍ਰਾਪਤ ਕਰਨੀ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤੀ। 1978 ਦੇ ਪੁਲਾੜ ਹਮਲਾਵਰ ਅਤੇ 1980 ਦੇ ਪੀਏਸੀ-ਮੈਨ ਏਆਈ ਬਣਾਉਣ ਵਿੱਚ ਉਦਯੋਗ ਦੇ ਕੁਝ ਮੋਢੀ ਹਨ ਜੋ ਆਰਕੇਡ ਗੇਮਰਾਂ ਦੇ ਸਭ ਤੋਂ ਅਨੁਭਵੀ ਨੂੰ ਵੀ ਚੁਣੌਤੀ ਦੇ ਸਕਦੇ ਹਨ।
ਪੈਕ-ਮੈਨ, ਖਾਸ ਤੌਰ 'ਤੇ, ਏਆਈ ਖੋਜਕਰਤਾਵਾਂ ਲਈ ਪ੍ਰਯੋਗ ਕਰਨ ਲਈ ਇੱਕ ਪ੍ਰਸਿੱਧ ਗੇਮ ਸੀ। ਵੱਖ - ਵੱਖ ਮੁਕਾਬਲੇ ਮਿਸ. ਪੈਕ-ਮੈਨ ਲਈ ਇਹ ਨਿਰਧਾਰਤ ਕਰਨ ਲਈ ਆਯੋਜਿਤ ਕੀਤਾ ਗਿਆ ਹੈ ਕਿ ਕਿਹੜੀ ਟੀਮ ਖੇਡ ਨੂੰ ਹਰਾਉਣ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਏਆਈ ਲੈ ਕੇ ਆ ਸਕਦੀ ਹੈ।
ਚੁਸਤ ਵਿਰੋਧੀਆਂ ਦੀ ਲੋੜ ਪੈਦਾ ਹੋਣ ਦੇ ਨਾਲ ਹੀ ਗੇਮ ਏਆਈ ਅਤੇ ਹਿਉਰਿਸਟਿਕ ਐਲਗੋਰਿਦਮ ਵਿਕਸਿਤ ਹੁੰਦੇ ਰਹੇ। ਉਦਾਹਰਨ ਲਈ, ਲੜਾਈ AI ਪ੍ਰਸਿੱਧੀ ਵਿੱਚ ਵਾਧਾ ਹੋਇਆ ਕਿਉਂਕਿ ਸ਼ੈਲੀਆਂ ਜਿਵੇਂ ਕਿ ਪਹਿਲੇ ਵਿਅਕਤੀ ਨਿਸ਼ਾਨੇਬਾਜ਼ ਵਧੇਰੇ ਮੁੱਖ ਧਾਰਾ ਬਣ ਗਏ।
ਵੀਡੀਓ ਗੇਮਾਂ ਵਿੱਚ ਮਸ਼ੀਨ ਲਰਨਿੰਗ
ਜਿਵੇਂ ਕਿ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਦੀਆਂ ਤਕਨੀਕਾਂ ਤੇਜ਼ੀ ਨਾਲ ਪ੍ਰਸਿੱਧੀ ਵਿੱਚ ਵਧੀਆਂ, ਵੱਖ-ਵੱਖ ਖੋਜ ਪ੍ਰੋਜੈਕਟਾਂ ਨੇ ਵੀਡੀਓ ਗੇਮਾਂ ਖੇਡਣ ਲਈ ਇਹਨਾਂ ਨਵੀਆਂ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ।
ਡੋਟਾ 2, ਸਟਾਰਕਰਾਫਟ, ਅਤੇ ਡੂਮ ਵਰਗੀਆਂ ਗੇਮਾਂ ਇਹਨਾਂ ਲਈ ਸਮੱਸਿਆਵਾਂ ਵਜੋਂ ਕੰਮ ਕਰ ਸਕਦੀਆਂ ਹਨ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਐਲਗੋਰਿਦਮ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ. ਡੂੰਘੇ ਸਿੱਖਣ ਦੇ ਐਲਗੋਰਿਦਮ, ਖਾਸ ਤੌਰ 'ਤੇ, ਮਨੁੱਖੀ-ਪੱਧਰ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਪਾਰ ਕਰਨ ਦੇ ਯੋਗ ਸਨ।
The ਆਰਕੇਡ ਲਰਨਿੰਗ ਵਾਤਾਵਰਨ ਜਾਂ ALE ਨੇ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਸੌ ਤੋਂ ਵੱਧ ਅਟਾਰੀ 2600 ਗੇਮਾਂ ਲਈ ਇੱਕ ਇੰਟਰਫੇਸ ਦਿੱਤਾ। ਓਪਨ-ਸੋਰਸ ਪਲੇਟਫਾਰਮ ਨੇ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਕਲਾਸਿਕ ਅਟਾਰੀ ਵੀਡੀਓ ਗੇਮਾਂ 'ਤੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਤਕਨੀਕਾਂ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਬੈਂਚਮਾਰਕ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੱਤੀ। ਗੂਗਲ ਨੇ ਆਪਣੇ ਖੁਦ ਦੇ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤੇ ਹਨ ਕਾਗਜ਼ ALE ਤੋਂ ਸੱਤ ਗੇਮਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ
ਇਸ ਦੌਰਾਨ, ਪ੍ਰੋਜੈਕਟ ਜਿਵੇਂ ਕਿ ਵਿਜ਼ਡੂਮ ਨੇ AI ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ 3D ਪਹਿਲੇ ਵਿਅਕਤੀ ਨਿਸ਼ਾਨੇਬਾਜ਼ਾਂ ਨੂੰ ਖੇਡਣ ਲਈ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਐਲਗੋਰਿਦਮ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਦਾ ਮੌਕਾ ਦਿੱਤਾ।
ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ: ਕੁਝ ਮੁੱਖ ਧਾਰਨਾਵਾਂ
ਨਿਊਰਲ ਨੈਟਵਰਕ
ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਨਾਲ ਵੀਡੀਓ ਗੇਮਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਜ਼ਿਆਦਾਤਰ ਪਹੁੰਚਾਂ ਵਿੱਚ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਵਜੋਂ ਜਾਣੇ ਜਾਂਦੇ ਐਲਗੋਰਿਦਮ ਦੀ ਇੱਕ ਕਿਸਮ ਸ਼ਾਮਲ ਹੁੰਦੀ ਹੈ।
ਤੁਸੀਂ ਇੱਕ ਨਿਊਰਲ ਨੈੱਟ ਨੂੰ ਇੱਕ ਪ੍ਰੋਗਰਾਮ ਦੇ ਰੂਪ ਵਿੱਚ ਸੋਚ ਸਕਦੇ ਹੋ ਜੋ ਇਹ ਨਕਲ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ ਕਿ ਇੱਕ ਦਿਮਾਗ ਕਿਵੇਂ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ। ਜਿਵੇਂ ਕਿ ਸਾਡਾ ਦਿਮਾਗ ਇੱਕ ਸਿਗਨਲ ਪ੍ਰਸਾਰਿਤ ਕਰਨ ਵਾਲੇ ਨਿਊਰੋਨਾਂ ਨਾਲ ਬਣਿਆ ਹੁੰਦਾ ਹੈ, ਇੱਕ ਨਿਊਰਲ ਨੈੱਟ ਵਿੱਚ ਵੀ ਨਕਲੀ ਨਿਊਰੋਨਸ ਹੁੰਦੇ ਹਨ।
ਇਹ ਨਕਲੀ ਨਿਊਰੋਨ ਵੀ ਇੱਕ ਦੂਜੇ ਨੂੰ ਸਿਗਨਲ ਟ੍ਰਾਂਸਫਰ ਕਰਦੇ ਹਨ, ਹਰ ਇੱਕ ਸਿਗਨਲ ਇੱਕ ਅਸਲ ਸੰਖਿਆ ਹੁੰਦਾ ਹੈ। ਇੱਕ ਨਿਊਰਲ ਨੈੱਟ ਵਿੱਚ ਇਨਪੁਟ ਅਤੇ ਆਉਟਪੁੱਟ ਪਰਤਾਂ ਦੇ ਵਿਚਕਾਰ ਕਈ ਪਰਤਾਂ ਹੁੰਦੀਆਂ ਹਨ, ਜਿਸਨੂੰ ਡੂੰਘੇ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਕਿਹਾ ਜਾਂਦਾ ਹੈ।
ਮਜਬੂਤ ਸਿੱਖਿਆ
ਵੀਡੀਓ ਗੇਮਾਂ ਨੂੰ ਸਿੱਖਣ ਲਈ ਢੁਕਵੀਂ ਇਕ ਹੋਰ ਆਮ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਤਕਨੀਕ ਹੈ ਰੀਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਦਾ ਵਿਚਾਰ।
ਇਹ ਤਕਨੀਕ ਇਨਾਮ ਜਾਂ ਸਜ਼ਾ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਏਜੰਟ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਹੈ। ਇਸ ਪਹੁੰਚ ਦੇ ਨਾਲ, ਏਜੰਟ ਨੂੰ ਅਜ਼ਮਾਇਸ਼ ਅਤੇ ਗਲਤੀ ਦੁਆਰਾ ਇੱਕ ਸਮੱਸਿਆ ਦੇ ਹੱਲ ਦੇ ਨਾਲ ਆਉਣ ਦੇ ਯੋਗ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ.
ਮੰਨ ਲਓ ਕਿ ਅਸੀਂ ਸੱਪ ਗੇਮ ਨੂੰ ਕਿਵੇਂ ਖੇਡਣਾ ਹੈ ਇਹ ਪਤਾ ਲਗਾਉਣ ਲਈ ਇੱਕ AI ਚਾਹੁੰਦੇ ਹਾਂ। ਗੇਮ ਦਾ ਉਦੇਸ਼ ਸਧਾਰਨ ਹੈ: ਵਸਤੂਆਂ ਦਾ ਸੇਵਨ ਕਰਕੇ ਅਤੇ ਆਪਣੀ ਵਧ ਰਹੀ ਪੂਛ ਤੋਂ ਬਚ ਕੇ ਵੱਧ ਤੋਂ ਵੱਧ ਅੰਕ ਪ੍ਰਾਪਤ ਕਰੋ।
ਰੀਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਦੇ ਨਾਲ, ਅਸੀਂ ਇੱਕ ਰਿਵਾਰਡ ਫੰਕਸ਼ਨ R ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰ ਸਕਦੇ ਹਾਂ। ਫੰਕਸ਼ਨ ਪੁਆਇੰਟ ਜੋੜਦਾ ਹੈ ਜਦੋਂ ਇੱਕ ਸੱਪ ਇੱਕ ਚੀਜ਼ ਦੀ ਖਪਤ ਕਰਦਾ ਹੈ ਅਤੇ ਜਦੋਂ ਸੱਪ ਇੱਕ ਰੁਕਾਵਟ ਨੂੰ ਮਾਰਦਾ ਹੈ ਤਾਂ ਅੰਕ ਘਟਾਉਂਦਾ ਹੈ। ਮੌਜੂਦਾ ਮਾਹੌਲ ਅਤੇ ਸੰਭਾਵਿਤ ਕਾਰਵਾਈਆਂ ਦੇ ਇੱਕ ਸਮੂਹ ਦੇ ਮੱਦੇਨਜ਼ਰ, ਸਾਡਾ ਰੀਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਮਾਡਲ ਸਰਵੋਤਮ 'ਨੀਤੀ' ਦੀ ਗਣਨਾ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੇਗਾ ਜੋ ਸਾਡੇ ਇਨਾਮ ਫੰਕਸ਼ਨ ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਬਣਾਉਂਦਾ ਹੈ।
ਨਿਊਰੋਵੇਲੂਸ਼ਨ
ਕੁਦਰਤ ਦੁਆਰਾ ਪ੍ਰੇਰਿਤ ਹੋਣ ਦੇ ਨਾਲ ਥੀਮ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖਦੇ ਹੋਏ, ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਨਿਊਰੋਵੋਲੂਸ਼ਨ ਵਜੋਂ ਜਾਣੀ ਜਾਂਦੀ ਇੱਕ ਤਕਨੀਕ ਦੁਆਰਾ ਵੀਡੀਓ ਗੇਮਾਂ ਵਿੱਚ ਐਮਐਲ ਨੂੰ ਲਾਗੂ ਕਰਨ ਵਿੱਚ ਵੀ ਸਫਲਤਾ ਪ੍ਰਾਪਤ ਕੀਤੀ ਹੈ।
ਇਸ ਦੀ ਬਜਾਏ ਵਰਤਣ ਦੀ ਗਰੇਡੀਐਂਟ ਉਤਰਾਈ ਇੱਕ ਨੈਟਵਰਕ ਵਿੱਚ ਨਿਊਰੋਨਸ ਨੂੰ ਅਪਡੇਟ ਕਰਨ ਲਈ, ਅਸੀਂ ਬਿਹਤਰ ਨਤੀਜੇ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਵਿਕਾਸਵਾਦੀ ਐਲਗੋਰਿਦਮ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹਾਂ।
ਵਿਕਾਸਵਾਦੀ ਐਲਗੋਰਿਦਮ ਆਮ ਤੌਰ 'ਤੇ ਬੇਤਰਤੀਬ ਵਿਅਕਤੀਆਂ ਦੀ ਸ਼ੁਰੂਆਤੀ ਆਬਾਦੀ ਪੈਦਾ ਕਰਕੇ ਸ਼ੁਰੂ ਹੁੰਦੇ ਹਨ। ਫਿਰ ਅਸੀਂ ਕੁਝ ਮਾਪਦੰਡਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇਹਨਾਂ ਵਿਅਕਤੀਆਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਦੇ ਹਾਂ। ਸਭ ਤੋਂ ਵਧੀਆ ਵਿਅਕਤੀਆਂ ਨੂੰ "ਮਾਪਿਆਂ" ਵਜੋਂ ਚੁਣਿਆ ਜਾਂਦਾ ਹੈ ਅਤੇ ਵਿਅਕਤੀਆਂ ਦੀ ਇੱਕ ਨਵੀਂ ਪੀੜ੍ਹੀ ਬਣਾਉਣ ਲਈ ਇਕੱਠੇ ਪੈਦਾ ਕੀਤੇ ਜਾਂਦੇ ਹਨ। ਇਹ ਵਿਅਕਤੀ ਫਿਰ ਆਬਾਦੀ ਵਿੱਚ ਸਭ ਤੋਂ ਘੱਟ ਫਿੱਟ ਵਿਅਕਤੀਆਂ ਦੀ ਥਾਂ ਲੈਣਗੇ।
ਇਹ ਐਲਗੋਰਿਦਮ ਆਮ ਤੌਰ 'ਤੇ ਜੈਨੇਟਿਕ ਵਿਭਿੰਨਤਾ ਨੂੰ ਬਰਕਰਾਰ ਰੱਖਣ ਲਈ ਕਰਾਸਓਵਰ ਜਾਂ "ਪ੍ਰਜਨਨ" ਕਦਮ ਦੇ ਦੌਰਾਨ ਪਰਿਵਰਤਨ ਕਾਰਵਾਈ ਦੇ ਕੁਝ ਰੂਪ ਪੇਸ਼ ਕਰਦੇ ਹਨ।
ਵੀਡੀਓ ਗੇਮਾਂ ਵਿੱਚ ਮਸ਼ੀਨ ਲਰਨਿੰਗ 'ਤੇ ਨਮੂਨਾ ਖੋਜ
ਓਪਨਏਈ ਪੰਜ
ਓਪਨਏਈ ਪੰਜ OpenAI ਦੁਆਰਾ ਇੱਕ ਕੰਪਿਊਟਰ ਪ੍ਰੋਗਰਾਮ ਹੈ ਜਿਸਦਾ ਉਦੇਸ਼ DOTA 2, ਇੱਕ ਪ੍ਰਸਿੱਧ ਮਲਟੀਪਲੇਅਰ ਮੋਬਾਈਲ ਬੈਟਲ ਅਰੇਨਾ (MOBA) ਗੇਮ ਖੇਡਣਾ ਹੈ।
ਪ੍ਰੋਗਰਾਮ ਨੇ ਮੌਜੂਦਾ ਰੀਨਫੋਰਸਮੈਂਟ ਸਿੱਖਣ ਤਕਨੀਕਾਂ ਦਾ ਲਾਭ ਉਠਾਇਆ, ਲੱਖਾਂ ਫਰੇਮਾਂ ਪ੍ਰਤੀ ਸਕਿੰਟ ਤੋਂ ਸਿੱਖਣ ਲਈ ਸਕੇਲ ਕੀਤਾ ਗਿਆ। ਇੱਕ ਵਿਤਰਿਤ ਸਿਖਲਾਈ ਪ੍ਰਣਾਲੀ ਲਈ ਧੰਨਵਾਦ, ਓਪਨਏਆਈ ਹਰ ਰੋਜ਼ 180 ਸਾਲਾਂ ਦੀਆਂ ਖੇਡਾਂ ਖੇਡਣ ਦੇ ਯੋਗ ਸੀ।
ਸਿਖਲਾਈ ਦੀ ਮਿਆਦ ਤੋਂ ਬਾਅਦ, ਓਪਨਏਆਈ ਫਾਈਵ ਮਾਹਰ-ਪੱਧਰ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਅਤੇ ਮਨੁੱਖੀ ਖਿਡਾਰੀਆਂ ਦੇ ਨਾਲ ਸਹਿਯੋਗ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨ ਦੇ ਯੋਗ ਸੀ। 2019 ਵਿੱਚ, ਓਪਨਏਆਈ ਫਾਈਵ ਕਰਨ ਦੇ ਯੋਗ ਸੀ ਹਾਰ ਜਨਤਕ ਮੈਚਾਂ ਵਿੱਚ 99.4% ਖਿਡਾਰੀ।
ਓਪਨਏਆਈ ਨੇ ਇਸ ਗੇਮ 'ਤੇ ਫੈਸਲਾ ਕਿਉਂ ਕੀਤਾ? ਖੋਜਕਰਤਾਵਾਂ ਦੇ ਅਨੁਸਾਰ, DOTA 2 ਵਿੱਚ ਗੁੰਝਲਦਾਰ ਮਕੈਨਿਕ ਸਨ ਜੋ ਮੌਜੂਦਾ ਡੂੰਘਾਈ ਦੀ ਪਹੁੰਚ ਤੋਂ ਬਾਹਰ ਸਨ ਸ਼ਕਤੀ ਸਿਖਲਾਈ ਐਲਗੋਰਿਦਮ.
ਸੁਪਰ ਮਾਰੀਓ ਬਰੋਸ
ਵੀਡੀਓ ਗੇਮਾਂ ਵਿੱਚ ਨਿਊਰਲ ਨੈੱਟ ਦੀ ਇੱਕ ਹੋਰ ਦਿਲਚਸਪ ਐਪਲੀਕੇਸ਼ਨ ਹੈ ਸੁਪਰ ਮਾਰੀਓ ਬ੍ਰੋਸ ਵਰਗੇ ਪਲੇਟਫਾਰਮਰ ਖੇਡਣ ਲਈ ਨਿਊਰੋਈਵੋਲੂਸ਼ਨ ਦੀ ਵਰਤੋਂ।
ਉਦਾਹਰਨ ਲਈ, ਇਹ ਹੈਕਾਥਨ ਐਂਟਰੀ ਖੇਡ ਦਾ ਕੋਈ ਗਿਆਨ ਨਾ ਹੋਣ ਨਾਲ ਸ਼ੁਰੂ ਹੁੰਦਾ ਹੈ ਅਤੇ ਹੌਲੀ-ਹੌਲੀ ਇਸ ਗੱਲ ਦੀ ਬੁਨਿਆਦ ਬਣਾਉਂਦਾ ਹੈ ਕਿ ਇੱਕ ਪੱਧਰ ਦੁਆਰਾ ਅੱਗੇ ਵਧਣ ਲਈ ਕੀ ਜ਼ਰੂਰੀ ਹੈ।
ਸਵੈ-ਵਿਕਸਤ ਨਿਊਰਲ ਨੈੱਟ ਗੇਮ ਦੀ ਮੌਜੂਦਾ ਸਥਿਤੀ ਨੂੰ ਟਾਈਲਾਂ ਦੇ ਗਰਿੱਡ ਦੇ ਰੂਪ ਵਿੱਚ ਲੈਂਦਾ ਹੈ। ਪਹਿਲਾਂ-ਪਹਿਲਾਂ, ਨਿਊਰਲ ਨੈੱਟ ਨੂੰ ਹਰ ਟਾਇਲ ਦਾ ਕੀ ਮਤਲਬ ਹੈ ਇਸ ਬਾਰੇ ਕੋਈ ਸਮਝ ਨਹੀਂ ਹੈ, ਸਿਰਫ ਇਹ ਕਿ "ਹਵਾ" ਟਾਇਲਾਂ "ਜ਼ਮੀਨ ਦੀਆਂ ਟਾਇਲਾਂ" ਅਤੇ "ਦੁਸ਼ਮਣ ਟਾਇਲਾਂ" ਤੋਂ ਵੱਖਰੀਆਂ ਹਨ।
ਹੈਕਾਥੌਨ ਪ੍ਰੋਜੈਕਟ ਦੇ ਇੱਕ ਨਿਯੂਰੋਈਵੋਲੂਸ਼ਨ ਨੂੰ ਲਾਗੂ ਕਰਨ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਤੰਤੂ ਜਾਲਾਂ ਨੂੰ ਚੁਣਨ ਲਈ NEAT ਜੈਨੇਟਿਕ ਐਲਗੋਰਿਦਮ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਗਈ।
ਮਹੱਤਤਾ
ਹੁਣ ਜਦੋਂ ਤੁਸੀਂ ਵੀਡੀਓ ਗੇਮਾਂ ਖੇਡਣ ਵਾਲੇ ਨਿਊਰਲ ਨੈੱਟ ਦੀਆਂ ਕੁਝ ਉਦਾਹਰਣਾਂ ਦੇਖੀਆਂ ਹਨ, ਤਾਂ ਤੁਸੀਂ ਸ਼ਾਇਦ ਸੋਚ ਰਹੇ ਹੋਵੋਗੇ ਕਿ ਇਸ ਸਭ ਦਾ ਮਤਲਬ ਕੀ ਹੈ।
ਕਿਉਂਕਿ ਵੀਡੀਓ ਗੇਮਾਂ ਵਿੱਚ ਏਜੰਟਾਂ ਅਤੇ ਉਹਨਾਂ ਦੇ ਵਾਤਾਵਰਣਾਂ ਵਿਚਕਾਰ ਗੁੰਝਲਦਾਰ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ, ਇਹ AI ਬਣਾਉਣ ਲਈ ਸੰਪੂਰਨ ਟੈਸਟਿੰਗ ਆਧਾਰ ਹੈ। ਵਰਚੁਅਲ ਵਾਤਾਵਰਣ ਸੁਰੱਖਿਅਤ ਅਤੇ ਨਿਯੰਤਰਣਯੋਗ ਹਨ ਅਤੇ ਡੇਟਾ ਦੀ ਬੇਅੰਤ ਸਪਲਾਈ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ।
ਇਸ ਖੇਤਰ ਵਿੱਚ ਕੀਤੀ ਗਈ ਖੋਜ ਨੇ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਇਹ ਸਮਝ ਦਿੱਤੀ ਹੈ ਕਿ ਅਸਲ ਸੰਸਾਰ ਵਿੱਚ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਕਿਵੇਂ ਹੱਲ ਕਰਨਾ ਹੈ ਇਹ ਸਿੱਖਣ ਲਈ ਨਿਊਰਲ ਨੈਟਸ ਨੂੰ ਕਿਵੇਂ ਅਨੁਕੂਲ ਬਣਾਇਆ ਜਾ ਸਕਦਾ ਹੈ।
ਨਿਊਰਲ ਨੈਟਵਰਕ ਕੁਦਰਤੀ ਸੰਸਾਰ ਵਿੱਚ ਦਿਮਾਗ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ ਇਸ ਤੋਂ ਪ੍ਰੇਰਿਤ ਹਨ। ਵੀਡੀਓ ਗੇਮ ਖੇਡਣ ਦੇ ਤਰੀਕੇ ਸਿੱਖਣ ਵੇਲੇ ਨਕਲੀ ਨਿਊਰੋਨਸ ਕਿਵੇਂ ਵਿਵਹਾਰ ਕਰਦੇ ਹਨ, ਇਸ ਦਾ ਅਧਿਐਨ ਕਰਕੇ, ਅਸੀਂ ਇਸ ਬਾਰੇ ਵੀ ਸਮਝ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹਾਂ ਕਿ ਕਿਵੇਂ ਮਨੁੱਖੀ ਦਿਮਾਗ ਕੰਮ ਕਰਦਾ ਹੈ
ਸਿੱਟਾ
ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਅਤੇ ਦਿਮਾਗ ਦੇ ਵਿਚਕਾਰ ਸਮਾਨਤਾਵਾਂ ਨੇ ਦੋਵਾਂ ਖੇਤਰਾਂ ਵਿੱਚ ਸੂਝ ਪੈਦਾ ਕੀਤੀ ਹੈ। ਨਿਊਰਲ ਨੈੱਟ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਕਿਵੇਂ ਹੱਲ ਕਰ ਸਕਦੇ ਹਨ ਇਸ ਬਾਰੇ ਨਿਰੰਤਰ ਖੋਜ ਕਿਸੇ ਦਿਨ ਹੋਰ ਉੱਨਤ ਰੂਪਾਂ ਵੱਲ ਲੈ ਜਾ ਸਕਦੀ ਹੈ ਬਣਾਵਟੀ ਗਿਆਨ.
ਕਲਪਨਾ ਕਰੋ ਕਿ ਤੁਹਾਡੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਅਨੁਸਾਰ ਬਣਾਈ ਗਈ ਇੱਕ AI ਦੀ ਵਰਤੋਂ ਕਰੋ ਜੋ ਤੁਹਾਡੇ ਦੁਆਰਾ ਖਰੀਦਣ ਤੋਂ ਪਹਿਲਾਂ ਇੱਕ ਪੂਰੀ ਵੀਡੀਓ ਗੇਮ ਖੇਡ ਸਕਦੀ ਹੈ ਤਾਂ ਜੋ ਤੁਹਾਨੂੰ ਇਹ ਦੱਸਿਆ ਜਾ ਸਕੇ ਕਿ ਕੀ ਇਹ ਤੁਹਾਡੇ ਸਮੇਂ ਦੀ ਕੀਮਤ ਹੈ। ਕੀ ਵੀਡੀਓ ਗੇਮ ਕੰਪਨੀਆਂ ਗੇਮ ਡਿਜ਼ਾਈਨ, ਟਵੀਕ ਲੈਵਲ, ਅਤੇ ਵਿਰੋਧੀ ਮੁਸ਼ਕਲ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਲਈ ਨਿਊਰਲ ਨੈੱਟ ਦੀ ਵਰਤੋਂ ਕਰਨਗੀਆਂ?
ਤੁਸੀਂ ਕੀ ਸੋਚਦੇ ਹੋ ਜਦੋਂ ਨਿਊਰਲ ਨੈੱਟ ਅੰਤਮ ਗੇਮਰ ਬਣ ਜਾਂਦੇ ਹਨ?
ਕੋਈ ਜਵਾਬ ਛੱਡਣਾ