ਰੀਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ: ਏਆਈ ਜੋ ਆਪਣੀਆਂ ਗਲਤੀਆਂ ਤੋਂ ਸਿੱਖਦਾ ਹੈ
ਆਓ ਕਲਪਨਾ ਕਰੀਏ ਕਿ ਤੁਸੀਂ ਇੱਕ ਰੋਬੋਟ ਨੂੰ ਤੁਰਨਾ ਸਿਖਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹੋ। ਕੰਪਿਊਟਰ ਨੂੰ ਸਟਾਕ ਦੀਆਂ ਕੀਮਤਾਂ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਜਾਂ ਚਿੱਤਰਾਂ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਬਾਰੇ ਸਿਖਾਉਣ ਦੇ ਉਲਟ, ਸਾਡੇ ਕੋਲ ਅਸਲ ਵਿੱਚ ਕੋਈ ਵੱਡਾ ਡੇਟਾਸੈਟ ਨਹੀਂ ਹੈ ਜਿਸਦੀ ਵਰਤੋਂ ਅਸੀਂ ਆਪਣੇ ਰੋਬੋਟ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਕਰ ਸਕਦੇ ਹਾਂ। ਹਾਲਾਂਕਿ ਇਹ ਤੁਹਾਡੇ ਲਈ ਕੁਦਰਤੀ ਤੌਰ 'ਤੇ ਆ ਸਕਦਾ ਹੈ,…