Ενισχυτική μάθηση: AI που μαθαίνει από τα λάθη της
Ας φανταστούμε ότι προσπαθείτε να διδάξετε ένα ρομπότ πώς να περπατά. Σε αντίθεση με το να διδάσκουμε έναν υπολογιστή πώς να προβλέπει τις τιμές των μετοχών ή να κατηγοριοποιεί τις εικόνες, δεν έχουμε πραγματικά ένα μεγάλο σύνολο δεδομένων που μπορούμε να χρησιμοποιήσουμε για να εκπαιδεύσουμε το ρομπότ μας. Αν και μπορεί να σου έρθει φυσικά,…