Πίνακας περιεχομένων[Κρύβω][Προβολή]
- 1. Τι ακριβώς είναι το Deep Learning;
- 2. Τι διακρίνει το Deep Learning από το Machine Learning;
- 3. Ποιες είναι οι τρέχουσες αντιλήψεις σας για τα νευρωνικά δίκτυα;
- 4. Τι ακριβώς είναι το perceptron;
- 5. Τι ακριβώς είναι ένα βαθύ νευρωνικό δίκτυο;
- 6. Τι είναι ακριβώς ένα πολυστρωματικό Perceptron (MLP);
- 7. Τι σκοπό έχουν οι συναρτήσεις ενεργοποίησης σε ένα νευρωνικό δίκτυο;
- 8. Τι ακριβώς είναι το Gradient Descent;
- 9. Τι ακριβώς είναι η συνάρτηση κόστους;
- 10. Πώς μπορούν τα βαθιά δίκτυα να ξεπεράσουν τα ρηχά;
- 11. Περιγράψτε τη διάδοση προς τα εμπρός.
- 12. Τι είναι η οπίσθια διάδοση;
- 13. Στο πλαίσιο της βαθιάς μάθησης, πώς αντιλαμβάνεστε το ντεγκραντέ αποκοπή;
- 14. Ποιες είναι οι Λειτουργίες Softmax και ReLU;
- 15. Μπορεί ένα μοντέλο νευρωνικού δικτύου να εκπαιδευτεί με όλα τα βάρη 0;
- 16. Τι διακρίνει μια εποχή από μια παρτίδα και μια επανάληψη;
- 17. Τι είναι η κανονικοποίηση παρτίδας και η εγκατάλειψη;
- 18. Τι διαχωρίζει τη Στοχαστική κλίση κάθοδος από την κατά παρτίδα κλίση κάθοδος;
- 19. Γιατί είναι κρίσιμο να συμπεριληφθούν οι μη γραμμικότητες στα νευρωνικά δίκτυα;
- 20. Τι είναι ο τανυστής στη βαθιά μάθηση;
- 21. Πώς θα επιλέγατε τη συνάρτηση ενεργοποίησης για ένα μοντέλο βαθιάς μάθησης;
- 22. Τι εννοείτε με το CNN;
- 23. Ποια είναι τα πολλά επίπεδα CNN;
- 24. Ποιες είναι οι επιπτώσεις της υπερβολικής και της υποσυναρμολόγησης και πώς μπορείτε να τις αποφύγετε;
- 25. Στη βαθιά μάθηση, τι είναι το RNN;
- 26. Περιγράψτε το Adam Optimizer
- 27. Deep autoencoder: τι είναι αυτοί;
- 28. Τι σημαίνει Tensor στο Tensorflow;
- 29. Μια επεξήγηση ενός υπολογιστικού γραφήματος
- 30. Generative adversarial networks (GANs): ποια είναι αυτά;
- 31. Πώς θα επιλέξετε τον αριθμό των νευρώνων και των κρυφών επιπέδων που θα συμπεριλάβετε στο νευρωνικό δίκτυο καθώς σχεδιάζετε την αρχιτεκτονική;
- 32. Ποια είδη νευρωνικών δικτύων χρησιμοποιούνται από τη βαθιά ενισχυτική μάθηση;
- Συμπέρασμα
Η βαθιά μάθηση δεν είναι μια ολοκαίνουργια ιδέα. Τα τεχνητά νευρωνικά δίκτυα χρησιμεύουν ως το μόνο θεμέλιο του υποσυνόλου μηχανικής μάθησης που είναι γνωστό ως βαθιά μάθηση.
Η βαθιά μάθηση είναι μια μίμηση του ανθρώπινου εγκεφάλου, όπως και τα νευρωνικά δίκτυα, καθώς δημιουργήθηκαν για να μιμηθούν τον ανθρώπινο εγκέφαλο.
Αυτό υπάρχει εδώ και λίγο καιρό. Αυτές τις μέρες, όλοι μιλούν για αυτό, καθώς δεν έχουμε σχεδόν τόση επεξεργαστική ισχύ ή δεδομένα όπως τώρα.
Τα τελευταία 20 χρόνια, η βαθιά μάθηση και η μηχανική μάθηση προέκυψαν ως αποτέλεσμα της δραματικής αύξησης της ικανότητας επεξεργασίας.
Προκειμένου να σας βοηθήσει να προετοιμαστείτε για τυχόν ερωτήσεις που θα μπορούσατε να αντιμετωπίσετε όταν αναζητάτε τη δουλειά των ονείρων σας, αυτή η ανάρτηση θα σας καθοδηγήσει σε μια σειρά από ερωτήσεις συνέντευξης βαθιάς μάθησης, που κυμαίνονται από απλές έως πολύπλοκες.
1. Τι ακριβώς είναι το Deep Learning;
Εάν παρακολουθείτε ένα βαθιά μάθηση συνέντευξη, καταλαβαίνετε αναμφίβολα τι είναι βαθιά μάθηση. Ο ερευνητής, ωστόσο, αναμένει από εσάς να δώσετε μια λεπτομερή απάντηση μαζί με μια απεικόνιση ως απάντηση σε αυτήν την ερώτηση.
Για να προπονηθείς νευρωνικά δίκτυα Για τη βαθιά μάθηση, πρέπει να χρησιμοποιούνται σημαντικές ποσότητες οργανωμένων ή μη δομημένων δεδομένων. Για να βρει κρυφά μοτίβα και χαρακτηριστικά, κάνει περίπλοκες διαδικασίες (για παράδειγμα, διακρίνει την εικόνα μιας γάτας από αυτή ενός σκύλου).
2. Τι διακρίνει το Deep Learning από το Machine Learning;
Ως κλάδος της τεχνητής νοημοσύνης γνωστός ως μηχανική μάθηση, εκπαιδεύουμε υπολογιστές χρησιμοποιώντας δεδομένα και στατιστικές και αλγοριθμικές τεχνικές, ώστε να βελτιώνονται με την πάροδο του χρόνου.
Ως πτυχή του μάθηση μηχανής, η βαθιά μάθηση μιμείται την αρχιτεκτονική νευρωνικών δικτύων που παρατηρείται στον ανθρώπινο εγκέφαλο.
3. Ποιες είναι οι τρέχουσες αντιλήψεις σας για τα νευρωνικά δίκτυα;
Τα τεχνητά συστήματα γνωστά ως νευρωνικά δίκτυα μοιάζουν πολύ με τα οργανικά νευρωνικά δίκτυα που βρίσκονται στο ανθρώπινο σώμα.
Χρησιμοποιώντας μια τεχνική που μοιάζει με το πώς το ανθρώπινος εγκέφαλος λειτουργίες, ένα νευρωνικό δίκτυο είναι μια συλλογή αλγορίθμων που στοχεύει στον εντοπισμό υποκείμενων συσχετίσεων σε ένα κομμάτι δεδομένων.
Αυτά τα συστήματα αποκτούν γνώσεις για συγκεκριμένες εργασίες εκθέτοντας τους εαυτούς τους σε μια σειρά συνόλων δεδομένων και παραδειγμάτων, αντί να ακολουθούν οποιουσδήποτε κανόνες για συγκεκριμένες εργασίες.
Η ιδέα είναι ότι αντί να έχει μια εκ των προτέρων προγραμματισμένη κατανόηση αυτών των συνόλων δεδομένων, το σύστημα μαθαίνει να διακρίνει τα χαρακτηριστικά από τα δεδομένα που τροφοδοτεί.
Τα τρία επίπεδα δικτύου που χρησιμοποιούνται πιο συχνά στα νευρωνικά δίκτυα είναι τα εξής:
- Επίπεδο εισόδου
- Κρυφό επίπεδο
- Επίπεδο εξόδου
4. Τι ακριβώς είναι το perceptron;
Ο βιολογικός νευρώνας που βρίσκεται στον ανθρώπινο εγκέφαλο είναι συγκρίσιμος με ένα perceptron. Πολλαπλές είσοδοι λαμβάνονται από το perceptron, το οποίο στη συνέχεια εκτελεί πολυάριθμους μετασχηματισμούς και λειτουργίες και παράγει μια έξοδο.
Ένα γραμμικό μοντέλο που ονομάζεται perceptron χρησιμοποιείται στη δυαδική ταξινόμηση. Προσομοιώνει έναν νευρώνα με μια ποικιλία εισόδων, η καθεμία με διαφορετικό βάρος.
Ο νευρώνας υπολογίζει μια συνάρτηση χρησιμοποιώντας αυτές τις σταθμισμένες εισόδους και εξάγει τα αποτελέσματα.
5. Τι ακριβώς είναι ένα βαθύ νευρωνικό δίκτυο;
Ένα βαθύ νευρωνικό δίκτυο είναι ένα τεχνητό νευρωνικό δίκτυο (ANN) με πολλά στρώματα μεταξύ των επιπέδων εισόδου και εξόδου (DNN).
Τα βαθιά νευρωνικά δίκτυα είναι νευρωνικά δίκτυα βαθιάς αρχιτεκτονικής. Η λέξη "deep" αναφέρεται σε λειτουργίες με πολλά επίπεδα και μονάδες σε ένα μόνο επίπεδο. Μπορούν να δημιουργηθούν πιο ακριβή μοντέλα προσθέτοντας περισσότερα και μεγαλύτερα επίπεδα για να καταγράψετε μεγαλύτερα επίπεδα μοτίβων.
6. Τι είναι ακριβώς ένα πολυστρωματικό Perceptron (MLP);
Τα επίπεδα εισόδου, κρυφής και εξόδου υπάρχουν στα MLP, όπως και στα νευρωνικά δίκτυα. Είναι χτισμένο παρόμοια με ένα μονοστρωματικό perceptron με ένα ή περισσότερα κρυφά στρώματα.
Η δυαδική έξοδος ενός perceptron μονής στρώσης μπορεί να κατηγοριοποιήσει μόνο γραμμικές διαχωρίσιμες τάξεις (0,1), ενώ το MLP μπορεί να ταξινομήσει μη γραμμικές κλάσεις.
7. Τι σκοπό έχουν οι συναρτήσεις ενεργοποίησης σε ένα νευρωνικό δίκτυο;
Μια συνάρτηση ενεργοποίησης καθορίζει εάν ένας νευρώνας πρέπει ή όχι να ενεργοποιηθεί στο πιο θεμελιώδες επίπεδο. Οποιαδήποτε συνάρτηση ενεργοποίησης μπορεί να δεχτεί ως είσοδο το σταθμισμένο άθροισμα των εισόδων συν την προκατάληψη. Οι συναρτήσεις ενεργοποίησης περιλαμβάνουν τη συνάρτηση βήματος, το Sigmoid, το ReLU, το Tanh και το Softmax.
8. Τι ακριβώς είναι το Gradient Descent;
Η καλύτερη προσέγγιση για την ελαχιστοποίηση μιας συνάρτησης κόστους ή ενός σφάλματος είναι η βαθμιδωτή κάθοδος. Ο στόχος είναι η εύρεση των τοπικών-καθολικών ελαχίστων μιας συνάρτησης. Αυτό καθορίζει τη διαδρομή που πρέπει να ακολουθήσει το μοντέλο για να ελαχιστοποιήσει το σφάλμα.
9. Τι ακριβώς είναι η συνάρτηση κόστους;
Η συνάρτηση κόστους είναι μια μέτρηση για την αξιολόγηση της απόδοσης του μοντέλου σας. μερικές φορές είναι γνωστό ως «απώλεια» ή «σφάλμα». Κατά τη διάρκεια της backpropagation, χρησιμοποιείται για τον υπολογισμό του σφάλματος του επιπέδου εξόδου.
Εκμεταλλευόμαστε αυτήν την ανακρίβεια για να προωθήσουμε τις διαδικασίες εκπαίδευσης του νευρωνικού δικτύου, σπρώχνοντάς το πίσω μέσω του νευρωνικού δικτύου.
10. Πώς μπορούν τα βαθιά δίκτυα να ξεπεράσουν τα ρηχά;
Τα κρυφά επίπεδα προστίθενται στα νευρωνικά δίκτυα εκτός από τα επίπεδα εισόδου και εξόδου. Μεταξύ των επιπέδων εισόδου και εξόδου, τα ρηχά νευρωνικά δίκτυα χρησιμοποιούν ένα μόνο κρυφό στρώμα, ενώ τα βαθιά νευρωνικά δίκτυα χρησιμοποιούν πολλά επίπεδα.
Ένα ρηχό δίκτυο απαιτεί πολλές παραμέτρους για να μπορεί να χωρέσει σε οποιαδήποτε λειτουργία. Τα βαθιά δίκτυα μπορούν να ταιριάζουν καλύτερα στις λειτουργίες ακόμη και με μικρό αριθμό παραμέτρων, καθώς περιλαμβάνουν πολλά επίπεδα.
Τα βαθιά δίκτυα προτιμώνται πλέον λόγω της ευελιξίας τους στην εργασία με κάθε τύπο μοντελοποίησης δεδομένων, είτε πρόκειται για αναγνώριση ομιλίας είτε για αναγνώριση εικόνας.
11. Περιγράψτε τη διάδοση προς τα εμπρός.
Οι είσοδοι μεταδίδονται μαζί με βάρη στο θαμμένο στρώμα σε μια διαδικασία γνωστή ως διάδοση προώθησης.
Η έξοδος της συνάρτησης ενεργοποίησης υπολογίζεται σε κάθε θαμμένο επίπεδο πριν προχωρήσει η επεξεργασία στο επόμενο επίπεδο.
Η διαδικασία ξεκινά από το επίπεδο εισόδου και προχωρά στο τελικό επίπεδο εξόδου, άρα το όνομα προς τα εμπρός.
12. Τι είναι η οπίσθια διάδοση;
Όταν τα βάρη και οι προκαταλήψεις προσαρμόζονται στο νευρωνικό δίκτυο, χρησιμοποιείται backpropagation για τη μείωση της συνάρτησης κόστους παρατηρώντας πρώτα πώς αλλάζει η τιμή.
Η κατανόηση της διαβάθμισης σε κάθε κρυφό επίπεδο κάνει τον υπολογισμό αυτής της αλλαγής απλό.
Η διαδικασία, γνωστή ως backpropagation, ξεκινά από το επίπεδο εξόδου και μετακινείται προς τα πίσω στα στρώματα εισόδου.
13. Στο πλαίσιο της βαθιάς μάθησης, πώς αντιλαμβάνεστε το ντεγκραντέ αποκοπή;
Το Gradient Clipping είναι μια μέθοδος για την επίλυση του προβλήματος των εκρηκτικών κλίσεων που προκύπτουν κατά την οπισθοδιάδοση (μια κατάσταση στην οποία συσσωρεύονται σημαντικές λανθασμένες κλίσεις με την πάροδο του χρόνου, οδηγώντας σε σημαντικές προσαρμογές στα βάρη των μοντέλων νευρωνικών δικτύων κατά τη διάρκεια της εκπαίδευσης).
Η έκρηξη των κλίσεων είναι ένα ζήτημα που προκύπτει όταν οι κλίσεις γίνονται πολύ μεγάλες κατά τη διάρκεια της εκπαίδευσης, καθιστώντας το μοντέλο ασταθές. Εάν η διαβάθμιση έχει διασχίσει το αναμενόμενο εύρος, οι τιμές διαβάθμισης ωθούνται στοιχείο προς στοιχείο σε μια προκαθορισμένη ελάχιστη ή μέγιστη τιμή.
Η αποκοπή κλίσης ενισχύει την αριθμητική σταθερότητα ενός νευρωνικού δικτύου κατά τη διάρκεια της εκπαίδευσης, αλλά έχει ελάχιστο αντίκτυπο στην απόδοση του μοντέλου.
14. Ποιες είναι οι Λειτουργίες Softmax και ReLU;
Μια συνάρτηση ενεργοποίησης που ονομάζεται Softmax παράγει μια έξοδο στην περιοχή μεταξύ 0 και 1. Κάθε έξοδος διαιρείται έτσι ώστε το άθροισμα όλων των εξόδων να είναι ένα. Για τα επίπεδα εξόδου, το Softmax χρησιμοποιείται συχνά.
Η Rectified Linear Unit, μερικές φορές γνωστή ως ReLU, είναι η πιο χρησιμοποιούμενη συνάρτηση ενεργοποίησης. Αν το Χ είναι θετικό, βγάζει Χ, αλλιώς μηδενικά. Το ReLU εφαρμόζεται τακτικά σε θαμμένα στρώματα.
15. Μπορεί ένα μοντέλο νευρωνικού δικτύου να εκπαιδευτεί με όλα τα βάρη 0;
Το νευρωνικό δίκτυο δεν θα μάθει ποτέ να ολοκληρώνει μια δεδομένη εργασία, επομένως δεν είναι δυνατό να εκπαιδεύσει ένα μοντέλο αρχικοποιώντας όλα τα βάρη στο 0.
Οι παράγωγοι θα παραμείνουν ίδιες για κάθε βάρος στο W [1] εάν όλα τα βάρη αρχικοποιηθούν στο μηδέν, κάτι που θα έχει ως αποτέλεσμα οι νευρώνες να μαθαίνουν τα ίδια χαρακτηριστικά επαναληπτικά.
Όχι απλά η αρχικοποίηση των βαρών στο 0, αλλά σε οποιαδήποτε μορφή σταθεράς είναι πιθανό να έχει ως αποτέλεσμα ένα χαμηλότερο αποτέλεσμα.
16. Τι διακρίνει μια εποχή από μια παρτίδα και μια επανάληψη;
Διαφορετικές μορφές επεξεργασίας συνόλων δεδομένων και τεχνικών gradient descent περιλαμβάνουν batch, iteration και epoch. Η εποχή περιλαμβάνει μία φορά μέσω ενός νευρωνικού δικτύου με πλήρες σύνολο δεδομένων, τόσο προς τα εμπρός όσο και προς τα πίσω.
Προκειμένου να παρέχονται αξιόπιστα αποτελέσματα, το σύνολο δεδομένων μεταβιβάζεται συχνά πολλές φορές, καθώς είναι πολύ μεγάλο για να περάσει με μία μόνο προσπάθεια.
Αυτή η πρακτική της επανειλημμένης εκτέλεσης μιας μικρής ποσότητας δεδομένων μέσω ενός νευρωνικού δικτύου αναφέρεται ως επανάληψη. Για να διασφαλιστεί ότι το σύνολο δεδομένων διασχίζει με επιτυχία τα νευρωνικά δίκτυα, μπορεί να χωριστεί σε έναν αριθμό παρτίδων ή υποσυνόλων, το οποίο είναι γνωστό ως batching.
Ανάλογα με το μέγεθος συλλογής δεδομένων, και οι τρεις μέθοδοι —εποχή, επανάληψη και μέγεθος παρτίδας— είναι ουσιαστικά τρόποι χρήσης του αλγόριθμος κατάβασης κλίσης.
17. Τι είναι η κανονικοποίηση παρτίδας και η εγκατάλειψη;
Η εγκατάλειψη αποτρέπει την υπερπροσαρμογή δεδομένων αφαιρώντας τυχαία τόσο τις ορατές όσο και τις κρυφές μονάδες δικτύου (συνήθως απορρίπτοντας το 20 τοις εκατό των κόμβων). Διπλασιάζει τον αριθμό των επαναλήψεων που απαιτούνται για τη σύγκλιση του δικτύου.
Με την κανονικοποίηση των εισόδων σε κάθε επίπεδο ώστε να έχουν μέση ενεργοποίηση εξόδου μηδέν και τυπική απόκλιση XNUMX, η κανονικοποίηση παρτίδας είναι μια στρατηγική για τη βελτίωση της απόδοσης και της σταθερότητας των νευρωνικών δικτύων.
18. Τι διαχωρίζει τη Στοχαστική κλίση κάθοδος από την κατά παρτίδα κλίση κάθοδος;
Κάθοδος διαβάθμισης παρτίδας:
- Το πλήρες σύνολο δεδομένων χρησιμοποιείται για την κατασκευή της διαβάθμισης για τη διαβάθμιση παρτίδας.
- Ο τεράστιος όγκος δεδομένων και τα βάρη που ενημερώνονται αργά κάνουν τη σύγκλιση δύσκολη.
Στοχαστική κλίση:
- Η στοχαστική κλίση χρησιμοποιεί ένα μόνο δείγμα για να υπολογίσει τη διαβάθμιση.
- Λόγω των πιο συχνών αλλαγών βάρους, συγκλίνει σημαντικά πιο γρήγορα από την κλίση παρτίδας.
19. Γιατί είναι κρίσιμο να συμπεριληφθούν οι μη γραμμικότητες στα νευρωνικά δίκτυα;
Ανεξάρτητα από το πόσα επίπεδα υπάρχουν, ένα νευρωνικό δίκτυο θα συμπεριφέρεται σαν perceptron απουσία μη γραμμικοτήτων, καθιστώντας την έξοδο γραμμικά εξαρτώμενη από την είσοδο.
Για να το θέσω αλλιώς, ένα νευρωνικό δίκτυο με n επίπεδα και m κρυφές μονάδες και συναρτήσεις γραμμικής ενεργοποίησης ισοδυναμεί με ένα γραμμικό νευρωνικό δίκτυο χωρίς κρυφά επίπεδα και με την ικανότητα να ανιχνεύει αποκλειστικά γραμμικά όρια διαχωρισμού.
Χωρίς μη γραμμικότητες, ένα νευρωνικό δίκτυο δεν είναι σε θέση να λύσει περίπλοκα ζητήματα και να κατηγοριοποιήσει με ακρίβεια τα δεδομένα εισόδου.
20. Τι είναι ο τανυστής στη βαθιά μάθηση;
Ένας πολυδιάστατος πίνακας γνωστός ως τανυστής χρησιμεύει ως γενίκευση πινάκων και διανυσμάτων. Είναι μια κρίσιμη δομή δεδομένων για τη βαθιά μάθηση. Πίνακες Ν-διαστάσεων βασικών τύπων δεδομένων χρησιμοποιούνται για την αναπαράσταση τανυστών.
Κάθε στοιχείο του τανυστή έχει τον ίδιο τύπο δεδομένων και αυτός ο τύπος δεδομένων είναι πάντα γνωστός. Είναι πιθανό ότι μόνο ένα κομμάτι του σχήματος —δηλαδή, πόσες διαστάσεις υπάρχουν και πόσο μεγάλο είναι το καθένα— είναι γνωστό.
Σε περιπτώσεις όπου οι είσοδοι είναι επίσης πλήρως γνωστές, η πλειονότητα των λειτουργιών παράγει πλήρως γνωστούς τανυστές. Σε άλλες περιπτώσεις, η μορφή ενός τανυστή μπορεί να καθοριστεί μόνο κατά την εκτέλεση γραφήματος.
21. Πώς θα επιλέγατε τη συνάρτηση ενεργοποίησης για ένα μοντέλο βαθιάς μάθησης;
- Είναι λογικό να χρησιμοποιείται μια γραμμική συνάρτηση ενεργοποίησης εάν το αποτέλεσμα που πρέπει να προβλεφθεί είναι πραγματικό.
- Μια συνάρτηση Sigmoid θα πρέπει να χρησιμοποιηθεί εάν η έξοδος που πρέπει να προβλεφθεί είναι μια πιθανότητα δυαδικής κλάσης.
- Μια συνάρτηση Tanh μπορεί να χρησιμοποιηθεί εάν η προβαλλόμενη έξοδος περιέχει δύο ταξινομήσεις.
- Λόγω της ευκολίας υπολογισμού της, η συνάρτηση ReLU είναι εφαρμόσιμη σε ένα ευρύ φάσμα καταστάσεων.
22. Τι εννοείτε με το CNN;
Τα βαθιά νευρωνικά δίκτυα που ειδικεύονται στην αξιολόγηση οπτικών εικόνων περιλαμβάνουν συνελικτικά νευρωνικά δίκτυα (CNN ή ConvNet). Εδώ, αντί στα νευρωνικά δίκτυα όπου ένα διάνυσμα αντιπροσωπεύει την είσοδο, η είσοδος είναι μια εικόνα πολλαπλών καναλιών.
Τα πολυστρωματικά perceptron χρησιμοποιούνται με έναν ειδικό τρόπο από τα CNN που απαιτεί πολύ λίγη προεπεξεργασία.
23. Ποια είναι τα πολλά επίπεδα CNN;
Συνελικτικό στρώμα: Το κύριο στρώμα είναι το συνελικτικό στρώμα, το οποίο έχει μια ποικιλία από φίλτρα που μπορούν να μάθουν και ένα δεκτικό πεδίο. Αυτό το αρχικό επίπεδο λαμβάνει τα δεδομένα εισόδου και εξάγει τα χαρακτηριστικά τους.
Επίπεδο ReLU: Κάνοντας τα δίκτυα μη γραμμικά, αυτό το επίπεδο μετατρέπει τα αρνητικά εικονοστοιχεία σε μηδέν.
Επίπεδο συγκέντρωσης: Ελαχιστοποιώντας τις ρυθμίσεις επεξεργασίας και δικτύου, το επίπεδο συγκέντρωσης ελαχιστοποιεί σταδιακά το χωρικό μέγεθος της αναπαράστασης. Το Max pooling είναι η πιο χρησιμοποιούμενη μέθοδος συγκέντρωσης.
24. Ποιες είναι οι επιπτώσεις της υπερβολικής και της υποσυναρμολόγησης και πώς μπορείτε να τις αποφύγετε;
Αυτό είναι γνωστό ως υπερπροσαρμογή όταν ένα μοντέλο μαθαίνει τις περιπλοκές και τον θόρυβο στα δεδομένα εκπαίδευσης σε σημείο που επηρεάζει αρνητικά τη χρήση φρέσκων δεδομένων από το μοντέλο.
Είναι πιο πιθανό να συμβεί με μη γραμμικά μοντέλα που είναι πιο προσαρμόσιμα κατά την εκμάθηση μιας συνάρτησης στόχου. Ένα μοντέλο μπορεί να εκπαιδευτεί να ανιχνεύει αυτοκίνητα και φορτηγά, αλλά μπορεί να αναγνωρίζει μόνο οχήματα με μια συγκεκριμένη φόρμα κουτιού.
Δεδομένου ότι εκπαιδεύτηκε μόνο σε έναν τύπο φορτηγού, ενδέχεται να μην είναι σε θέση να ανιχνεύσει φορτηγό με επίπεδη επιφάνεια. Σε δεδομένα εκπαίδευσης, το μοντέλο λειτουργεί καλά, αλλά όχι στον πραγματικό κόσμο.
Ένα υπο-προσαρμοσμένο μοντέλο αναφέρεται σε ένα μοντέλο που δεν είναι επαρκώς εκπαιδευμένο σε δεδομένα ή δεν μπορεί να γενικευτεί σε νέες πληροφορίες. Αυτό συμβαίνει συχνά όταν ένα μοντέλο εκπαιδεύεται με ανεπαρκή ή ανακριβή δεδομένα.
Η ακρίβεια και η απόδοση διακυβεύονται από την ανεπαρκή προσαρμογή.
Η επαναδειγματοληψία των δεδομένων για την εκτίμηση της ακρίβειας του μοντέλου (διασταυρούμενη επικύρωση K-fold) και η χρήση ενός συνόλου δεδομένων επικύρωσης για την αξιολόγηση του μοντέλου είναι δύο τρόποι για να αποφευχθεί η υπερπροσαρμογή και η υποπροσαρμογή.
25. Στη βαθιά μάθηση, τι είναι το RNN;
Τα επαναλαμβανόμενα νευρωνικά δίκτυα (RNN), μια κοινή ποικιλία τεχνητών νευρωνικών δικτύων, προέρχονται από τη συντομογραφία RNN. Χρησιμοποιούνται για την επεξεργασία γονιδιωμάτων, χειρογράφου, κειμένου και αλληλουχιών δεδομένων, μεταξύ άλλων. Για την απαραίτητη εκπαίδευση, τα RNN χρησιμοποιούν backpropagation.
26. Περιγράψτε το Adam Optimizer
Το Adam optimizer, γνωστό και ως προσαρμοστική ορμή, είναι μια τεχνική βελτιστοποίησης που αναπτύχθηκε για να χειρίζεται θορυβώδεις καταστάσεις με αραιές κλίσεις.
Εκτός από την παροχή ενημερώσεων ανά παράμετρο για ταχύτερη σύγκλιση, το Adam optimizer ενισχύει τη σύγκλιση μέσω της ορμής, διασφαλίζοντας ότι ένα μοντέλο δεν παγιδεύεται στο σημείο της σέλας.
27. Deep autoencoder: τι είναι αυτοί;
Deep autoencoder είναι το συλλογικό όνομα για δύο συμμετρικά δίκτυα βαθιάς πεποίθησης που γενικά περιλαμβάνουν τέσσερα ή πέντε ρηχά στρώματα για το μισό κωδικοποίησης του δικτύου και ένα άλλο σύνολο τεσσάρων ή πέντε επιπέδων για το μισό αποκωδικοποίησης.
Αυτά τα στρώματα αποτελούν τη βάση των δικτύων βαθιάς πεποίθησης και περιορίζονται από τις μηχανές Boltzmann. Μετά από κάθε RBM, ένας βαθύς αυτόματος κωδικοποιητής εφαρμόζει δυαδικές αλλαγές στο σύνολο δεδομένων MNIST.
Μπορούν επίσης να χρησιμοποιηθούν σε άλλα σύνολα δεδομένων όπου οι διορθωμένοι μετασχηματισμοί Gauss θα προτιμώνται έναντι του RBM.
28. Τι σημαίνει Tensor στο Tensorflow;
Αυτή είναι μια άλλη ερώτηση συνέντευξης βαθιάς μάθησης που τίθεται τακτικά. Ο τανυστής είναι μια μαθηματική έννοια που απεικονίζεται ως πίνακες υψηλότερων διαστάσεων.
Οι τανυστές είναι αυτές οι συστοιχίες δεδομένων που παρέχονται ως είσοδος στο νευρωνικό δίκτυο και έχουν διάφορες διαστάσεις και ταξινομήσεις.
29. Μια επεξήγηση ενός υπολογιστικού γραφήματος
Η βάση ενός TensorFlow είναι η κατασκευή ενός υπολογιστικού γραφήματος. Κάθε κόμβος λειτουργεί σε ένα δίκτυο κόμβων, όπου οι κόμβοι αντιπροσωπεύουν τις μαθηματικές πράξεις και οι ακμές για τους τανυστές.
Μερικές φορές αναφέρεται ως "Γράφημα ροής δεδομένων" καθώς τα δεδομένα ρέουν σε σχήμα γραφήματος.
30. Generative adversarial networks (GANs): ποια είναι αυτά;
Στο Deep Learning, η παραγωγική μοντελοποίηση ολοκληρώνεται με τη χρήση παραγωγικών δικτύων αντιπάλου. Είναι μια εργασία χωρίς επίβλεψη όπου το αποτέλεσμα παράγεται με την αναγνώριση μοτίβων στα δεδομένα εισόδου.
Ο διαχωριστής χρησιμοποιείται για την κατηγοριοποίηση των περιπτώσεων που παράγονται από τη γεννήτρια, ενώ η γεννήτρια χρησιμοποιείται για την παραγωγή νέων παραδειγμάτων.
31. Πώς θα επιλέξετε τον αριθμό των νευρώνων και των κρυφών επιπέδων που θα συμπεριλάβετε στο νευρωνικό δίκτυο καθώς σχεδιάζετε την αρχιτεκτονική;
Δεδομένης μιας επιχειρηματικής πρόκλησης, ο ακριβής αριθμός των νευρώνων και των κρυφών επιπέδων που απαιτούνται για την κατασκευή μιας αρχιτεκτονικής νευρωνικών δικτύων δεν μπορεί να προσδιοριστεί από σκληρούς και γρήγορους κανόνες.
Σε ένα νευρωνικό δίκτυο, το μέγεθος του κρυφού στρώματος θα πρέπει να πέφτει κάπου στη μέση του μεγέθους των επιπέδων εισόδου και εξόδου.
Η αρχή για τη δημιουργία ενός σχεδίου νευρωνικού δικτύου μπορεί να επιτευχθεί με μερικές απλές μεθόδους, ωστόσο:
Ξεκινώντας με κάποιες βασικές συστηματικές δοκιμές για να δείτε τι θα αποδώσει καλύτερα για οποιοδήποτε συγκεκριμένο σύνολο δεδομένων με βάση την προηγούμενη εμπειρία με νευρωνικά δίκτυα σε παρόμοιες πραγματικές ρυθμίσεις είναι ο καλύτερος τρόπος για να αντιμετωπίσετε κάθε μοναδική πρόκληση προγνωστικής μοντελοποίησης πραγματικού κόσμου.
Η ρύθμιση παραμέτρων δικτύου μπορεί να επιλεγεί με βάση τις γνώσεις κάποιου για τον τομέα του ζητήματος και την προηγούμενη εμπειρία του νευρωνικού δικτύου. Κατά την αξιολόγηση της ρύθμισης ενός νευρωνικού δικτύου, ο αριθμός των επιπέδων και των νευρώνων που χρησιμοποιούνται σε σχετικά προβλήματα είναι ένα καλό μέρος για να ξεκινήσετε.
Η πολυπλοκότητα του νευρωνικού δικτύου θα πρέπει να αυξάνεται σταδιακά με βάση την προβλεπόμενη έξοδο και την ακρίβεια, ξεκινώντας με έναν απλό σχεδιασμό νευρωνικών δικτύων.
32. Ποια είδη νευρωνικών δικτύων χρησιμοποιούνται από τη βαθιά ενισχυτική μάθηση;
- Σε ένα παράδειγμα μηχανικής μάθησης που ονομάζεται ενισχυτική μάθηση, το μοντέλο δρα για να μεγιστοποιήσει την ιδέα της σωρευτικής ανταμοιβής, όπως ακριβώς κάνουν τα ζωντανά πράγματα.
- Τα παιχνίδια και τα αυτοοδηγούμενα οχήματα περιγράφονται και τα δύο ως προβλήματα ενίσχυση μάθησης.
- Η οθόνη χρησιμοποιείται ως είσοδος εάν το πρόβλημα που πρέπει να αναπαρασταθεί είναι παιχνίδι. Προκειμένου να παραχθεί μια έξοδος για τις επόμενες φάσεις, ο αλγόριθμος παίρνει τα εικονοστοιχεία ως είσοδο και τα επεξεργάζεται μέσω πολλών επιπέδων συνελικτικών νευρωνικών δικτύων.
- Τα αποτελέσματα των ενεργειών του μοντέλου, είτε ευνοϊκά είτε κακά, λειτουργούν ως ενίσχυση.
Συμπέρασμα
Το Deep Learning έχει αυξηθεί σε δημοτικότητα με τα χρόνια, με εφαρμογές σε σχεδόν κάθε κλάδο του κλάδου.
Οι εταιρείες αναζητούν όλο και περισσότερο ικανούς ειδικούς που μπορούν να σχεδιάσουν μοντέλα που αναπαράγουν την ανθρώπινη συμπεριφορά χρησιμοποιώντας προσεγγίσεις βαθιάς μάθησης και μηχανικής μάθησης.
Οι υποψήφιοι που αυξάνουν το σύνολο των δεξιοτήτων τους και διατηρούν τις γνώσεις τους για αυτές τις τεχνολογίες αιχμής μπορούν να βρουν ένα ευρύ φάσμα ευκαιριών εργασίας με ελκυστικές αποδοχές.
Μπορείτε να ξεκινήσετε με τις συνεντεύξεις τώρα που έχετε μια ισχυρή αντίληψη για το πώς να απαντήσετε σε μερικές από τις πιο συχνά ζητούμενες ερωτήσεις συνέντευξης βαθιάς μάθησης. Κάντε το επόμενο βήμα με βάση τους στόχους σας.
Επισκεφθείτε το Hashdork's Σειρά συνέντευξης να προετοιμαστούν για συνεντεύξεις.
Αφήστε μια απάντηση