Πίνακας περιεχομένων[Κρύβω][Προβολή]
- 1. Τι εννοείτε με τον όρο MLOps;
- 2. Πώς διαφέρουν οι επιστήμονες δεδομένων, οι μηχανικοί δεδομένων και οι μηχανικοί ML;
- 3. Τι διακρίνει τα MLOps από τα ModelOps και AIOps;
- 4. Μπορείτε να μου πείτε μερικά από τα οφέλη των MLOps;
- 5. Μπορείτε να μου πείτε τα στοιχεία των MLOps;
- 6. Τι κινδύνους συνεπάγεται η χρήση της επιστήμης δεδομένων;
- 7. Μπορείτε να εξηγήσετε, τι είναι το model drift;
- 8. Πόσοι διαφορετικοί τρόποι μπορούν να εφαρμοστούν τα MLOps, κατά τη γνώμη σας;
- 9. Τι διαχωρίζει τη στατική ανάπτυξη από τη δυναμική;
- 10. Ποιες τεχνικές δοκιμών παραγωγής γνωρίζετε;
- 11. Τι διακρίνει την επεξεργασία ροής από την επεξεργασία κατά παρτίδες;
- 12. Τι εννοείτε με τον όρο Training Serving Skew;
- 13. Τι εννοείτε με τον όρο Μητρώο Μοντέλων;
- 14. Μπορείτε να αναλύσετε τα οφέλη του Μοντέλου Μητρώου;
- 15. Μπορείτε να εξηγήσετε τα έργα τεχνικής Champion-Challenger;
- 16. Περιγράψτε τις εφαρμογές του κύκλου ζωής MLOps σε επίπεδο επιχείρησης;
- Συμπέρασμα
Οι εταιρείες χρησιμοποιούν πιο συχνά αναδυόμενες τεχνολογίες όπως η τεχνητή νοημοσύνη (AI) και η μηχανική μάθηση (ML) για να αυξήσουν την προσβασιμότητα του κοινού σε πληροφορίες και υπηρεσίες.
Αυτές οι τεχνολογίες χρησιμοποιούνται όλο και περισσότερο σε διάφορους τομείς, συμπεριλαμβανομένων των τραπεζών, των χρηματοοικονομικών, του λιανικού εμπορίου, της μεταποίησης, ακόμη και της υγειονομικής περίθαλψης.
Οι επιστήμονες δεδομένων, οι μηχανικοί μηχανικής μάθησης και οι μηχανικοί στην τεχνητή νοημοσύνη έχουν ζήτηση από έναν αυξανόμενο αριθμό εταιρειών.
Γνωρίζοντας το δυνατό μάθηση μηχανής Οι ερωτήσεις συνέντευξης λειτουργίας που θα μπορούσαν να σας θέτουν οι διευθυντές προσλήψεων και οι υπεύθυνοι προσλήψεων είναι απαραίτητες εάν θέλετε να εργαστείτε στους τομείς ML ή MLOps.
Μπορείτε να μάθετε πώς να απαντάτε σε ορισμένες από τις ερωτήσεις συνέντευξης MLOps σε αυτήν την ανάρτηση καθώς εργάζεστε για να αποκτήσετε τη δουλειά των ονείρων σας.
1. Τι εννοείτε με τον όρο MLOps;
Το θέμα της λειτουργικότητας των μοντέλων ML είναι το επίκεντρο των MLOps, γνωστών και ως Λειτουργίες Μηχανικής Μάθησης, ενός αναπτυσσόμενου πεδίου στον πιο σημαντικό χώρο AI/DS/ML.
Ο κύριος στόχος της προσέγγισης και της κουλτούρας της μηχανικής λογισμικού που είναι γνωστή ως MLOps είναι να ενσωματώσει τη δημιουργία μοντέλων μηχανικής μάθησης/επιστήμης δεδομένων και την επακόλουθη λειτουργικοποίησή τους (Ops).
Τα συμβατικά DevOps και τα MLO μοιράζονται ορισμένες ομοιότητες, ωστόσο, τα MLOs διαφέρουν επίσης πολύ από τα παραδοσιακά DevOps.
Το MLOps προσθέτει ένα νέο επίπεδο πολυπλοκότητας εστιάζοντας στα δεδομένα, ενώ το DevOps εστιάζει κυρίως στη λειτουργικότητα των εκδόσεων κώδικα και λογισμικού που δεν μπορούν να έχουν κατάσταση.
Ο συνδυασμός ML, Data και Ops είναι αυτός που δίνει στα MLO το κοινό τους όνομα (μηχανική εκμάθηση, μηχανική δεδομένων και DevOps).
2. Πώς διαφέρουν οι επιστήμονες δεδομένων, οι μηχανικοί δεδομένων και οι μηχανικοί ML;
Διαφέρει, κατά τη γνώμη μου, ανάλογα με την εταιρεία. Το περιβάλλον για τη μεταφορά και τη μετατροπή δεδομένων, καθώς και την αποθήκευσή τους, δημιουργείται από μηχανικούς δεδομένων.
Οι επιστήμονες δεδομένων είναι ειδικοί στη χρήση επιστημονικών και στατιστικών τεχνικών για την ανάλυση δεδομένων και την εξαγωγή συμπερασμάτων, συμπεριλαμβανομένης της πραγματοποίησης προβλέψεων για τη μελλοντική συμπεριφορά με βάση τις τάσεις που υπάρχουν τώρα.
Οι μηχανικοί λογισμικού μελετούσαν τις λειτουργίες και τη διαχείριση της υποδομής ανάπτυξης πριν από μερικά χρόνια. Οι ομάδες Ops, από την άλλη πλευρά, μελετούσαν την ανάπτυξη ενώ χρησιμοποιούσαν την υποδομή ως κώδικα. Μια θέση DevOps δημιουργήθηκε από αυτές τις δύο ροές.
Το MLOps είναι στην ίδια κατηγορία με Data Scientist και Μηχανικός Δεδομένων. Οι μηχανικοί δεδομένων αποκτούν γνώση σχετικά με την υποδομή που απαιτείται για την υποστήριξη των κύκλων ζωής των μοντέλων και τη δημιουργία αγωγών για συνεχή εκπαίδευση.
Οι επιστήμονες δεδομένων επιδιώκουν να αναπτύξουν τις δυνατότητες ανάπτυξης και βαθμολόγησης των μοντέλων τους.
Ένας αγωγός δεδομένων ποιότητας παραγωγής κατασκευάζεται από μηχανικούς ML χρησιμοποιώντας την υποδομή που μετατρέπει τα ακατέργαστα δεδομένα στην είσοδο που χρειάζεται ένα μοντέλο επιστήμης δεδομένων, φιλοξενεί και εκτελεί το μοντέλο και εξάγει ένα βαθμολογημένο σύνολο δεδομένων σε συστήματα κατάντη.
Τόσο οι μηχανικοί δεδομένων όσο και οι επιστήμονες δεδομένων μπορούν να γίνουν μηχανικοί ML.
3. Τι διακρίνει τα MLOps από τα ModelOps και AIOps;
Κατά την κατασκευή από άκρο σε άκρο αλγόριθμους μηχανικής μάθησης, το MLOps είναι μια εφαρμογή DevOps που περιλαμβάνει συλλογή δεδομένων, προεπεξεργασία δεδομένων, δημιουργία μοντέλου, ανάπτυξη μοντέλου στην παραγωγή, παρακολούθηση μοντέλου στην παραγωγή και περιοδική αναβάθμιση μοντέλου.
Η χρήση του DevOps στον χειρισμό της συνολικής υλοποίησης οποιωνδήποτε αλγορίθμων, όπως τα μοντέλα που βασίζονται σε κανόνες, είναι γνωστή ως ModelOps.
AI Ops αξιοποιεί τις αρχές του DevOps για τη δημιουργία εφαρμογών AI από την αρχή.
4. Μπορείτε να μου πείτε μερικά από τα οφέλη των MLOps;
- Οι επιστήμονες δεδομένων και οι προγραμματιστές MLOps μπορούν να επαναλάβουν γρήγορα δοκιμές για να διασφαλίσουν ότι τα μοντέλα εκπαιδεύονται και αξιολογούνται κατάλληλα, καθώς τα MLOps βοηθούν στην αυτοματοποίηση όλων ή των περισσότερων εργασιών/βημάτων στο MDLC (κύκλος ζωής ανάπτυξης μοντέλου). Επιπλέον επιτρέπει έκδοση δεδομένων και μοντέλου.
- Η εφαρμογή των ιδεών MLOps επιτρέπει στους Data Engineers και Data Scientists να έχουν απεριόριστη πρόσβαση σε καλλιεργημένα και επιμελημένα σύνολα δεδομένων, γεγονός που επιταχύνει εκθετικά την ανάπτυξη μοντέλων.
- Οι επιστήμονες δεδομένων θα μπορούν να επανέλθουν στο μοντέλο που είχε καλύτερη απόδοση εάν η τρέχουσα επανάληψη δεν ανταποκρίνεται στις προσδοκίες, χάρη στη δυνατότητα έκδοσης μοντέλων και συνόλων δεδομένων, γεγονός που θα βελτιώσει σημαντικά τη διαδρομή ελέγχου του μοντέλου.
- Καθώς οι μέθοδοι MLOps βασίζονται σε μεγάλο βαθμό στα DevOps, ενσωματώνουν επίσης μια σειρά από έννοιες CI/CD, γεγονός που ενισχύει την ποιότητα και αξιοπιστία του κώδικα.
5. Μπορείτε να μου πείτε τα στοιχεία των MLOps;
Υπηρεσίες: Τα MLO περιλαμβάνουν σε μεγάλο βαθμό τη σχεδιαστική σκέψη. Ξεκινώντας από τη φύση του ζητήματος, δοκιμάζοντας υποθέσεις, αρχιτεκτονική και ανάπτυξη
Μοντέλο κτίριο: Η δοκιμή και η επικύρωση μοντέλων αποτελούν μέρος αυτού του βήματος, μαζί με τους αγωγούς μηχανικής δεδομένων και τον πειραματισμό για τη δημιουργία των καλύτερων συστημάτων μηχανικής εκμάθησης.
λειτουργίες: Το μοντέλο πρέπει να εφαρμόζεται ως μέρος των λειτουργιών και να ελέγχεται και να αξιολογείται συνεχώς. Στη συνέχεια, οι διαδικασίες CI/CD παρακολουθούνται και ξεκινούν χρησιμοποιώντας ένα εργαλείο ενορχήστρωσης.
6. Τι κινδύνους συνεπάγεται η χρήση της επιστήμης δεδομένων;
- Είναι δύσκολο να κλιμακωθεί το μοντέλο σε όλη την εταιρεία.
- Χωρίς προειδοποίηση, το μοντέλο σβήνει και σταματά να λειτουργεί.
- Κυρίως, η ακρίβεια των μοντέλων χειροτερεύει με τον καιρό.
- Το μοντέλο κάνει ανακριβείς προβλέψεις με βάση μια συγκεκριμένη παρατήρηση που δεν μπορεί να εξεταστεί περαιτέρω.
- Οι επιστήμονες δεδομένων θα πρέπει επίσης να διατηρούν μοντέλα, αλλά είναι ακριβά.
- Τα MLOps μπορούν να χρησιμοποιηθούν για τη μείωση αυτών των κινδύνων.
7. Μπορείτε να εξηγήσετε, τι είναι το model drift;
Όταν η απόδοση της φάσης συμπερασμάτων ενός μοντέλου (χρησιμοποιώντας δεδομένα πραγματικού κόσμου) επιδεινώνεται από την απόδοση της φάσης εκπαίδευσης, αυτό είναι γνωστό ως μετατόπιση μοντέλου, γνωστό και ως μετατόπιση ιδεών (με χρήση ιστορικών δεδομένων με ετικέτα).
Η απόδοση του μοντέλου είναι λοξή σε σύγκριση με τις φάσεις εκπαίδευσης και σερβίρισμα, εξ ου και η ονομασία "εκπαίδευση/σερβιρίσματος λοξή".
Πολλοί παράγοντες, μεταξύ των οποίων:
- Ο θεμελιώδης τρόπος με τον οποίο διανέμονται τα δεδομένα έχει αλλάξει.
- Η εκπαίδευση επικεντρώθηκε σε έναν μικρό αριθμό κατηγοριών, ωστόσο, μια περιβαλλοντική μετατόπιση που μόλις έγινε πρόσθεσε έναν άλλο τομέα.
- Στις δυσκολίες NLP, τα δεδομένα του πραγματικού κόσμου έχουν δυσανάλογα μεγαλύτερο αριθμό κουπονιών από τα δεδομένα εκπαίδευσης.
- Απροσδόκητα περιστατικά, όπως ένα μοντέλο που βασίζεται σε δεδομένα προ-COVID που προβλέπεται να έχει σημαντικά χειρότερη απόδοση σε δεδομένα που συλλέχθηκαν κατά τη διάρκεια της επιδημίας COVID-19.
Απαιτείται πάντα η συνεχής παρακολούθηση της απόδοσης του μοντέλου για τον εντοπισμό της μετατόπισης του μοντέλου.
Η επανεκπαίδευση του μοντέλου απαιτείται σχεδόν πάντα ως θεραπεία όταν υπάρχει επίμονη πτώση στην απόδοση του μοντέλου. πρέπει να εντοπιστεί ο λόγος της πτώσης και να χρησιμοποιηθούν οι κατάλληλες διαδικασίες θεραπείας.
8. Πόσοι διαφορετικοί τρόποι μπορούν να εφαρμοστούν τα MLOps, κατά τη γνώμη σας;
Υπάρχουν τρεις μέθοδοι για την εφαρμογή των MLOps:
MLOps επίπεδο 0 (Μη αυτόματη διαδικασία): Σε αυτό το επίπεδο, όλα τα βήματα —συμπεριλαμβανομένης της προετοιμασίας δεδομένων, της ανάλυσης και της εκπαίδευσης— εκτελούνται χειροκίνητα. Κάθε στάδιο πρέπει να εκτελείται χειροκίνητα, καθώς και η μετάβαση από το ένα στο επόμενο.
Η βασική προϋπόθεση είναι ότι η ομάδα επιστήμης δεδομένων σας διαχειρίζεται μόνο έναν μικρό αριθμό μοντέλων που δεν ενημερώνονται συχνά.
Ως αποτέλεσμα, δεν υπάρχει Συνεχής Ενοποίηση (CI) ή Συνεχής Ανάπτυξη (CD) και η δοκιμή του κώδικα συνήθως ενσωματώνεται στην εκτέλεση σεναρίου ή στην εκτέλεση σημειωματάριου, με την ανάπτυξη να λαμβάνει χώρα σε μια μικρουπηρεσία με REST API.
MLOps επιπέδου 1 (αυτοματοποίηση του αγωγού ML): Με την αυτοματοποίηση της διαδικασίας ML, ο στόχος είναι η συνεχής εκπαίδευση του μοντέλου (CT). Μπορείτε να επιτύχετε συνεχή παροχή υπηρεσιών πρόβλεψης μοντέλου με αυτόν τον τρόπο.
Η ανάπτυξη ενός ολόκληρου αγωγού εκπαίδευσης διασφαλίζει ότι το μοντέλο εκπαιδεύεται αυτόματα στην παραγωγή χρησιμοποιώντας νέα δεδομένα που βασίζονται σε ενεργούς ενεργοποιητές αγωγών.
MLOps επίπεδο 2 (αυτοματισμός του αγωγού CI/CD): Πάει ένα βήμα πάνω από το επίπεδο MLOps. Απαιτείται ένα ισχυρό αυτοματοποιημένο σύστημα CI/CD εάν θέλετε να ενημερώσετε τους αγωγούς στην παραγωγή γρήγορα και αξιόπιστα:
- Δημιουργείτε πηγαίο κώδικα και εκτελείτε πολυάριθμες δοκιμές σε όλο το στάδιο CI. Τα πακέτα, τα εκτελέσιμα και τα τεχνουργήματα είναι τα αποτελέσματα της σκηνής, τα οποία θα αναπτυχθούν αργότερα.
- Τα τεχνουργήματα που δημιουργούνται από το στάδιο CI αναπτύσσονται στο περιβάλλον στόχο κατά τη διάρκεια του βήματος του CD. Ένας αναπτυγμένος αγωγός με την αναθεωρημένη υλοποίηση του μοντέλου είναι το αποτέλεσμα του σταδίου.
- Πριν ο αγωγός ξεκινήσει μια νέα επανάληψη του πειράματος, οι επιστήμονες δεδομένων πρέπει να κάνουν τη φάση ανάλυσης δεδομένων και μοντέλων με μη αυτόματο τρόπο.
9. Τι διαχωρίζει τη στατική ανάπτυξη από τη δυναμική;
Το μοντέλο έχει εκπαιδευτεί εκτός σύνδεσης για Στατική Ανάπτυξη. Με άλλα λόγια, εκπαιδεύουμε το μοντέλο ακριβώς μία φορά και μετά το χρησιμοποιούμε για λίγο. Αφού το μοντέλο έχει εκπαιδευτεί τοπικά, αποθηκεύεται και αποστέλλεται στον διακομιστή για να χρησιμοποιηθεί για την παραγωγή προβλέψεων σε πραγματικό χρόνο.
Στη συνέχεια, το μοντέλο διανέμεται ως λογισμικό εφαρμογής με δυνατότητα εγκατάστασης. ένα πρόγραμμα που επιτρέπει τη ομαδική βαθμολόγηση των αιτημάτων, ενδεικτικά.
Το μοντέλο εκπαιδεύεται διαδικτυακά για Δυναμική Ανάπτυξη. Δηλαδή, νέα δεδομένα προστίθενται συνεχώς στο σύστημα και το μοντέλο ενημερώνεται συνεχώς για να τα λαμβάνει υπόψη.
Ως αποτέλεσμα, μπορείτε να κάνετε προβλέψεις χρησιμοποιώντας έναν διακομιστή κατά παραγγελία. Μετά από αυτό, το μοντέλο τίθεται σε χρήση παρέχοντας ως τελικό σημείο API που αντιδρά στα ερωτήματα των χρηστών, χρησιμοποιώντας ένα πλαίσιο ιστού όπως Flask ή FastAPI.
10. Ποιες τεχνικές δοκιμών παραγωγής γνωρίζετε;
Μαζική δοκιμή: Πραγματοποιώντας δοκιμές σε περιβάλλον διαφορετικό από αυτό του εκπαιδευτικού του περιβάλλοντος, επαληθεύει το μοντέλο. Χρησιμοποιώντας μετρήσεις επιλογής, όπως ακρίβεια, RMSE, κ.λπ., γίνεται δοκιμή παρτίδας σε μια ομάδα δειγμάτων δεδομένων για την επαλήθευση των συμπερασμάτων του μοντέλου.
Η δέσμη δοκιμών μπορεί να πραγματοποιηθεί σε μια ποικιλία υπολογιστικών πλατφορμών, όπως σε δοκιμαστικό διακομιστή, σε απομακρυσμένο διακομιστή ή στο cloud. Συνήθως, το μοντέλο παρέχεται ως σειριακό αρχείο, το οποίο φορτώνεται ως αντικείμενο και προκύπτει από τα δεδομένα δοκιμής.
Α / Β δοκιμές: Χρησιμοποιείται συχνά για την ανάλυση εκστρατειών μάρκετινγκ καθώς και για το σχεδιασμό υπηρεσιών (ιστοσελίδες, εφαρμογές για κινητά κ.λπ.).
Με βάση την εταιρεία ή τις λειτουργίες, χρησιμοποιούνται στατιστικές προσεγγίσεις για την ανάλυση των αποτελεσμάτων της δοκιμής A/B για να αποφασιστεί ποιο μοντέλο θα έχει καλύτερη απόδοση στην παραγωγή. Συνήθως, η δοκιμή A/B γίνεται με τον ακόλουθο τρόπο:
- Τα ζωντανά δεδομένα ή τα δεδομένα σε πραγματικό χρόνο χωρίζονται ή τμηματοποιούνται σε δύο σύνολα, σετ Α και σετ Β.
- Τα δεδομένα του συνόλου Α αποστέλλονται στο παλιό μοντέλο, ενώ τα δεδομένα του συνόλου Β στο ενημερωμένο μοντέλο.
- Ανάλογα με την περίπτωση ή τις διαδικασίες επιχειρηματικής χρήσης, μπορούν να χρησιμοποιηθούν διάφορες στατιστικές προσεγγίσεις για την αξιολόγηση της απόδοσης του μοντέλου (για παράδειγμα, ακρίβεια, ακρίβεια, κ.λπ.) για να προσδιοριστεί εάν το νέο μοντέλο (μοντέλο Β) υπερτερεί του παλιού μοντέλου (μοντέλο Α).
- Στη συνέχεια κάνουμε έλεγχο στατιστικών υποθέσεων: Η μηδενική υπόθεση λέει ότι το νέο μοντέλο δεν έχει καμία επίδραση στη μέση τιμή των δεικτών της επιχείρησης που παρακολουθούνται. Σύμφωνα με την εναλλακτική υπόθεση, το νέο μοντέλο αυξάνει τη μέση τιμή των δεικτών παρακολούθησης των επιχειρήσεων.
- Τέλος, αξιολογούμε εάν το νέο μοντέλο οδηγεί σε σημαντική βελτίωση σε συγκεκριμένους επιχειρηματικούς δείκτες απόδοσης.
Μια δοκιμή σκιάς ή σκηνής: Ένα μοντέλο αξιολογείται σε ένα αντίγραφο ενός περιβάλλοντος παραγωγής πριν χρησιμοποιηθεί στην παραγωγή (περιβάλλον σταδιοποίησης).
Αυτό είναι ζωτικής σημασίας για τον προσδιορισμό της απόδοσης του μοντέλου με δεδομένα σε πραγματικό χρόνο και την επικύρωση της ανθεκτικότητας του μοντέλου. πραγματοποιείται με την εξαγωγή συμπερασμάτων των ίδιων δεδομένων με τον αγωγό παραγωγής και την παράδοση του αναπτυγμένου κλάδου ή ενός μοντέλου που θα δοκιμαστεί σε έναν διακομιστή σταδιοποίησης.
Το μόνο μειονέκτημα είναι ότι δεν θα γίνουν επιχειρηματικές επιλογές στον διακομιστή σταδιοποίησης ή ορατές στους τελικούς χρήστες ως αποτέλεσμα του κλάδου ανάπτυξης.
Η ανθεκτικότητα και η απόδοση του μοντέλου θα αξιολογηθούν στατιστικά χρησιμοποιώντας τα αποτελέσματα του περιβάλλοντος σταδιοποίησης χρησιμοποιώντας τις κατάλληλες μετρήσεις.
11. Τι διακρίνει την επεξεργασία ροής από την επεξεργασία κατά παρτίδες;
Μπορούμε να χειριστούμε τα χαρακτηριστικά που χρησιμοποιούμε για να παράγουμε τις προβλέψεις μας σε πραγματικό χρόνο χρησιμοποιώντας δύο μεθόδους επεξεργασίας: παρτίδα και ροή.
Διαδικασία παρτίδας χαρακτηριστικά από ένα προηγούμενο χρονικό σημείο για ένα συγκεκριμένο αντικείμενο, το οποίο στη συνέχεια χρησιμοποιείται για τη δημιουργία προβλέψεων σε πραγματικό χρόνο.
- Εδώ, μπορούμε να κάνουμε εντατικούς υπολογισμούς χαρακτηριστικών εκτός σύνδεσης και να προετοιμάσουμε τα δεδομένα για γρήγορη εξαγωγή συμπερασμάτων.
- Χαρακτηριστικά, όμως, μια ηλικία από τότε που ήταν προκαθορισμένα στο παρελθόν. Αυτό μπορεί να είναι ένα σημαντικό μειονέκτημα εάν η πρόγνωσή σας βασίζεται σε πρόσφατα περιστατικά. (Για παράδειγμα, εντοπισμός δόλιων συναλλαγών το συντομότερο δυνατό.)
Με λειτουργίες ροής σχεδόν σε πραγματικό χρόνο για μια συγκεκριμένη οντότητα, το συμπέρασμα πραγματοποιείται κατά την επεξεργασία ροής σε ένα δεδομένο σύνολο εισόδων.
- Εδώ, δίνοντας στο μοντέλο λειτουργίες ροής σε πραγματικό χρόνο, μπορούμε να έχουμε πιο ακριβείς προβλέψεις.
- Ωστόσο, απαιτείται πρόσθετη υποδομή για την επεξεργασία ροής και τη διατήρηση των ροών δεδομένων (Kafka, Kinesis, κ.λπ.). (Apache Flink, Beam, κ.λπ.)
12. Τι εννοείτε με τον όρο Training Serving Skew;
Η διαφορά μεταξύ της απόδοσης κατά το σερβίρισμα και της απόδοσης κατά τη διάρκεια της προπόνησης είναι γνωστή ως λοξή προπόνηση-σερβίς. Αυτή η παραμόρφωση μπορεί να προκληθεί από τους ακόλουθους παράγοντες:
- Μια διαφορά στον τρόπο με τον οποίο χειρίζεστε δεδομένα μεταξύ των αγωγών για εξυπηρέτηση και εκπαίδευση.
- Μια μετατόπιση των δεδομένων από την εκπαίδευσή σας στην υπηρεσία σας.
- Ένα κανάλι σχολίων μεταξύ του αλγόριθμου και του μοντέλου σας.
13. Τι εννοείτε με τον όρο Μητρώο Μοντέλων;
Το Μητρώο Μοντέλων είναι ένα κεντρικό αποθετήριο όπου οι δημιουργοί μοντέλων μπορούν να δημοσιεύουν μοντέλα που είναι κατάλληλα για χρήση στην παραγωγή.
Οι προγραμματιστές μπορούν να συνεργαστούν με άλλες ομάδες και ενδιαφερόμενα μέρη για να διαχειριστούν τη διάρκεια ζωής όλων των μοντέλων εντός της επιχείρησης χρησιμοποιώντας το μητρώο. Τα εκπαιδευμένα μοντέλα μπορούν να μεταφορτωθούν στο μητρώο μοντέλων από έναν επιστήμονα δεδομένων.
Τα μοντέλα προετοιμάζονται για δοκιμή, επικύρωση και ανάπτυξη στην παραγωγή μόλις εγγραφούν στο μητρώο. Επιπλέον, τα εκπαιδευμένα μοντέλα αποθηκεύονται σε μητρώα μοντέλων για γρήγορη πρόσβαση από οποιαδήποτε ενσωματωμένη εφαρμογή ή υπηρεσία.
Προκειμένου να δοκιμαστεί, να αξιολογηθεί και να αναπτυχθεί το μοντέλο στην παραγωγή, προγραμματιστές λογισμικού και οι κριτές μπορούν γρήγορα να αναγνωρίσουν και να επιλέξουν μόνο την καλύτερη έκδοση των εκπαιδευμένων μοντέλων (με βάση τα κριτήρια αξιολόγησης).
14. Μπορείτε να αναλύσετε τα οφέλη του Μοντέλου Μητρώου;
Ακολουθούν ορισμένοι τρόποι με τους οποίους το μητρώο μοντέλων απλοποιεί τη διαχείριση του κύκλου ζωής του μοντέλου:
- Για να διευκολύνετε την ανάπτυξη, αποθηκεύστε τις απαιτήσεις χρόνου εκτέλεσης και τα μεταδεδομένα για τα εκπαιδευμένα μοντέλα σας.
- Τα εκπαιδευμένα, αναπτυγμένα και αποσυρθέντα μοντέλα σας θα πρέπει να εγγραφούν, να παρακολουθούνται και να εκδοθούν σε ένα κεντρικό αποθετήριο με δυνατότητα αναζήτησης.
- Δημιουργήστε αυτοματοποιημένους αγωγούς που επιτρέπουν τη συνεχή παράδοση, εκπαίδευση και ενσωμάτωση του μοντέλου παραγωγής σας.
- Συγκρίνετε πρόσφατα εκπαιδευμένα μοντέλα (ή μοντέλα αμφισβητήσεων) στο περιβάλλον σκηνής με μοντέλα που λειτουργούν αυτήν τη στιγμή στην παραγωγή (μοντέλα πρωταθλητών).
15. Μπορείτε να εξηγήσετε τα έργα τεχνικής Champion-Challenger;
Είναι δυνατό να δοκιμαστούν διάφορες επιχειρησιακές αποφάσεις στην παραγωγή χρησιμοποιώντας μια τεχνική Champion Challenger. Πιθανότατα έχετε ακούσει για τη δοκιμή A/B στο πλαίσιο του μάρκετινγκ.
Για παράδειγμα, μπορείτε να γράψετε δύο ξεχωριστές γραμμές θέματος και να τις διανείμετε τυχαία στα δημογραφικά στοιχεία-στόχους σας, προκειμένου να μεγιστοποιήσετε το ανοιχτό ποσοστό για μια καμπάνια ηλεκτρονικού ταχυδρομείου.
Το σύστημα καταγράφει την απόδοση ενός μηνύματος ηλεκτρονικού ταχυδρομείου (δηλαδή, ενέργεια ανοιχτής αλληλογραφίας) σε σχέση με τη γραμμή θέματός του, επιτρέποντάς σας να συγκρίνετε το ρυθμό ανοίγματος κάθε γραμμής θέματος για να προσδιορίσετε ποιο είναι το πιο αποτελεσματικό.
Το Champion-Challenger είναι συγκρίσιμο με το A/B testing από αυτή την άποψη. Μπορείτε να χρησιμοποιήσετε τη λογική απόφασης για να αξιολογήσετε κάθε αποτέλεσμα και να επιλέξετε το πιο αποτελεσματικό καθώς πειραματίζεστε με διάφορες μεθόδους για να καταλήξετε σε μια επιλογή.
Το πιο επιτυχημένο μοντέλο συσχετίζεται με τον πρωταθλητή. Ο πρώτος αμφισβητίας και η ταιριαστή λίστα αμφισβητιών είναι πλέον ό,τι υπάρχει στην πρώτη φάση εκτέλεσης αντί του πρωταθλητή.
Ο πρωταθλητής επιλέγεται από το σύστημα για περαιτέρω εκτελέσεις βημάτων εργασίας.
Οι αμφισβητίες έρχονται σε αντίθεση μεταξύ τους. Στη συνέχεια, ο νέος πρωταθλητής καθορίζεται από τον αμφισβητία που παράγει τα καλύτερα αποτελέσματα.
Οι εργασίες που εμπλέκονται στη διαδικασία σύγκρισης πρωταθλητών-αμφισβητιών παρατίθενται παρακάτω με περισσότερες λεπτομέρειες:
- Αξιολόγηση καθενός από τα αντίπαλα μοντέλα.
- Αξιολόγηση της τελικής βαθμολογίας.
- Σύγκριση των αποτελεσμάτων της αξιολόγησης για τον προσδιορισμό του νικητή αμφισβητία.
- Προσθήκη του φρέσκου πρωταθλητή στο αρχείο
16. Περιγράψτε τις εφαρμογές του κύκλου ζωής MLOps σε επίπεδο επιχείρησης;
Πρέπει να σταματήσουμε να θεωρούμε τη μηχανική μάθηση ως μόνο ένα επαναληπτικό πείραμα, προκειμένου τα μοντέλα μηχανικής μάθησης να εισέλθουν στην παραγωγή. Το MLOps είναι η ένωση μηχανικής λογισμικού με μηχανική μάθηση.
Το τελικό αποτέλεσμα πρέπει να το φανταστούμε ως τέτοιο. Επομένως, ο κώδικας για ένα τεχνολογικό προϊόν πρέπει να είναι δοκιμασμένος, λειτουργικός και αρθρωτός.
Το MLOps έχει διάρκεια ζωής που είναι συγκρίσιμη με μια συμβατική ροή μηχανικής μάθησης, με την εξαίρεση ότι το μοντέλο διατηρείται στη διαδικασία μέχρι την παραγωγή.
Στη συνέχεια, οι μηχανικοί MLOps παρακολουθούν αυτό για να βεβαιωθούν ότι η ποιότητα του μοντέλου στην παραγωγή είναι αυτή που επιδιώκεται.
Ακολουθούν ορισμένες περιπτώσεις χρήσης για αρκετές από τις τεχνολογίες MLOps:
- Μητρώα μοντέλων: Είναι αυτό που φαίνεται. Μεγαλύτερες ομάδες αποθηκεύουν και διατηρούν παρακολούθηση μοντέλων εκδόσεων σε μητρώα μοντέλων. Ακόμη και η επιστροφή σε μια προηγούμενη έκδοση είναι μια επιλογή.
- Αποθήκευση δυνατοτήτων: Όταν ασχολείστε με μεγαλύτερα σύνολα δεδομένων, θα μπορούσαν να υπάρχουν ξεχωριστές εκδόσεις των αναλυτικών συνόλων δεδομένων και υποσυνόλων για συγκεκριμένες εργασίες. Το κατάστημα χαρακτηριστικών είναι ένας πρωτοποριακός, καλόγουστος τρόπος για να χρησιμοποιήσετε την εργασία προετοιμασίας δεδομένων από προηγούμενες εκτελέσεις ή και από άλλες ομάδες.
- Αποθήκευση μεταδεδομένων: Είναι σημαντικό να παρακολουθούνται σωστά τα μεταδεδομένα καθ' όλη τη διάρκεια της παραγωγής, εάν πρόκειται να χρησιμοποιηθούν με επιτυχία μη δομημένα δεδομένα, όπως δεδομένα εικόνας και κειμένου.
Συμπέρασμα
Είναι σημαντικό να έχετε κατά νου ότι, στην πλειονότητα των περιπτώσεων, ο ερευνητής αναζητά ένα σύστημα, ενώ ο υποψήφιος αναζητά μια λύση.
Το πρώτο βασίζεται στις τεχνικές σας δεξιότητες, ενώ το δεύτερο αφορά τη μέθοδο που χρησιμοποιείτε για να επιδείξετε τις ικανότητές σας.
Υπάρχουν διάφορες διαδικασίες που πρέπει να ακολουθήσετε όταν απαντάτε σε ερωτήσεις συνέντευξης MLOps για να βοηθήσετε τον ερευνητή να κατανοήσει καλύτερα πώς σκοπεύετε να αξιολογήσετε και να αντιμετωπίσετε το πρόβλημα.
Η συγκέντρωσή τους είναι περισσότερο στη λανθασμένη αντίδραση παρά στη σωστή. Μια λύση λέει μια ιστορία και το σύστημά σας είναι η καλύτερη απεικόνιση των γνώσεων και της ικανότητάς σας για επικοινωνία.
Αφήστε μια απάντηση