Πίνακας περιεχομένων[Κρύβω][Προβολή]
- 1. Τιτανικό
- 2. Ταξινόμηση λουλουδιών Ιρλανδίας
- 3. Πρόβλεψη Τιμής Κατοικίας της Βοστώνης
- 4. Δοκιμή Ποιότητας Οίνου
- 5. Πρόβλεψη Χρηματιστηρίου
- 6. Σύσταση ταινίας
- 7. Πρόβλεψη καταλληλότητας φορτίου
- 8. Ανάλυση συναισθήματος με χρήση δεδομένων Twitter
- 9. Πρόβλεψη μελλοντικών πωλήσεων
- 10. Ανίχνευση ψευδών ειδήσεων
- 11. Πρόβλεψη αγοράς κουπονιών
- 12. Πρόβλεψη Churn πελατών
- 13. Wallmart Sales Forecasting
- 14. Ανάλυση δεδομένων Uber
- 15. Ανάλυση Covid-19
- Συμπέρασμα
Η μηχανική μάθηση είναι μια απλή μελέτη του τρόπου εκπαίδευσης ενός προγράμματος ή ενός αλγόριθμου υπολογιστή για τη σταδιακή βελτίωση σε μια συγκεκριμένη εργασία που παρουσιάζεται σε υψηλό επίπεδο. Η αναγνώριση εικόνας, ο εντοπισμός απάτης, τα συστήματα συστάσεων και άλλες εφαρμογές μηχανικής εκμάθησης έχουν ήδη αποδειχθεί δημοφιλείς.
Οι εργασίες ML κάνουν την ανθρώπινη εργασία απλή και αποτελεσματική, εξοικονομώντας χρόνο και διασφαλίζοντας ένα αποτέλεσμα υψηλής ποιότητας. Ακόμη και η Google, η πιο δημοφιλής μηχανή αναζήτησης στον κόσμο, χρησιμοποιεί μάθηση μηχανής.
Από την ανάλυση του ερωτήματος του χρήστη και την αλλαγή του αποτελέσματος με βάση τα αποτελέσματα μέχρι την εμφάνιση θεμάτων και διαφημίσεων σε τάση σε σχέση με το ερώτημα, υπάρχουν πολλές διαθέσιμες επιλογές.
Η τεχνολογία που είναι ταυτόχρονα οξυδερκής και αυτοδιορθωμένη δεν είναι μακριά στο μέλλον.
Ένας από τους καλύτερους τρόπους για να ξεκινήσετε είναι να ξεκινήσετε και να σχεδιάσετε ένα έργο. Επομένως, έχουμε συγκεντρώσει μια λίστα με 15 κορυφαία έργα μηχανικής εκμάθησης για αρχάριους για να ξεκινήσετε.
1. Τιτανικός
Αυτό θεωρείται συχνά ως μια από τις μεγαλύτερες και πιο ευχάριστες εργασίες για όποιον ενδιαφέρεται να μάθει περισσότερα για τη μηχανική μάθηση. Η πρόκληση του Τιτανικού είναι ένα δημοφιλές έργο μηχανικής μάθησης που χρησιμεύει επίσης ως ένας καλός τρόπος για να εξοικειωθείτε με την πλατφόρμα επιστήμης δεδομένων Kaggle. Το σύνολο δεδομένων του Τιτανικού αποτελείται από γνήσια δεδομένα από τη βύθιση του άτυχου πλοίου.
Περιλαμβάνει λεπτομέρειες όπως η ηλικία του ατόμου, η κοινωνικοοικονομική κατάσταση, το φύλο, ο αριθμός καμπίνας, το λιμάνι αναχώρησης και, το πιο σημαντικό, αν επέζησε!
Η τεχνική K-Nearest Neighbor και ο ταξινομητής δέντρου απόφασης καθορίστηκαν να παράγουν τα καλύτερα αποτελέσματα για αυτό το έργο. Αν ψάχνετε για μια γρήγορη πρόκληση για το Σαββατοκύριακο για να βελτιώσετε το δικό σας Ικανότητες Μηχανικής Μάθησης, αυτό στο Kaggle είναι για εσάς.
2. Ταξινόμηση λουλουδιών της Ιρλανδίας
Οι αρχάριοι αγαπούν το έργο κατηγοριοποίησης λουλουδιών ίριδας και είναι ένα εξαιρετικό μέρος για να ξεκινήσετε εάν είστε νέοι στη μηχανική μάθηση. Το μήκος των σέπαλων και των πετάλων διακρίνει τα άνθη της ίριδας από άλλα είδη. Ο σκοπός αυτού του έργου είναι να χωρίσει τα άνθη σε τρία είδη: Virginia, setosa και Versicolor.
Για ασκήσεις ταξινόμησης, το έργο χρησιμοποιεί το σύνολο δεδομένων λουλουδιών Iris, το οποίο βοηθά τους μαθητές να μάθουν τις βασικές αρχές της αντιμετώπισης αριθμητικών τιμών και δεδομένων. Το σύνολο δεδομένων λουλουδιών ίριδας είναι ένα μικροσκοπικό που μπορεί να αποθηκευτεί στη μνήμη χωρίς την ανάγκη κλιμάκωσης.
3. Πρόβλεψη τιμής σπιτιού στη Βοστώνη
Ένα άλλο γνωστό σύνολο δεδομένων για αρχάριους στη μηχανική μάθηση είναι τα στοιχεία της Boston Housing. Στόχος του είναι να προβλέψει τις αξίες των σπιτιών σε διάφορες γειτονιές της Βοστώνης. Περιλαμβάνει ζωτικής σημασίας στατιστικά στοιχεία, όπως η ηλικία, ο συντελεστής φόρου ακίνητης περιουσίας, το ποσοστό εγκληματικότητας, ακόμη και η εγγύτητα με κέντρα εργασίας, τα οποία όλα μπορεί να επηρεάσουν την τιμολόγηση των κατοικιών.
Το σύνολο δεδομένων είναι απλό και μικροσκοπικό, καθιστώντας απλό τον πειραματισμό για αρχάριους. Για να καταλάβουμε ποιοι παράγοντες επηρεάζουν την τιμή του ακινήτου στη Βοστώνη, οι τεχνικές παλινδρόμησης χρησιμοποιούνται σε μεγάλο βαθμό σε διάφορες παραμέτρους. Είναι ένα εξαιρετικό μέρος για να εξασκηθείτε στις τεχνικές παλινδρόμησης και να αξιολογήσετε πόσο καλά λειτουργούν.
4. Δοκιμή Ποιότητας Οίνου
Το κρασί είναι ένα ασυνήθιστο αλκοολούχο ποτό που απαιτεί χρόνια ζύμωσης. Ως αποτέλεσμα, το αντίκα μπουκάλι κρασί είναι ένα ακριβό και υψηλής ποιότητας κρασί. Η επιλογή του ιδανικού μπουκαλιού κρασιού απαιτεί χρόνια οινογευστικής γνώσης και μπορεί να είναι μια διαδικασία που θα πετύχει ή θα χάσετε.
Το έργο δοκιμής ποιότητας κρασιού αξιολογεί τα κρασιά χρησιμοποιώντας φυσικοχημικές δοκιμές όπως το επίπεδο αλκοόλης, η σταθερή οξύτητα, η πυκνότητα, το pH και άλλοι παράγοντες. Το έργο καθορίζει επίσης τα ποιοτικά κριτήρια και τις ποσότητες του κρασιού. Ως αποτέλεσμα, η αγορά κρασιού γίνεται παιχνιδάκι.
5. Πρόβλεψη Χρηματιστηρίου
Αυτή η πρωτοβουλία είναι ενδιαφέρουσα είτε εργάζεστε είτε όχι στον χρηματοοικονομικό τομέα. Τα δεδομένα της χρηματιστηριακής αγοράς μελετώνται εκτενώς από ακαδημαϊκούς, επιχειρήσεις, ακόμη και ως πηγή δευτερογενούς εισοδήματος. Η ικανότητα ενός επιστήμονα δεδομένων να μελετά και να εξερευνά δεδομένα χρονοσειρών είναι επίσης ζωτικής σημασίας. Τα δεδομένα από το χρηματιστήριο είναι ένα εξαιρετικό μέρος για να ξεκινήσετε.
Η ουσία της προσπάθειας είναι η πρόβλεψη της μελλοντικής αξίας μιας μετοχής. Αυτό βασίζεται στην τρέχουσα απόδοση της αγοράς καθώς και στα στατιστικά στοιχεία των προηγούμενων ετών. Η Kaggle συλλέγει δεδομένα για τον δείκτη NIFTY-50 από το 2000 και επί του παρόντος ενημερώνεται εβδομαδιαία. Από την 1η Ιανουαρίου 2000, περιείχε τιμές μετοχών για περισσότερους από 50 οργανισμούς.
6. Σύσταση ταινίας
Είμαι σίγουρος ότι είχατε αυτό το συναίσθημα αφού είδατε μια καλή ταινία. Έχετε νιώσει ποτέ την παρόρμηση να εξευμενίσετε τις αισθήσεις σας βλέποντας υπερβολικά παρόμοιες ταινίες;
Γνωρίζουμε ότι οι υπηρεσίες OTT όπως το Netflix έχουν βελτιώσει σημαντικά τα συστήματα συστάσεων τους. Ως μαθητής μηχανικής εκμάθησης, θα πρέπει να κατανοήσετε πώς τέτοιοι αλγόριθμοι στοχεύουν πελάτες με βάση τις προτιμήσεις και τις κριτικές τους.
Το σύνολο δεδομένων IMDB στο Kaggle είναι πιθανότατα ένα από τα πιο ολοκληρωμένα, επιτρέποντας τη συναγωγή μοντέλων προτάσεων με βάση τον τίτλο της ταινίας, την αξιολόγηση πελατών, το είδος και άλλους παράγοντες. Είναι επίσης μια εξαιρετική μέθοδος για να μάθετε για το φιλτράρισμα βάσει περιεχομένου και τη μηχανική χαρακτηριστικών.
7. Πρόβλεψη καταλληλότητας φορτίου
Ο κόσμος περιστρέφεται γύρω από τα δάνεια. Η κύρια πηγή κερδών των τραπεζών προέρχεται από τους τόκους των δανείων. Ως εκ τούτου, είναι η βασική τους επιχείρηση.
Τα άτομα ή οι ομάδες ατόμων μπορούν να επεκτείνουν τις οικονομίες τους μόνο επενδύοντας χρήματα σε μια επιχείρηση με την ελπίδα να δουν την αξία τους να αυξάνεται στο μέλλον. Μερικές φορές είναι σημαντικό να αναζητήσετε ένα δάνειο για να μπορέσετε να αναλάβετε τέτοιου είδους ρίσκα και ακόμη και να συμμετέχετε σε ορισμένες κοσμικές απολαύσεις.
Προτού γίνει αποδεκτό ένα δάνειο, οι τράπεζες έχουν συνήθως μια αρκετά αυστηρή διαδικασία να ακολουθήσουν. Καθώς τα δάνεια είναι μια τόσο κρίσιμη πτυχή της ζωής πολλών ανθρώπων, η πρόβλεψη της επιλεξιμότητας για ένα δάνειο για το οποίο κάποιος υποβάλλει αίτηση θα ήταν εξαιρετικά επωφελής, επιτρέποντας καλύτερο σχεδιασμό πέρα από την αποδοχή ή την απόρριψη του δανείου.
8. Ανάλυση συναισθήματος με χρήση δεδομένων Twitter
Χάρη σε δίκτυα κοινωνικής δικτύωσης όπως το Twitter, το Facebook και το Reddit, η παρέκταση απόψεων και τάσεων έχει γίνει πολύ εύκολη. Αυτές οι πληροφορίες χρησιμοποιούνται για την εξάλειψη απόψεων για γεγονότα, άτομα, αθλήματα και άλλα θέματα. Οι πρωτοβουλίες μηχανικής μάθησης που σχετίζονται με την εξόρυξη γνώμης εφαρμόζονται σε ποικίλα περιβάλλοντα, συμπεριλαμβανομένων πολιτικών εκστρατειών και αξιολογήσεων προϊόντων της Amazon.
Αυτό το έργο θα φαίνεται φανταστικό στο χαρτοφυλάκιό σας! Για την ανίχνευση συναισθημάτων και την ανάλυση βάσει πτυχών, τεχνικές όπως μηχανές διανυσμάτων υποστήριξης, παλινδρόμηση και αλγόριθμοι ταξινόμησης μπορούν να χρησιμοποιηθούν εκτενώς (εύρεση γεγονότων και απόψεων).
9. Πρόβλεψη μελλοντικών πωλήσεων
Οι μεγάλες επιχειρήσεις και οι έμποροι B2C θέλουν να γνωρίζουν πόσο θα πουλήσει κάθε προϊόν στο απόθεμά τους. Η πρόβλεψη πωλήσεων βοηθά τους ιδιοκτήτες επιχειρήσεων να προσδιορίσουν ποια είδη έχουν υψηλή ζήτηση. Η ακριβής πρόβλεψη των πωλήσεων θα μειώσει σημαντικά τη σπατάλη, ενώ θα προσδιορίσει και τον αυξητικό αντίκτυπο στους μελλοντικούς προϋπολογισμούς.
Έμποροι λιανικής όπως οι Walmart, IKEA, Big Basket και Big Bazaar χρησιμοποιούν πρόβλεψη πωλήσεων για να εκτιμήσουν τη ζήτηση προϊόντων. Πρέπει να είστε εξοικειωμένοι με διάφορες τεχνικές καθαρισμού ακατέργαστων δεδομένων προκειμένου να κατασκευάσετε τέτοια έργα ML. Επίσης, απαιτείται καλή κατανόηση της ανάλυσης παλινδρόμησης, ιδιαίτερα της απλής γραμμικής παλινδρόμησης.
Για τέτοιου είδους εργασίες, θα χρειαστεί να χρησιμοποιήσετε βιβλιοθήκες όπως οι Dora, Scrubadub, Pandas, NumPy και άλλες.
10. Ανίχνευση ψευδών ειδήσεων
Είναι μια άλλη προσπάθεια μηχανικής μάθησης αιχμής που απευθύνεται σε μαθητές. Οι ψευδείς ειδήσεις εξαπλώνονται αστραπιαία, όπως όλοι γνωρίζουμε. Τα πάντα είναι διαθέσιμα στα μέσα κοινωνικής δικτύωσης, από τη σύνδεση ατόμων έως την ανάγνωση των καθημερινών ειδήσεων.
Ως αποτέλεσμα, ο εντοπισμός ψευδών ειδήσεων έχει γίνει όλο και πιο δύσκολος αυτές τις μέρες. Πολλά μεγάλα δίκτυα μέσων κοινωνικής δικτύωσης, όπως το Facebook και το Twitter, διαθέτουν ήδη αλγόριθμους για τον εντοπισμό ψευδών ειδήσεων σε αναρτήσεις και ροές δεδομένων.
Για τον εντοπισμό ψευδών ειδήσεων, αυτός ο τύπος έργου ML χρειάζεται μια ενδελεχή κατανόηση πολλαπλών προσεγγίσεων NLP και αλγορίθμων ταξινόμησης (PassiveAggressiveClassifier ή Naive Bayes classifier).
11. Πρόβλεψη αγοράς κουπονιών
Οι πελάτες σκέφτονται ολοένα και περισσότερο τις διαδικτυακές αγορές όταν ο κορωνοϊός επιτέθηκε στον πλανήτη το 2020. Ως αποτέλεσμα, τα καταστήματα αγορών αναγκάστηκαν να αλλάξουν την επιχείρησή τους στο διαδίκτυο.
Οι πελάτες, από την άλλη πλευρά, εξακολουθούν να αναζητούν εξαιρετικές προσφορές, όπως ακριβώς ήταν στα καταστήματα, και αναζητούν ολοένα και περισσότερο κουπόνια εξοικονόμησης. Υπάρχουν ακόμη και ιστότοποι αφιερωμένοι στη δημιουργία κουπονιών για τέτοιους πελάτες. Μπορείτε να μάθετε για την εξόρυξη δεδομένων στη μηχανική εκμάθηση, την παραγωγή γραφημάτων ράβδων, διαγραμμάτων πίτας και ιστογραμμάτων για την οπτικοποίηση δεδομένων και τη μηχανική χαρακτηριστικών με αυτό το έργο.
Για να δημιουργήσετε προβλέψεις, μπορείτε επίσης να εξετάσετε προσεγγίσεις καταλογισμού δεδομένων για τη διαχείριση τιμών NA και ομοιότητας συνημιτόνου μεταβλητών.
12. Πρόβλεψη εκτροπής πελατών
Οι καταναλωτές είναι το πιο σημαντικό περιουσιακό στοιχείο μιας εταιρείας και η διατήρησή τους είναι ζωτικής σημασίας για κάθε επιχείρηση που στοχεύει να αυξήσει τα έσοδα και να δημιουργήσει μακροπρόθεσμες ουσιαστικές συνδέσεις μαζί τους.
Επιπλέον, το κόστος απόκτησης νέου πελάτη είναι πέντε φορές υψηλότερο από το κόστος διατήρησης ενός υπάρχοντος. Το Customer Churn/Attrition είναι ένα πολύ γνωστό επιχειρηματικό πρόβλημα στο οποίο οι πελάτες ή οι συνδρομητές παύουν να συνεργάζονται με μια υπηρεσία ή μια εταιρεία.
Στην ιδανική περίπτωση, δεν θα είναι πλέον πελάτης που πληρώνει. Ένας πελάτης θεωρείται αναστατωμένος εάν έχει περάσει συγκεκριμένο χρονικό διάστημα από την τελευταία φορά που ο πελάτης αλληλεπιδρά με την εταιρεία. Ο προσδιορισμός του εάν ένας πελάτης θα ανακληθεί, καθώς και η ταχεία παροχή σχετικών πληροφοριών με στόχο τη διατήρηση των πελατών, είναι ζωτικής σημασίας για τη μείωση της αναστάτωσης.
Ο εγκέφαλός μας είναι ανίκανος να προβλέψει τον κύκλο εργασιών των πελατών για εκατομμύρια πελάτες. Εδώ μπορεί να βοηθήσει η μηχανική μάθηση.
13. Πρόβλεψη πωλήσεων Wallmart
Μία από τις πιο εξέχουσες εφαρμογές της μηχανικής μάθησης είναι η πρόβλεψη πωλήσεων, η οποία περιλαμβάνει τον εντοπισμό χαρακτηριστικών που επηρεάζουν τις πωλήσεις των προϊόντων και την πρόβλεψη μελλοντικού όγκου πωλήσεων.
Το σύνολο δεδομένων Walmart, το οποίο περιέχει δεδομένα πωλήσεων από 45 τοποθεσίες, χρησιμοποιείται σε αυτήν τη μελέτη μηχανικής εκμάθησης. Οι πωλήσεις ανά κατάστημα, ανά κατηγορία, σε εβδομαδιαία βάση περιλαμβάνονται στο σύνολο δεδομένων. Ο σκοπός αυτού του έργου μηχανικής εκμάθησης είναι να προβλέψει τις πωλήσεις για κάθε τμήμα σε κάθε κατάστημα, έτσι ώστε να μπορούν να λαμβάνουν καλύτερες αποφάσεις βελτιστοποίησης καναλιών βάσει δεδομένων και σχεδιασμού αποθέματος.
Η εργασία με το σύνολο δεδομένων Walmart είναι δύσκολη, καθώς περιέχει επιλεγμένα συμβάντα σήμανσης που έχουν αντίκτυπο στις πωλήσεις και πρέπει να ληφθούν υπόψη.
14. Ανάλυση δεδομένων Uber
Όσον αφορά την εφαρμογή και την ενσωμάτωση μηχανικής εκμάθησης και βαθιάς εκμάθησης στις εφαρμογές τους, η δημοφιλής υπηρεσία κοινής χρήσης διαδρομής δεν είναι πολύ πίσω. Κάθε χρόνο, επεξεργάζεται δισεκατομμύρια ταξίδια, επιτρέποντας στους επιβάτες να ταξιδεύουν οποιαδήποτε στιγμή της ημέρας ή της νύχτας.
Επειδή έχει τόσο μεγάλη βάση πελατών, χρειάζεται εξαιρετική εξυπηρέτηση πελατών για την αντιμετώπιση των παραπόνων των καταναλωτών το συντομότερο δυνατό.
Η Uber διαθέτει ένα σύνολο δεδομένων από εκατομμύρια παραλαβές που μπορεί να χρησιμοποιήσει για να αναλύσει και να εμφανίσει τα ταξίδια των πελατών για να αποκαλύψει πληροφορίες και να βελτιώσει την εμπειρία των πελατών.
15. Ανάλυση Covid-19
Ο COVID-19 έχει σαρώσει τον κόσμο σήμερα, και όχι απλώς με την έννοια της πανδημίας. Ενώ οι ειδικοί της ιατρικής επικεντρώνονται στη δημιουργία αποτελεσματικών εμβολιασμών και στην ανοσοποίηση του κόσμου, οι επιστήμονες δεδομένων δεν είναι πολύ πίσω.
Νέα κρούσματα, ημερήσιος αριθμός ενεργών ενεργειών, θάνατοι και στατιστικά τεστ δημοσιοποιούνται. Οι προβλέψεις γίνονται σε καθημερινή βάση με βάση την έξαρση του SARS του προηγούμενου αιώνα. Για αυτό, μπορείτε να χρησιμοποιήσετε ανάλυση παλινδρόμησης και να υποστηρίξετε διανυσματικά μοντέλα πρόβλεψης που βασίζονται σε μηχανές.
Συμπέρασμα
Συνοψίζοντας, έχουμε συζητήσει μερικά από τα κορυφαία έργα ML που θα σας βοηθήσουν να δοκιμάσετε τον προγραμματισμό Machine Learning καθώς και να κατανοήσετε τις ιδέες και την εφαρμογή του. Η γνώση του πώς να ενσωματώσετε τη Μηχανική Μάθηση μπορεί να σας βοηθήσει να προχωρήσετε στο επάγγελμά σας καθώς η τεχνολογία κυριαρχεί σε κάθε κλάδο.
Κατά την εκμάθηση της Μηχανικής Μάθησης, σας συνιστούμε να εξασκείτε τις έννοιές σας και να γράφετε όλους τους αλγόριθμούς σας. Η σύνταξη αλγορίθμων κατά τη μάθηση είναι πιο σημαντική από την εκτέλεση ενός έργου και σας παρέχει επίσης ένα πλεονέκτημα στη σωστή κατανόηση των θεμάτων.
Αφήστε μια απάντηση