अनुक्रमणिका[लपवा][दाखवा]
- 1. टायटॅनिक
- 2. आयरिश फ्लॉवर वर्गीकरण
- 3. बोस्टन हाऊस किंमत अंदाज
- 4. वाइन गुणवत्ता चाचणी
- 5. स्टॉक मार्केट अंदाज
- 6. चित्रपटाची शिफारस
- 7. लोड पात्रता अंदाज
- 8. ट्विटर डेटा वापरून भावना विश्लेषण
- 9. भविष्यातील विक्री अंदाज
- 10. बनावट बातम्या शोधणे
- 11. कूपन खरेदी अंदाज
- 12. ग्राहक मंथन अंदाज
- 13. वॉलमार्ट विक्री अंदाज
- 14. उबेर डेटा विश्लेषण
- 15. कोविड-19 विश्लेषण
- निष्कर्ष
मशीन लर्निंग हा उच्च स्तरावर सादर केलेल्या विशिष्ट नोकरीमध्ये हळूहळू सुधारणा करण्यासाठी संगणक प्रोग्राम किंवा अल्गोरिदम कसे शिक्षित करावे याचा साधा अभ्यास आहे. प्रतिमा ओळख, फसवणूक शोध, शिफारस प्रणाली आणि इतर मशीन शिक्षण अनुप्रयोग आधीच लोकप्रिय असल्याचे सिद्ध झाले आहे.
ML जॉब्स मानवी काम सोपे आणि कार्यक्षम बनवतात, वेळेची बचत करतात आणि उच्च-गुणवत्तेचे परिणाम सुनिश्चित करतात. जगातील सर्वात लोकप्रिय सर्च इंजिन Google देखील वापरते मशीन शिक्षण.
वापरकर्त्याच्या क्वेरीचे विश्लेषण करणे आणि परिणामांवर आधारित निकाल बदलण्यापासून ते ट्रेंडिंग विषय आणि क्वेरीच्या संदर्भात जाहिराती दाखवण्यापर्यंत, विविध पर्याय उपलब्ध आहेत.
ज्ञानेंद्रिय आणि स्वयं-सुधारणारे तंत्रज्ञान भविष्यात फार दूर नाही.
प्रारंभ करण्याचा एक उत्तम मार्ग म्हणजे हँड-ऑन मिळवणे आणि प्रोजेक्ट डिझाइन करणे. म्हणून, आम्ही तुम्हाला सुरुवात करण्यासाठी नवशिक्यांसाठी 15 शीर्ष मशीन शिक्षण प्रकल्पांची सूची तयार केली आहे.
1. टायटॅनिक
मशीन लर्निंगबद्दल अधिक जाणून घेण्यात स्वारस्य असलेल्या प्रत्येकासाठी हे सर्वात मोठे आणि सर्वात आनंददायक कार्य मानले जाते. टायटॅनिक चॅलेंज हा एक लोकप्रिय मशीन लर्निंग प्रकल्प आहे जो कागल डेटा सायन्स प्लॅटफॉर्मशी परिचित होण्याचा एक चांगला मार्ग देखील आहे. टायटॅनिक डेटासेट दुर्दैवी जहाजाच्या बुडण्याच्या वास्तविक डेटापासून बनलेला आहे.
त्यात त्या व्यक्तीचे वय, सामाजिक आर्थिक स्थिती, लिंग, केबिन नंबर, डिपार्चर पोर्ट आणि सर्वात महत्त्वाचे म्हणजे ती जिवंत राहिली की नाही यासारख्या तपशीलांचा समावेश आहे!
के-नजीकच्या शेजारी तंत्र आणि निर्णय वृक्ष वर्गीकरण या प्रकल्पासाठी सर्वोत्तम परिणाम देण्यासाठी निर्धारित केले होते. आपण आपल्या सुधारण्यासाठी वेगवान शनिवार व रविवार आव्हान शोधत असल्यास मशीन लर्निंग क्षमता, हे Kaggle वर तुमच्यासाठी आहे.
2. आयरिश फ्लॉवर वर्गीकरण
नवशिक्यांना आयरीस फ्लॉवर वर्गीकरण प्रकल्प आवडतो आणि तुम्ही मशीन लर्निंगसाठी नवीन असाल तर सुरुवात करण्यासाठी हे उत्तम ठिकाण आहे. सेपल्स आणि पाकळ्यांची लांबी इतर प्रजातींपासून बुबुळांच्या फुलांना वेगळे करते. व्हर्जिनिया, सेटोसा आणि व्हर्सीकलर या तीन प्रजातींमध्ये ब्लूम वेगळे करणे हा या प्रकल्पाचा उद्देश आहे.
वर्गीकरण व्यायामासाठी, प्रकल्प आयरिस फ्लॉवर डेटासेट वापरतो, जे विद्यार्थ्यांना संख्यात्मक मूल्ये आणि डेटा हाताळण्याच्या मूलभूत गोष्टी शिकण्यास मदत करते. आयरीस फ्लॉवर डेटासेट हा एक छोटासा डेटासेट आहे जो स्केलिंगची आवश्यकता न ठेवता मेमरीमध्ये संग्रहित केला जाऊ शकतो.
3. बोस्टन हाऊस किंमत अंदाज
आणखी एक सुप्रसिद्ध मशीन लर्निंगमधील नवशिक्यांसाठी डेटासेट बोस्टन हाऊसिंग डेटा आहे. बोस्टनच्या विविध परिसरांमध्ये घराच्या मूल्यांचा अंदाज लावणे हे त्याचे ध्येय आहे. यामध्ये वय, मालमत्ता कर दर, गुन्हेगारीचा दर आणि अगदी जॉब सेंटरशी जवळीक यासारख्या महत्त्वाच्या आकडेवारीचा समावेश आहे, या सर्वांचा घरांच्या किंमतीवर परिणाम होऊ शकतो.
डेटासेट सोपा आणि लहान आहे, ज्यामुळे नवशिक्यांसाठी प्रयोग करणे सोपे होते. बोस्टनमधील मालमत्तेच्या किमतीवर कोणते घटक प्रभाव टाकतात हे शोधण्यासाठी, रिग्रेशन तंत्र विविध पॅरामीटर्सवर मोठ्या प्रमाणावर वापरले जाते. रीग्रेशन तंत्रांचा सराव करण्यासाठी आणि ते किती चांगले कार्य करतात याचे मूल्यांकन करण्यासाठी हे एक उत्तम ठिकाण आहे.
4. वाइन गुणवत्ता चाचणी
वाइन हे एक असामान्य अल्कोहोलिक पेय आहे ज्यासाठी अनेक वर्षे आंबायला ठेवावे लागतात. परिणामी, वाइनची प्राचीन बाटली ही एक महाग आणि उच्च-गुणवत्तेची वाइन आहे. वाइनची आदर्श बाटली निवडण्यासाठी वाइन टेस्टिंगचे अनेक वर्षांचे ज्ञान आवश्यक आहे आणि ही एक हिट-किंवा-मिस प्रक्रिया असू शकते.
वाइन गुणवत्ता चाचणी प्रकल्प अल्कोहोल पातळी, निश्चित आंबटपणा, घनता, pH आणि इतर घटकांसारख्या भौतिक-रासायनिक चाचण्या वापरून वाइनचे मूल्यांकन करतो. हा प्रकल्प वाइनच्या गुणवत्तेचे निकष आणि प्रमाण देखील ठरवतो. परिणामी, वाइन खरेदीची झुळूक बनते.
5. शेअर बाजार अंदाज
तुम्ही आर्थिक क्षेत्रात काम करता की नाही हा उपक्रम कुतूहल करणारा आहे. शैक्षणिक, व्यवसाय आणि अगदी दुय्यम उत्पन्नाचा स्रोत म्हणून स्टॉक मार्केट डेटाचा विस्तृतपणे अभ्यास केला जातो. डेटा सायंटिस्टची वेळ मालिका डेटाचा अभ्यास आणि एक्सप्लोर करण्याची क्षमता देखील महत्त्वपूर्ण आहे. शेअर बाजारातील डेटा हे सुरू करण्यासाठी उत्तम ठिकाण आहे.
प्रयत्नांचे सार म्हणजे स्टॉकच्या भविष्यातील मूल्याचा अंदाज लावणे. हे सध्याच्या बाजारातील कामगिरीवर तसेच मागील वर्षांच्या आकडेवारीवर आधारित आहे. Kaggle 50 पासून NIFTY-2000 निर्देशांकावर डेटा संकलित करत आहे आणि सध्या तो साप्ताहिक अद्यतनित केला जातो. 1 जानेवारी 2000 पासून, यात 50 हून अधिक संस्थांच्या स्टॉकच्या किमती आहेत.
6. चित्रपटाची शिफारस
मला खात्री आहे की एक चांगला चित्रपट पाहिल्यानंतर तुम्हाला असे वाटले असेल. अशाच प्रकारचे चित्रपट पाहून तुमची संवेदना प्रफुल्लित करण्याचा आवेग तुम्हाला कधी जाणवला आहे का?
आम्हाला माहित आहे की Netflix सारख्या OTT सेवांनी त्यांच्या शिफारस प्रणालींमध्ये लक्षणीय सुधारणा केली आहे. एक मशीन लर्निंग विद्यार्थी म्हणून, तुम्हाला हे समजून घेणे आवश्यक आहे की असे अल्गोरिदम क्लायंटला त्यांच्या प्राधान्ये आणि पुनरावलोकनांवर आधारित कसे लक्ष्य करतात.
Kaggle वर सेट केलेला IMDB डेटा बहुधा सर्वात परिपूर्ण आहे, ज्यामुळे चित्रपटाचे शीर्षक, ग्राहक रेटिंग, शैली आणि इतर घटकांवर आधारित शिफारस मॉडेल्सचे अनुमान काढता येते. सामग्री-आधारित फिल्टरिंग आणि वैशिष्ट्य अभियांत्रिकीबद्दल जाणून घेण्यासाठी ही एक उत्कृष्ट पद्धत आहे.
7. लोड पात्रता अंदाज
कर्जाभोवती जग फिरते. बँकांच्या नफ्याचा प्रमुख स्त्रोत कर्जावरील व्याजातून येतो. त्यामुळे ते त्यांचा मूलभूत व्यवसाय आहेत.
व्यक्ती किंवा व्यक्तींचे गट भविष्यात त्याचे मूल्य वाढेल या आशेने एखाद्या फर्ममध्ये पैसे गुंतवूनच अर्थव्यवस्था वाढवू शकतात. अशा स्वरूपाची जोखीम पत्करण्यास आणि काही सांसारिक सुखांमध्ये सहभागी होण्यासाठी कर्ज घेणे कधीकधी महत्त्वाचे असते.
कर्ज स्विकारण्याआधी, बँकांना साधारणपणे कठोर प्रक्रिया पाळावी लागते. कर्ज हे अनेक लोकांच्या जीवनातील एक महत्त्वपूर्ण पैलू असल्याने, एखाद्याने अर्ज केलेल्या कर्जासाठी पात्रतेचा अंदाज लावणे अत्यंत फायदेशीर ठरेल, ज्यामुळे कर्ज स्वीकारले किंवा नाकारले जाण्यापलीकडे चांगले नियोजन करता येईल.
8. ट्विटर डेटा वापरून भावना विश्लेषण
ना धन्यवाद सामाजिक मीडिया नेटवर्क Twitter, Facebook आणि Reddit प्रमाणे, मते आणि ट्रेंड वाढवणे खूप सोपे झाले आहे. या माहितीचा वापर कार्यक्रम, लोक, खेळ आणि इतर विषयांवरील मते काढून टाकण्यासाठी केला जातो. राजकीय मोहिमा आणि Amazon उत्पादन मूल्यमापनांसह विविध सेटिंग्जमध्ये ओपिनियन मायनिंग-संबंधित मशीन लर्निंग उपक्रम लागू केले जात आहेत.
हा प्रकल्प तुमच्या पोर्टफोलिओमध्ये विलक्षण दिसेल! भावना शोधण्यासाठी आणि पैलू-आधारित विश्लेषणासाठी, सपोर्ट वेक्टर मशीन, रीग्रेशन आणि वर्गीकरण अल्गोरिदम यासारख्या तंत्रांचा मोठ्या प्रमाणावर वापर केला जाऊ शकतो (तथ्ये आणि मते शोधणे).
9. भविष्यातील विक्री अंदाज
बिग B2C व्यवसाय आणि व्यापाऱ्यांना त्यांच्या यादीतील प्रत्येक उत्पादन किती विकले जाईल हे जाणून घ्यायचे आहे. विक्री अंदाज व्यवसाय मालकांना कोणत्या वस्तूंना जास्त मागणी आहे हे निर्धारित करण्यात मदत करते. भविष्यातील अर्थसंकल्पावरील वाढीव परिणाम निश्चित करताना अचूक विक्री अंदाज अपव्यय लक्षणीयरीत्या कमी करेल.
वॉलमार्ट, IKEA, बिग बास्केट आणि बिग बाजार सारखे किरकोळ विक्रेते उत्पादनाच्या मागणीचा अंदाज घेण्यासाठी विक्री अंदाज वापरतात. असे एमएल प्रकल्प तयार करण्यासाठी तुम्हाला कच्चा डेटा साफ करण्याच्या विविध तंत्रांशी परिचित असणे आवश्यक आहे. तसेच, प्रतिगमन विश्लेषणाचे चांगले आकलन, विशेषतः साधे रेखीय प्रतिगमन आवश्यक आहे.
या प्रकारच्या कामांसाठी, तुम्हाला Dora, Scrubadub, Pandas, NumPy आणि इतर लायब्ररी वापरण्याची आवश्यकता असेल.
10. फेक न्यूज डिटेक्शन
शाळकरी मुलांसाठी हा आणखी एक अत्याधुनिक मशीन लर्निंग प्रयत्न आहे. खोट्या बातम्या वणव्यासारख्या पसरत आहेत, हे आपल्या सर्वांना माहीत आहे. सोशल मीडियावर व्यक्तींना जोडण्यापासून ते रोजच्या बातम्या वाचण्यापर्यंत सर्व काही उपलब्ध आहे.
परिणामी, आजकाल खोट्या बातम्या शोधणे अधिक कठीण झाले आहे. फेसबुक आणि ट्विटर सारख्या अनेक मोठ्या सोशल मीडिया नेटवर्कमध्ये पोस्टिंग आणि फीडमधील बोगस बातम्या शोधण्यासाठी आधीच अल्गोरिदम आहेत.
खोट्या बातम्या ओळखण्यासाठी, या प्रकारच्या ML प्रोजेक्टला एकाधिक NLP पद्धती आणि वर्गीकरण अल्गोरिदम (PassiveAggressiveClassifier किंवा Naive Bayes classifier) ची संपूर्ण माहिती असणे आवश्यक आहे.
11. कूपन खरेदी अंदाज
2020 मध्ये जेव्हा कोरोनाव्हायरसने ग्रहावर हल्ला केला तेव्हा ग्राहक वाढत्या प्रमाणात ऑनलाइन खरेदीचा विचार करत आहेत. परिणामी, शॉपिंग आस्थापनांना त्यांचा व्यवसाय ऑनलाइन हलवण्यास भाग पाडले गेले आहे.
दुसरीकडे, ग्राहक अजूनही उत्तम ऑफर शोधत आहेत, जसे की ते स्टोअरमध्ये होते आणि ते सुपर-सेव्हिंग कूपनसाठी अधिकाधिक शोध घेत आहेत. अशा क्लायंटसाठी कूपन तयार करण्यासाठी समर्पित वेबसाइट्स देखील आहेत. तुम्ही मशीन लर्निंगमध्ये डेटा मायनिंग, डेटा व्हिज्युअलायझ करण्यासाठी बार आलेख, पाई चार्ट आणि हिस्टोग्राम तयार करणे आणि या प्रकल्पासह अभियांत्रिकी वैशिष्ट्यांबद्दल जाणून घेऊ शकता.
अंदाज व्युत्पन्न करण्यासाठी, तुम्ही NA व्हॅल्यू आणि व्हेरिएबल्सची कोसाइन समानता व्यवस्थापित करण्यासाठी डेटा इम्प्युटेशन पध्दती देखील पाहू शकता.
12. ग्राहक मंथन अंदाज
ग्राहक ही कंपनीची सर्वात महत्त्वाची संपत्ती आहे आणि महसूल वाढवण्याच्या आणि त्यांच्याशी दीर्घकालीन अर्थपूर्ण संबंध निर्माण करण्याच्या उद्देशाने कोणत्याही व्यवसायासाठी त्यांना ठेवणे अत्यावश्यक आहे.
शिवाय, नवीन क्लायंट घेण्याचा खर्च विद्यमान ग्राहकाला टिकवून ठेवण्याच्या खर्चापेक्षा पाचपट जास्त आहे. ग्राहक मंथन/अॅट्रिशन ही एक सुप्रसिद्ध व्यावसायिक समस्या आहे ज्यामध्ये ग्राहक किंवा सदस्य सेवा किंवा कंपनीसह व्यवसाय करणे थांबवतात.
ते आदर्शपणे यापुढे पैसे देणारे ग्राहक राहणार नाहीत. जर ग्राहकाने कंपनीशी शेवटचा संवाद साधला तेव्हापासून विशिष्ट कालावधी झाला असेल तर ग्राहकाला मंथन केलेले मानले जाते. क्लायंट मंथन करेल की नाही हे ओळखणे, तसेच ग्राहक टिकवून ठेवण्याच्या उद्देशाने त्वरीत संबंधित माहिती देणे, मंथन कमी करण्यासाठी महत्त्वपूर्ण आहे.
आमचे मेंदू लाखो क्लायंटच्या ग्राहकांच्या उलाढालीची अपेक्षा करण्यास असमर्थ आहेत; येथे मशीन लर्निंग मदत करू शकते.
13. वॉलमार्ट विक्री अंदाज
मशीन लर्निंगच्या सर्वात प्रमुख ऍप्लिकेशन्सपैकी एक म्हणजे विक्री अंदाज, ज्यामध्ये उत्पादनाच्या विक्रीवर प्रभाव टाकणारी वैशिष्ट्ये शोधणे आणि भविष्यातील विक्रीच्या प्रमाणाची अपेक्षा करणे समाविष्ट आहे.
वॉलमार्ट डेटासेट, ज्यामध्ये 45 ठिकाणांवरील विक्री डेटा आहे, या मशीन लर्निंग अभ्यासामध्ये वापरला जातो. प्रति स्टोअर विक्री, श्रेणीनुसार, साप्ताहिक आधारावर डेटासेटमध्ये समाविष्ट केली आहे. या मशीन लर्निंग प्रकल्पाचा उद्देश प्रत्येक आउटलेटमधील प्रत्येक विभागासाठी विक्रीची अपेक्षा करणे हा आहे जेणेकरून ते अधिक चांगले डेटा-चालित चॅनेल ऑप्टिमायझेशन आणि इन्व्हेंटरी नियोजन निर्णय घेऊ शकतील.
वॉलमार्ट डेटासेटसह कार्य करणे कठीण आहे कारण त्यात निवडक मार्कडाउन इव्हेंट आहेत ज्यांचा विक्रीवर परिणाम होतो आणि त्याचा विचार केला पाहिजे.
14. उबर डेटा विश्लेषण
त्यांच्या अॅप्समध्ये मशिन लर्निंग आणि डीप लर्निंगची अंमलबजावणी आणि समाकलित करण्याच्या बाबतीत, लोकप्रिय राइड-शेअरिंग सेवा फार मागे नाही. दरवर्षी, ते कोट्यवधी सहलींवर प्रक्रिया करते, ज्यामुळे प्रवाशांना दिवसा किंवा रात्री कोणत्याही वेळी प्रवास करता येतो.
त्याच्याकडे एवढा मोठा क्लायंट बेस असल्यामुळे, त्याला ग्राहकांच्या तक्रारी लवकरात लवकर दूर करण्यासाठी अपवादात्मक ग्राहक सेवेची आवश्यकता आहे.
Uber कडे लाखो पिक-अप्सचा डेटासेट आहे ज्याचा वापर ते अंतर्दृष्टी उघड करण्यासाठी आणि ग्राहक अनुभव सुधारण्यासाठी क्लायंट ट्रिपचे विश्लेषण आणि प्रदर्शित करण्यासाठी करू शकते.
15. कोविड -19 विश्लेषण
कोविड-19 ने आज संपूर्ण जग व्यापले आहे, केवळ साथीच्या आजाराच्या अर्थाने नाही. वैद्यकीय तज्ञ प्रभावी लस तयार करण्यावर आणि जगाला लसीकरण करण्यावर लक्ष केंद्रित करत असताना, डेटा वैज्ञानिक फार मागे नाहीत.
नवीन प्रकरणे, दररोज सक्रिय संख्या, मृत्यू आणि चाचणी आकडेवारी सर्व सार्वजनिक केले जात आहेत. मागील शतकातील SARS च्या प्रादुर्भावाच्या आधारे अंदाज दररोज केले जातात. यासाठी, तुम्ही रीग्रेशन अॅनालिसिस वापरू शकता आणि वेक्टर मशीन-आधारित अंदाज मॉडेल्सचे समर्थन करू शकता.
निष्कर्ष
थोडक्यात, आम्ही काही शीर्ष एमएल प्रकल्पांची चर्चा केली आहे जे तुम्हाला मशीन लर्निंग प्रोग्रामिंगची चाचणी घेण्यास तसेच त्यांच्या कल्पना आणि अंमलबजावणीमध्ये मदत करतील. मशीन लर्निंग कसे समाकलित करायचे हे जाणून घेणे तुम्हाला तुमच्या व्यवसायात प्रगती करण्यास मदत करू शकते कारण प्रत्येक उद्योगात तंत्रज्ञानाचा ताबा घेतला जातो.
मशीन लर्निंग शिकत असताना, आम्ही शिफारस करतो की तुम्ही तुमच्या संकल्पनांचा सराव करा आणि तुमचे सर्व अल्गोरिदम लिहा. शिकत असताना अल्गोरिदम लिहिणे हे प्रोजेक्ट करण्यापेक्षा जास्त महत्त्वाचे आहे आणि यामुळे तुम्हाला विषय योग्यरित्या समजून घेण्याचा फायदा देखील होतो.
प्रत्युत्तर द्या