विषयसूची[लुकाउनुहोस्][देखाउनु]
- 1। टाइटैनिक
- 2. आयरिश फूल वर्गीकरण
- 3. बोस्टन हाउस मूल्य भविष्यवाणी
- 4. वाइन गुणस्तर परीक्षण
- 5. शेयर बजार भविष्यवाणी
- 6. चलचित्र सिफारिस
- 7. योग्यता भविष्यवाणी लोड गर्नुहोस्
- 8. ट्विटर डाटा प्रयोग गरेर भावना विश्लेषण
- 9. भविष्य बिक्री भविष्यवाणी
- 10. नक्कली समाचार पत्ता लगाउने
- 11. कूपन खरिद भविष्यवाणी
- 12. ग्राहक मन्थन भविष्यवाणी
- 13. वालमार्ट बिक्री पूर्वानुमान
- 14. Uber डाटा विश्लेषण
- 15. कोविड-19 विश्लेषण
- निष्कर्ष
मेशिन लर्निङ भनेको कम्प्युटर प्रोग्राम वा एल्गोरिदमलाई उच्च स्तरमा प्रस्तुत गरिएको विशेष काममा क्रमशः सुधार गर्न कसरी शिक्षित गर्ने भन्ने सरल अध्ययन हो। छवि पहिचान, धोखाधडी पत्ता लगाउने, सिफारिस प्रणालीहरू, र अन्य मेसिन लर्निंग अनुप्रयोगहरू पहिले नै लोकप्रिय साबित भइसकेका छन्।
ML कार्यहरूले मानव कार्यलाई सरल र प्रभावकारी बनाउँदछ, समय बचत गर्दछ र उच्च गुणस्तरको परिणाम सुनिश्चित गर्दछ। संसारको सबैभन्दा लोकप्रिय सर्च इन्जिन गुगलले पनि प्रयोग गर्छ मेशिन सिकाइ.
प्रयोगकर्ताको प्रश्नको विश्लेषण गर्ने र नतिजाको आधारमा परिणाम परिवर्तन गर्नेदेखि लिएर प्रश्नको सम्बन्धमा प्रचलनमा रहेका विषयहरू र विज्ञापनहरू देखाउनेसम्म, त्यहाँ विभिन्न विकल्पहरू उपलब्ध छन्।
टेक्नोलोजी जुन ग्रहणशील र आत्म-सुधार दुवै छ भविष्यमा धेरै टाढा छैन।
सुरु गर्नका लागि सबैभन्दा ठूलो तरिकाहरू मध्ये एक हातमा प्राप्त गर्न र परियोजना डिजाइन गर्न हो। तसर्थ, हामीले शुरुवातकर्ताहरूका लागि तपाइँलाई सुरु गर्नका लागि 15 शीर्ष मेसिन लर्निङ परियोजनाहरूको सूची कम्पाइल गरेका छौं।
1. titanic
मेसिन लर्निङको बारेमा थप जान्न चाहने जो कोहीको लागि यो प्रायः सबैभन्दा ठूलो र सबैभन्दा रमाइलो कार्यहरू मध्ये एक मानिन्छ। Titanic चुनौती एक लोकप्रिय मेसिन लर्निङ परियोजना हो जसले Kaggle डेटा विज्ञान प्लेटफर्मसँग परिचित हुने राम्रो तरिकाको रूपमा पनि काम गर्दछ। टाइटानिक डाटासेट अभागी जहाज डुब्दाको वास्तविक डाटाबाट बनेको छ।
यसमा व्यक्तिको उमेर, सामाजिक आर्थिक स्थिति, लिङ्ग, क्याबिन नम्बर, प्रस्थान पोर्ट, र सबैभन्दा महत्त्वपूर्ण कुरा, तिनीहरू बाँचे कि भएन जस्ता विवरणहरू समावेश हुन्छन्!
K- नजिकैको छिमेकी प्रविधि र निर्णय रूख वर्गीकरणकर्ताले यस परियोजनाको लागि उत्कृष्ट नतिजाहरू उत्पादन गर्न कटिबद्ध थिए। यदि तपाइँ आफ्नो सुधार गर्न छिटो सप्ताहन्त चुनौती खोज्दै हुनुहुन्छ भने मेसिन लर्निंग क्षमताहरू, Kaggle मा यो एक तपाईंको लागि हो।
2. आयरिश फूल वर्गीकरण
शुरुवातकर्ताहरूले आइरिस फूल वर्गीकरण परियोजना मन पराउँछन्, र यदि तपाईं मेसिन लर्निङमा नयाँ हुनुहुन्छ भने यो सुरु गर्नको लागि उत्तम ठाउँ हो। सेपल र पंखुडीहरूको लम्बाइले अन्य प्रजातिहरूबाट आइरिसको फूललाई फरक पार्छ। यस परियोजनाको उद्देश्य फूलहरूलाई तीन प्रजातिहरूमा विभाजन गर्नु हो: भर्जिनिया, सेटोसा र भर्सिकलर।
वर्गीकरण अभ्यासका लागि, परियोजनाले आइरिस फूल डेटासेटलाई रोजगार दिन्छ, जसले विद्यार्थीहरूलाई संख्यात्मक मान र डेटासँग व्यवहार गर्ने आधारभूत कुराहरू सिक्न मद्दत गर्दछ। आइरिस फूल डेटासेट एक सानो हो जुन स्केलिंगको आवश्यकता बिना मेमोरीमा भण्डारण गर्न सकिन्छ।
3. बोस्टन हाउस मूल्य भविष्यवाणी
अर्को चर्चित मेसिन लर्निङमा नौसिखियाहरूका लागि डाटासेट बोस्टन हाउसिङ डाटा हो। यसको लक्ष्य विभिन्न बोस्टन छिमेकहरूमा घर मूल्यहरू पूर्वानुमान गर्नु हो। यसमा उमेर, सम्पत्ति कर दर, अपराध दर, र रोजगार केन्द्रहरूको निकटता जस्ता महत्त्वपूर्ण तथ्याङ्कहरू समावेश छन्, ती सबैले आवास मूल्य निर्धारणलाई असर गर्न सक्छ।
डाटासेट सरल र सानो छ, यसलाई नौसिखियाहरूका लागि प्रयोग गर्न सजिलो बनाउँदै। बोस्टनमा सम्पत्ति मूल्यलाई कुन कारकहरूले प्रभाव पार्छ भन्ने कुरा पत्ता लगाउन, रिग्रेसन प्रविधिहरू विभिन्न मापदण्डहरूमा भारी रूपमा प्रयोग गरिन्छ। यो रिग्रेसन प्रविधिहरू अभ्यास गर्न र तिनीहरूले कत्तिको राम्ररी काम गर्छन् भनेर मूल्याङ्कन गर्न उत्कृष्ट ठाउँ हो।
4. वाइन गुणस्तर परीक्षण
वाइन एक असामान्य अल्कोहल पेय पदार्थ हो जसलाई वर्षौं किण्वन चाहिन्छ। नतिजाको रूपमा, रक्सीको एन्टिक बोतल एक महँगो र उच्च गुणस्तरको शराब हो। वाइनको आदर्श बोतल छनोट गर्न वर्षौंको वाइन स्वादको ज्ञान चाहिन्छ, र यो हिट-वा-मिस प्रक्रिया हुन सक्छ।
वाइन गुणस्तर परीक्षण परियोजनाले रक्सीको स्तर, स्थिर अम्लता, घनत्व, pH, र अन्य कारकहरू जस्ता भौतिक रसायनिक परीक्षणहरू प्रयोग गरेर मदिराहरूको मूल्याङ्कन गर्दछ। परियोजनाले वाइनको गुणस्तर मापदण्ड र मात्रा पनि निर्धारण गर्दछ। नतिजाको रूपमा, रक्सी खरिद हावा हुन्छ।
5. शेयर बजार भविष्यवाणी
यो पहल चाखलाग्दो छ कि तपाइँ वित्तीय क्षेत्रमा काम गर्नुहुन्छ वा नगर्नुहोस्। स्टक बजार डेटा शिक्षाविद्हरू, व्यवसायहरू, र माध्यमिक आयको स्रोतको रूपमा पनि व्यापक रूपमा अध्ययन गरिन्छ। डेटा वैज्ञानिकको अध्ययन र समय श्रृंखला डेटा अन्वेषण गर्ने क्षमता पनि महत्त्वपूर्ण छ। स्टक बजारबाट डाटा सुरु गर्न एक राम्रो ठाउँ हो।
प्रयासको सार भनेको स्टकको भविष्यको मूल्यको पूर्वानुमान गर्नु हो। यो हालको बजार कार्यसम्पादनका साथै अघिल्लो वर्षको तथ्याङ्कमा आधारित छ। Kaggle ले 50 देखि NIFTY-2000 सूचकांकमा डाटा सङ्कलन गर्दै आएको छ, र यो हाल साप्ताहिक रूपमा अद्यावधिक गरिन्छ। जनवरी 1, 2000 देखि, यसले 50 भन्दा बढी संस्थाहरूको स्टक मूल्यहरू समावेश गरेको छ।
6. चलचित्र सिफारिस
राम्रो चलचित्र हेरेपछि तपाईले त्यो अनुभूति गर्नुभएको छ भन्नेमा म विश्वस्त छु । के तपाईंले कहिल्यै उस्तै खालका फिल्महरू हेरेर आफ्नो इन्द्रियहरूलाई उचाल्ने आवेग महसुस गर्नुभएको छ?
हामीलाई थाहा छ कि नेटफ्लिक्स जस्ता OTT सेवाहरूले उनीहरूको सिफारिस प्रणालीमा उल्लेखनीय सुधार गरेका छन्। मेसिन लर्निङ विद्यार्थीको रूपमा, तपाईंले त्यस्ता एल्गोरिदमहरूले ग्राहकहरूलाई उनीहरूको प्राथमिकता र समीक्षाहरूको आधारमा कसरी लक्षित गर्छन् भनेर बुझ्न आवश्यक छ।
Kaggle मा सेट गरिएको IMDB डेटा सम्भवतः सबैभन्दा पूर्ण मध्ये एक हो, जसले सिफारिस मोडेलहरूलाई चलचित्र शीर्षक, ग्राहक मूल्याङ्कन, विधा, र अन्य कारकहरूको आधारमा अनुमान लगाउन अनुमति दिन्छ। यो सामग्री-आधारित फिल्टरिङ र फीचर इन्जिनियरिङको बारेमा जान्नको लागि उत्कृष्ट विधि पनि हो।
7. लोड योग्यता भविष्यवाणी
संसार ऋणको वरिपरि घुम्छ। बैंकहरूको नाफाको मुख्य स्रोत ऋणको ब्याज हो। त्यसैले तिनीहरूको आधारभूत व्यवसाय हो।
व्यक्ति वा व्यक्तिहरूको समूहले भविष्यमा मूल्य बढेको देख्ने आशामा फर्ममा पैसा लगानी गरेर मात्र अर्थतन्त्र विस्तार गर्न सक्छ। यो प्रकृतिको जोखिम लिन र केहि सांसारिक सुखहरूमा भाग लिन सक्षम हुन कहिलेकाहीँ ऋण खोज्नु महत्त्वपूर्ण हुन्छ।
ऋण स्वीकृत हुनु अघि, बैंकहरूसँग सामान्यतया पालन गर्नको लागि एकदम कडा प्रक्रिया हुन्छ। ऋणहरू धेरै व्यक्तिहरूको जीवनको यस्तो महत्त्वपूर्ण पक्ष भएकोले, कसैले आवेदन गर्ने ऋणको लागि योग्यताको भविष्यवाणी गर्नु अत्यन्त लाभदायक हुनेछ, जसले ऋण स्वीकार वा अस्वीकार गरिएपछि राम्रो योजना बनाउन अनुमति दिन्छ।
8. ट्विटर डाटा प्रयोग गरेर भावना विश्लेषण
धन्यवाद सामाजिक मिडिया नेटवर्क ट्विटर, फेसबुक र Reddit जस्तै, एक्स्ट्रापोलेटिंग राय र प्रवृत्तिहरू धेरै सजिलो भएको छ। यो जानकारी घटनाहरू, मानिसहरू, खेलकुद, र अन्य विषयहरूमा राय हटाउन प्रयोग गरिन्छ। ओपिनियन माइनिङ-सम्बन्धित मेसिन लर्निङ पहलहरू राजनीतिक अभियानहरू र Amazon उत्पादन मूल्याङ्कनहरू सहित विभिन्न सेटिङहरूमा लागू भइरहेका छन्।
यो परियोजना तपाईंको पोर्टफोलियो मा शानदार देखिनेछ! भावना पत्ता लगाउन र पक्ष-आधारित विश्लेषणको लागि, समर्थन भेक्टर मेशिनहरू, रिग्रेसन, र वर्गीकरण एल्गोरिदमहरू जस्ता प्रविधिहरू व्यापक रूपमा प्रयोग गर्न सकिन्छ (तथ्य र रायहरू फेला पार्नुहोस्)।
9. भविष्य बिक्री भविष्यवाणी
ठूला B2C व्यवसायहरू र व्यापारीहरू जान्न चाहन्छन् कि तिनीहरूको सूचीमा रहेका प्रत्येक उत्पादनले कति बिक्री गर्नेछ। बिक्री पूर्वानुमानले व्यापार मालिकहरूलाई कुन वस्तुहरू उच्च मागमा छन् भनेर निर्धारण गर्न मद्दत गर्दछ। सही बिक्री पूर्वानुमानले भविष्यको बजेटमा बढ्दो प्रभावको निर्धारण गर्दा अपशिष्ट घटाउनेछ।
वालमार्ट, IKEA, बिग बास्केट, र बिग बजार जस्ता खुद्रा विक्रेताहरूले उत्पादनको माग अनुमान गर्न बिक्री पूर्वानुमान प्रयोग गर्छन्। त्यस्ता ML परियोजनाहरू निर्माण गर्नका लागि कच्चा डाटा सफा गर्ने विभिन्न प्रविधिहरूसँग तपाईं परिचित हुनुपर्छ। साथै, प्रतिगमन विश्लेषणको राम्रो समझ, विशेष गरी सरल रैखिक प्रतिगमन, आवश्यक छ।
यी प्रकारका कार्यहरूका लागि, तपाईंले Dora, Scrubadub, Pandas, NumPy, र अन्य जस्ता पुस्तकालयहरू प्रयोग गर्न आवश्यक छ।
10। फेक न्यूज पत्ता लगाउने
यो स्कूलका बच्चाहरूलाई लक्षित गर्ने अर्को अत्याधुनिक मेसिन लर्निङ प्रयास हो। नक्कली समाचारहरू जङ्गलको आगो जस्तै फैलिरहेको छ, हामी सबैलाई थाहा छ। सामाजिक सञ्जालमा व्यक्तिसँग जोड्नेदेखि दैनिक समाचार पढ्नसम्म सबै कुरा उपलब्ध छ।
नतिजाको रूपमा, झूटा समाचारहरू पत्ता लगाउन आजका दिनहरू बढ्दो गाह्रो भएको छ। धेरै ठूला सामाजिक सञ्जालहरू जस्तै फेसबुक र ट्विटरमा पोष्टिङ र फिडहरूमा नक्कली समाचारहरू पत्ता लगाउन एल्गोरिदमहरू पहिले नै छन्।
झूटा समाचारहरू पहिचान गर्न, यस प्रकारको ML परियोजनालाई बहुविध NLP दृष्टिकोण र वर्गीकरण एल्गोरिदमहरू (PassiveAggressiveClassifier वा Naive Bayes classifier) को पूर्ण ज्ञान चाहिन्छ।
11। कूपन खरीद भविष्यवाणी
2020 मा कोरोनाभाइरसले ग्रहमा आक्रमण गर्दा ग्राहकहरू बढ्दो रूपमा अनलाइन खरिद गर्ने विचार गरिरहेका छन्। फलस्वरूप, किनमेल प्रतिष्ठानहरू आफ्नो व्यापार अनलाइन स्थानान्तरण गर्न बाध्य भएका छन्।
अर्कोतर्फ, ग्राहकहरूले अझै पनि उत्कृष्ट अफरहरू खोजिरहेका छन्, जसरी तिनीहरू पसलहरूमा थिए, र बढ्दो रूपमा सुपर-बचत कुपनहरूको खोजी गरिरहेका छन्। त्यस्ता ग्राहकहरूको लागि कुपनहरू सिर्जना गर्न समर्पित वेबसाइटहरू पनि छन्। तपाईले मेसिन लर्निङमा डाटा माइनिङको बारेमा सिक्न सक्नुहुन्छ, बार ग्राफहरू उत्पादन गर्ने, पाई चार्टहरू, र हिस्टोग्रामहरू डेटा कल्पना गर्नका लागि, र यस परियोजनाको साथ इन्जिनियरिङ सुविधा।
भविष्यवाणीहरू उत्पन्न गर्न, तपाईंले NA मानहरू र चरहरूको कोसाइन समानता प्रबन्ध गर्नका लागि डाटा इम्प्युटेशन दृष्टिकोणहरू पनि हेर्न सक्नुहुन्छ।
12। ग्राहक मन्थन भविष्यवाणी
उपभोक्ताहरू कम्पनीको सबैभन्दा महत्त्वपूर्ण सम्पत्ति हुन्, र उनीहरूलाई राख्नु कुनै पनि व्यवसायको लागि राजस्व बढाउन र उनीहरूसँग दीर्घकालीन अर्थपूर्ण जडानहरू निर्माण गर्न महत्त्वपूर्ण छ।
यसबाहेक, नयाँ क्लाइन्ट प्राप्त गर्ने लागत अवस्थित एकलाई कायम राख्नको लागत भन्दा पाँच गुणा बढी छ। Customer Churn/Attrition एक प्रसिद्ध व्यापार समस्या हो जसमा ग्राहक वा ग्राहकहरूले सेवा वा कम्पनीसँग व्यापार गर्न छोड्छन्।
तिनीहरू आदर्श रूपमा अब भुक्तान गर्ने ग्राहक हुनेछैनन्। यदि ग्राहकले कम्पनीसँग अन्तिम पटक अन्तरक्रिया गरेको यता कुनै निश्चित समय भइसकेको छ भने ग्राहकलाई मन्थन गरिएको मानिन्छ। ग्राहकले मन्थन गर्छ कि गर्दैन भनेर पहिचान गर्ने, साथै ग्राहकलाई कायम राख्ने उद्देश्यले तुरुन्तै सान्दर्भिक जानकारी दिनु, मन्थन कम गर्न महत्त्वपूर्ण छ।
हाम्रा दिमागहरू लाखौं ग्राहकहरूको लागि ग्राहक कारोबारको अनुमान गर्न असक्षम छन्; यहाँ छ जहाँ मेसिन शिक्षाले मद्दत गर्न सक्छ।
13। Wallmart बिक्री पूर्वानुमान
मेसिन लर्निङको सबैभन्दा प्रख्यात अनुप्रयोगहरू मध्ये एक बिक्री पूर्वानुमान हो, जसमा उत्पादन बिक्रीलाई प्रभाव पार्ने विशेषताहरू पत्ता लगाउने र भविष्यमा बिक्रीको मात्रा अनुमान गर्ने समावेश हुन्छ।
Walmart डेटासेट, जसमा 45 स्थानहरूबाट बिक्री डेटा समावेश छ, यो मेसिन लर्निङ अध्ययनमा प्रयोग गरिन्छ। प्रति स्टोर बिक्री, श्रेणी अनुसार, साप्ताहिक आधारमा डेटासेटमा समावेश गरिएको छ। यस मेसिन लर्निङ प्रोजेक्टको उद्देश्य प्रत्येक आउटलेटमा प्रत्येक विभागको लागि बिक्री अनुमान गर्नु हो ताकि तिनीहरूले राम्रो डेटा-संचालित च्यानल अप्टिमाइजेसन र सूची योजना निर्णयहरू गर्न सकून्।
Walmart डेटासेटसँग काम गर्न गाह्रो छ किनभने यसले बिक्रीमा प्रभाव पार्ने छनौट गरिएका मार्कडाउन घटनाहरू समावेश गर्दछ र विचार गर्नुपर्छ।
14। Uber डाटा विश्लेषण
जब यो तिनीहरूको एपहरूमा मेसिन लर्निङ र गहिरो शिक्षा लागू गर्ने र एकीकृत गर्ने कुरा आउँछ, लोकप्रिय राइड-साझेदारी सेवा धेरै पछि छैन। हरेक वर्ष, यसले यात्रुहरूलाई दिन वा रातको कुनै पनि समयमा यात्रा गर्न अनुमति दिँदै अरबौं यात्राहरू प्रशोधन गर्छ।
किनभने योसँग यति ठूलो ग्राहक आधार छ, यसलाई सकेसम्म चाँडो उपभोक्ता गुनासोहरू सम्बोधन गर्न असाधारण ग्राहक सेवा चाहिन्छ।
Uber सँग लाखौं पिक-अपहरूको डेटासेट छ जसलाई यसले अन्तर्दृष्टिहरू उजागर गर्न र ग्राहकको अनुभव सुधार गर्न ग्राहक यात्राहरू विश्लेषण र प्रदर्शन गर्न प्रयोग गर्न सक्छ।
15। Covid-19 विश्लेषण
COVID-19 ले आज विश्वलाई फैलाएको छ, र केवल एक महामारीको अर्थमा होइन। चिकित्सा विशेषज्ञहरू प्रभावकारी खोपहरू उत्पादन गर्न र विश्वलाई प्रतिरक्षा गर्नमा ध्यान केन्द्रित गरिरहँदा, डाटा वैज्ञानिकहरू धेरै पछि परेका छैनन् ।
नयाँ केसहरू, दैनिक सक्रिय गणना, मृत्यु, र परीक्षण तथ्याङ्कहरू सबै सार्वजनिक भइरहेका छन्। अघिल्लो शताब्दीको सार्स प्रकोपको आधारमा दैनिक रूपमा पूर्वानुमान गरिन्छ। यसको लागि, तपाईंले प्रतिगमन विश्लेषण र समर्थन भेक्टर मेसिन-आधारित भविष्यवाणी मोडेलहरू प्रयोग गर्न सक्नुहुन्छ।
निष्कर्ष
संक्षेपमा, हामीले केही शीर्ष ML परियोजनाहरू छलफल गरेका छौं जसले तपाईंलाई मेसिन लर्निङ प्रोग्रामिङको परीक्षणका साथै यसका विचारहरू र कार्यान्वयन गर्न मद्दत गर्नेछ। मेसिन लर्निङलाई कसरी एकीकृत गर्ने भन्ने कुरा थाहा पाउनुले तपाइँलाई तपाइँको पेशामा अगाडि बढ्न मद्दत गर्न सक्छ किनकि प्रविधिले हरेक उद्योगमा लिन्छ।
मेसिन लर्निङ सिक्ने क्रममा, हामी तपाईंलाई आफ्ना अवधारणाहरू अभ्यास गर्न र आफ्ना सबै एल्गोरिदमहरू लेख्न सुझाव दिन्छौं। सिक्ने क्रममा एल्गोरिदमहरू लेख्नु परियोजना प्रदर्शन गर्नु भन्दा बढी महत्त्वपूर्ण छ, र यसले तपाईंलाई विषयहरू राम्ररी बुझ्नको लागि फाइदा पनि प्रदान गर्दछ।
जवाफ छाड्नुस्