विषय - सूची[छिपाना][प्रदर्शन]
- 1। विशाल
- 2. आयरिश फूल वर्गीकरण
- 3. बोस्टन हाउस मूल्य भविष्यवाणी
- 4. वाइन गुणवत्ता परीक्षण
- 5. शेयर बाजार की भविष्यवाणी
- 6. मूवी सिफ़ारिश
- 7. लोड पात्रता भविष्यवाणी
- 8. ट्विटर डेटा का उपयोग करके भावना विश्लेषण
- 9. भविष्य की बिक्री की भविष्यवाणी
- 10. फेक न्यूज का पता लगाना
- 11. कूपन खरीद भविष्यवाणी
- 12. ग्राहक मंथन भविष्यवाणी
- 13. वॉलमार्ट बिक्री पूर्वानुमान
- 14. उबेर डेटा विश्लेषण
- 15. कोविड-19 विश्लेषण
- निष्कर्ष
मशीन लर्निंग एक सरल अध्ययन है कि उच्च स्तर पर प्रस्तुत किसी विशिष्ट कार्य में धीरे-धीरे सुधार करने के लिए कंप्यूटर प्रोग्राम या एल्गोरिदम को कैसे शिक्षित किया जाए। छवि पहचान, धोखाधड़ी का पता लगाना, अनुशंसा प्रणाली और अन्य मशीन लर्निंग एप्लिकेशन पहले ही लोकप्रिय साबित हो चुके हैं।
एमएल नौकरियां मानव कार्य को सरल और कुशल बनाती हैं, समय बचाती हैं और उच्च गुणवत्ता वाला परिणाम सुनिश्चित करती हैं। यहां तक कि दुनिया का सबसे लोकप्रिय सर्च इंजन गूगल भी इसका इस्तेमाल करता है यंत्र अधिगम.
उपयोगकर्ता की क्वेरी का विश्लेषण करने और परिणामों के आधार पर परिणाम बदलने से लेकर क्वेरी के संबंध में ट्रेंडिंग टॉपिक्स और विज्ञापन दिखाने तक, कई प्रकार के विकल्प उपलब्ध हैं।
ऐसी तकनीक जो बोधगम्य और स्व-सुधारात्मक दोनों है, भविष्य में बहुत दूर नहीं है।
आरंभ करने के सर्वोत्तम तरीकों में से एक है हाथ से कार्य करना और किसी प्रोजेक्ट को डिज़ाइन करना। इसलिए, हमने शुरुआती लोगों के लिए 15 शीर्ष मशीन लर्निंग परियोजनाओं की एक सूची तैयार की है ताकि आप शुरुआत कर सकें।
1. विशाल
मशीन लर्निंग के बारे में अधिक जानने में रुचि रखने वाले किसी भी व्यक्ति के लिए इसे अक्सर सबसे महान और सबसे सुखद कार्यों में से एक माना जाता है। टाइटैनिक चैलेंज एक लोकप्रिय मशीन लर्निंग प्रोजेक्ट है जो कागल डेटा साइंस प्लेटफॉर्म से परिचित होने का एक अच्छा तरीका है। टाइटैनिक डेटासेट दुर्भाग्यपूर्ण जहाज के डूबने के वास्तविक डेटा से बना है।
इसमें व्यक्ति की उम्र, सामाजिक आर्थिक स्थिति, लिंग, केबिन नंबर, प्रस्थान बंदरगाह और सबसे महत्वपूर्ण बात यह है कि क्या वे जीवित बचे हैं जैसे विवरण शामिल हैं!
K-निकटतम पड़ोसी तकनीक और निर्णय ट्री क्लासिफायर इस परियोजना के लिए सर्वोत्तम परिणाम देने के लिए निर्धारित किए गए थे। यदि आप अपने को बेहतर बनाने के लिए एक तेज़ सप्ताहांत चुनौती की तलाश में हैं मशीन सीखने की क्षमता, कागल पर यह आपके लिए है।
2. आयरिश फूल वर्गीकरण
शुरुआती लोगों को आईरिस फूल वर्गीकरण परियोजना पसंद है, और यदि आप मशीन लर्निंग में नए हैं तो यह शुरुआत करने के लिए एक शानदार जगह है। बाह्यदलों और पंखुड़ियों की लंबाई आईरिस फूल को अन्य प्रजातियों से अलग करती है। इस परियोजना का उद्देश्य फूलों को तीन प्रजातियों में अलग करना है: वर्जीनिया, सेटोसा और वर्सिकलर।
वर्गीकरण अभ्यास के लिए, परियोजना आइरिस फूल डेटासेट को नियोजित करती है, जो शिक्षार्थियों को संख्यात्मक मूल्यों और डेटा से निपटने के बुनियादी सिद्धांतों को सीखने में सहायता करती है। आईरिस फ्लावर डेटासेट एक छोटा डेटासेट है जिसे स्केलिंग की आवश्यकता के बिना मेमोरी में संग्रहीत किया जा सकता है।
3. बोस्टन हाउस मूल्य भविष्यवाणी
एक और प्रसिद्ध मशीन लर्निंग में नौसिखियों के लिए डेटासेट बोस्टन हाउसिंग डेटा है. इसका लक्ष्य बोस्टन के विभिन्न इलाकों में घरेलू मूल्यों का पूर्वानुमान लगाना है। इसमें उम्र, संपत्ति कर की दर, अपराध दर और यहां तक कि नौकरी केंद्रों से निकटता जैसे महत्वपूर्ण आंकड़े शामिल हैं, जो सभी आवास मूल्य निर्धारण को प्रभावित कर सकते हैं।
डेटासेट सरल और छोटा है, जिससे नौसिखियों के लिए इसका प्रयोग करना आसान हो जाता है। यह पता लगाने के लिए कि कौन से कारक बोस्टन में संपत्ति की कीमत को प्रभावित करते हैं, विभिन्न मापदंडों पर प्रतिगमन तकनीकों का भारी उपयोग किया जाता है। यह प्रतिगमन तकनीकों का अभ्यास करने और यह आकलन करने के लिए एक शानदार जगह है कि वे कितनी अच्छी तरह काम करती हैं।
4. वाइन गुणवत्ता परीक्षण
वाइन एक असामान्य मादक पेय है जिसे वर्षों तक किण्वित करने की आवश्यकता होती है। नतीजतन, शराब की प्राचीन बोतल एक महंगी और उच्च गुणवत्ता वाली शराब है। वाइन की आदर्श बोतल चुनने के लिए वाइन चखने के वर्षों के ज्ञान की आवश्यकता होती है, और यह एक हिट-या-मिस प्रक्रिया हो सकती है।
वाइन गुणवत्ता परीक्षण परियोजना अल्कोहल स्तर, निश्चित अम्लता, घनत्व, पीएच और अन्य कारकों जैसे भौतिक रासायनिक परीक्षणों का उपयोग करके वाइन का मूल्यांकन करती है। परियोजना वाइन की गुणवत्ता मानदंड और मात्रा भी निर्धारित करती है। परिणामस्वरूप, शराब खरीदना आसान हो जाता है।
5. शेयर बाजार भविष्यवाणी
चाहे आप वित्तीय क्षेत्र में काम करते हों या नहीं, यह पहल दिलचस्प है। शेयर बाजार डेटा का शिक्षाविदों, व्यवसायों और यहां तक कि माध्यमिक आय के स्रोत के रूप में बड़े पैमाने पर अध्ययन किया जाता है। एक डेटा वैज्ञानिक के लिए समय श्रृंखला डेटा का अध्ययन और अन्वेषण करने की क्षमता भी महत्वपूर्ण है। शेयर बाज़ार से डेटा शुरुआत करने के लिए एक बेहतरीन जगह है।
प्रयास का सार किसी स्टॉक के भविष्य के मूल्य का पूर्वानुमान लगाना है। यह वर्तमान बाज़ार प्रदर्शन के साथ-साथ पिछले वर्षों के आँकड़ों पर आधारित है। कागल 50 से निफ्टी-2000 इंडेक्स पर डेटा एकत्र कर रहे हैं और वर्तमान में इसे साप्ताहिक रूप से अपडेट किया जाता है। 1 जनवरी 2000 से, इसमें 50 से अधिक संगठनों के स्टॉक मूल्य शामिल हैं।
6. मूवी सिफ़ारिश
मुझे यकीन है कि एक अच्छी फिल्म देखने के बाद आपको यह एहसास हुआ होगा। क्या आपने कभी इसी तरह की फिल्में देखकर अपनी इंद्रियों को उत्तेजित करने की इच्छा महसूस की है?
हम जानते हैं कि नेटफ्लिक्स जैसी ओटीटी सेवाओं ने अपनी अनुशंसा प्रणाली में उल्लेखनीय सुधार किया है। एक मशीन लर्निंग छात्र के रूप में, आपको यह समझने की आवश्यकता होगी कि ऐसे एल्गोरिदम ग्राहकों को उनकी प्राथमिकताओं और समीक्षाओं के आधार पर कैसे लक्षित करते हैं।
कागल पर आईएमडीबी डेटा सेट संभवतः सबसे पूर्ण में से एक है, जो फिल्म के शीर्षक, ग्राहक रेटिंग, शैली और अन्य कारकों के आधार पर अनुशंसा मॉडल का अनुमान लगाने की अनुमति देता है। यह सामग्री-आधारित फ़िल्टरिंग और फ़ीचर इंजीनियरिंग के बारे में जानने का भी एक उत्कृष्ट तरीका है।
7. लोड पात्रता भविष्यवाणी
दुनिया कर्ज के इर्द-गिर्द घूमती है. बैंकों के लाभ का प्रमुख स्रोत ऋण पर ब्याज से आता है। इसलिए वे उनका मौलिक व्यवसाय हैं।
व्यक्ति या व्यक्तियों का समूह भविष्य में इसके मूल्य में वृद्धि देखने की उम्मीद में किसी फर्म में पैसा निवेश करके ही अर्थव्यवस्था का विस्तार कर सकता है। इस प्रकार के जोखिम उठाने और यहां तक कि कुछ सांसारिक सुखों में भाग लेने में सक्षम होने के लिए ऋण मांगना कभी-कभी महत्वपूर्ण होता है।
ऋण स्वीकार करने से पहले, बैंकों को आम तौर पर काफी सख्त प्रक्रिया का पालन करना पड़ता है। चूंकि ऋण कई लोगों के जीवन का एक महत्वपूर्ण पहलू है, इसलिए जिस ऋण के लिए कोई आवेदन करता है, उसके लिए पात्रता की भविष्यवाणी करना बेहद फायदेमंद होगा, जिससे ऋण स्वीकार या अस्वीकार किए जाने से परे बेहतर योजना बनाने की अनुमति मिलती है।
8. ट्विटर डेटा का उपयोग करके भावना विश्लेषण
की बदौलत सोशल मीडिया नेटवर्क ट्विटर, फेसबुक और रेडिट की तरह, विचारों और रुझानों को अलग करना काफी आसान हो गया है। इस जानकारी का उपयोग घटनाओं, लोगों, खेल और अन्य विषयों पर राय को खत्म करने के लिए किया जाता है। ओपिनियन माइनिंग से संबंधित मशीन लर्निंग पहल को राजनीतिक अभियानों और अमेज़ॅन उत्पाद मूल्यांकन सहित विभिन्न सेटिंग्स में लागू किया जा रहा है।
यह प्रोजेक्ट आपके पोर्टफोलियो में शानदार लगेगा! भावना का पता लगाने और पहलू-आधारित विश्लेषण के लिए, समर्थन वेक्टर मशीनों, प्रतिगमन और वर्गीकरण एल्गोरिदम जैसी तकनीकों का बड़े पैमाने पर उपयोग किया जा सकता है (तथ्यों और राय ढूंढना)।
9. भविष्य की बिक्री की भविष्यवाणी
बड़े बी2सी व्यवसाय और व्यापारी जानना चाहते हैं कि उनकी इन्वेंट्री में प्रत्येक उत्पाद कितना बिकेगा। बिक्री पूर्वानुमान व्यवसाय मालिकों को यह निर्धारित करने में सहायता करता है कि कौन सी वस्तुएँ उच्च मांग में हैं। सटीक बिक्री पूर्वानुमान से भविष्य के बजट पर वृद्धिशील प्रभाव का निर्धारण करते हुए बर्बादी में काफी कमी आएगी।
वॉलमार्ट, आईकेईए, बिग बास्केट और बिग बाज़ार जैसे खुदरा विक्रेता उत्पाद की मांग का अनुमान लगाने के लिए बिक्री पूर्वानुमान का उपयोग करते हैं। ऐसी एमएल परियोजनाओं के निर्माण के लिए आपको कच्चे डेटा को साफ करने की विभिन्न तकनीकों से परिचित होना चाहिए। इसके अलावा, प्रतिगमन विश्लेषण, विशेष रूप से सरल रैखिक प्रतिगमन, की अच्छी समझ आवश्यक है।
इस प्रकार के कार्यों के लिए, आपको डोरा, स्क्रबडब, पांडास, न्यूमपी और अन्य जैसे पुस्तकालयों को नियोजित करने की आवश्यकता होगी।
10. फेक न्यूज डिटेक्शन
यह स्कूली बच्चों के लिए एक और अत्याधुनिक मशीन लर्निंग प्रयास है। जैसा कि हम सभी जानते हैं, फर्जी खबरें जंगल की आग की तरह फैल रही हैं। सोशल मीडिया पर व्यक्तियों को जोड़ने से लेकर दैनिक समाचार पढ़ने तक सब कुछ उपलब्ध है।
परिणामस्वरूप, इन दिनों झूठी ख़बरों का पता लगाना कठिन होता जा रहा है। कई बड़े सोशल मीडिया नेटवर्क, जैसे कि फेसबुक और ट्विटर, के पास पोस्टिंग और फ़ीड में फर्जी समाचारों का पता लगाने के लिए पहले से ही एल्गोरिदम मौजूद हैं।
झूठी खबरों की पहचान करने के लिए, इस प्रकार के एमएल प्रोजेक्ट को कई एनएलपी दृष्टिकोण और वर्गीकरण एल्गोरिदम (पैसिवएग्रेसिवक्लासिफायर या नैवे बेयस क्लासिफायर) की गहन समझ की आवश्यकता होती है।
11. कूपन खरीद भविष्यवाणी
जब 2020 में कोरोनोवायरस ने ग्रह पर हमला किया तो ग्राहक तेजी से ऑनलाइन खरीदारी पर विचार कर रहे हैं। परिणामस्वरूप, शॉपिंग प्रतिष्ठानों को अपना व्यवसाय ऑनलाइन स्थानांतरित करने के लिए मजबूर होना पड़ा है।
दूसरी ओर, ग्राहक अभी भी शानदार ऑफ़र की तलाश में हैं, जैसे वे दुकानों में थे, और तेजी से सुपर-सेविंग कूपन की तलाश कर रहे हैं। ऐसे ग्राहकों के लिए कूपन बनाने के लिए समर्पित वेबसाइटें भी हैं। आप इस प्रोजेक्ट के साथ मशीन लर्निंग में डेटा माइनिंग, डेटा को विज़ुअलाइज़ करने के लिए बार ग्राफ़, पाई चार्ट और हिस्टोग्राम बनाने और फ़ीचर इंजीनियरिंग के बारे में सीख सकते हैं।
भविष्यवाणियां उत्पन्न करने के लिए, आप एनए मूल्यों और चर की कोसाइन समानता के प्रबंधन के लिए डेटा प्रतिरूपण दृष्टिकोण पर भी गौर कर सकते हैं।
12. ग्राहक मंथन भविष्यवाणी
उपभोक्ता किसी कंपनी की सबसे महत्वपूर्ण संपत्ति हैं, और राजस्व बढ़ाने और उनके साथ दीर्घकालिक सार्थक संबंध बनाने के लक्ष्य वाले किसी भी व्यवसाय के लिए उन्हें बनाए रखना महत्वपूर्ण है।
इसके अलावा, एक नया ग्राहक प्राप्त करने की लागत मौजूदा ग्राहक को बनाए रखने की लागत से पांच गुना अधिक है। ग्राहक मंथन/क्षति एक प्रसिद्ध व्यावसायिक समस्या है जिसमें ग्राहक या ग्राहक किसी सेवा या कंपनी के साथ व्यापार करना बंद कर देते हैं।
आदर्श रूप से वे अब भुगतान करने वाले ग्राहक नहीं रहेंगे। यदि किसी ग्राहक को कंपनी के साथ अंतिम बार बातचीत किए हुए एक विशेष समय हो गया है, तो उसे निष्क्रिय माना जाता है। यह पहचानना कि ग्राहक मंथन करेगा या नहीं, साथ ही ग्राहक प्रतिधारण के उद्देश्य से तेजी से प्रासंगिक जानकारी देना, मंथन को कम करने के लिए महत्वपूर्ण है।
हमारा दिमाग लाखों ग्राहकों के ग्राहक कारोबार का अनुमान लगाने में असमर्थ है; यहीं पर मशीन लर्निंग मदद कर सकती है।
13. वॉलमार्ट बिक्री पूर्वानुमान
मशीन लर्निंग के सबसे प्रमुख अनुप्रयोगों में से एक बिक्री पूर्वानुमान है, जिसमें उत्पाद की बिक्री को प्रभावित करने वाली विशेषताओं का पता लगाना और भविष्य की बिक्री की मात्रा का अनुमान लगाना शामिल है।
इस मशीन लर्निंग अध्ययन में वॉलमार्ट डेटासेट का उपयोग किया जाता है, जिसमें 45 स्थानों से बिक्री डेटा शामिल है। प्रति स्टोर बिक्री, श्रेणी के अनुसार, साप्ताहिक आधार पर डेटासेट में शामिल की जाती है। इस मशीन लर्निंग प्रोजेक्ट का उद्देश्य प्रत्येक आउटलेट में प्रत्येक विभाग के लिए बिक्री का अनुमान लगाना है ताकि वे बेहतर डेटा-संचालित चैनल अनुकूलन और इन्वेंट्री योजना निर्णय ले सकें।
वॉलमार्ट डेटासेट के साथ काम करना कठिन है क्योंकि इसमें चुनिंदा मार्कडाउन घटनाएं शामिल हैं जिनका बिक्री पर प्रभाव पड़ता है और इस पर विचार किया जाना चाहिए।
14. उबेर डेटा विश्लेषण
जब मशीन लर्निंग और डीप लर्निंग को अपने ऐप्स में लागू करने और एकीकृत करने की बात आती है, तो लोकप्रिय राइड-शेयरिंग सेवा भी पीछे नहीं है। हर साल, यह अरबों यात्राएँ करता है, जिससे यात्रियों को दिन या रात के किसी भी समय यात्रा करने की अनुमति मिलती है।
क्योंकि इसके पास इतना बड़ा ग्राहक आधार है, इसलिए इसे उपभोक्ताओं की शिकायतों का यथाशीघ्र समाधान करने के लिए असाधारण ग्राहक सेवा की आवश्यकता है।
उबर के पास लाखों पिक-अप का डेटासेट है जिसका उपयोग वह अंतर्दृष्टि को उजागर करने और ग्राहक अनुभव को बेहतर बनाने के लिए ग्राहक यात्राओं का विश्लेषण और प्रदर्शित करने के लिए कर सकता है।
15. कोविड-19 विश्लेषण
कोविड-19 ने आज पूरी दुनिया को अपनी चपेट में ले लिया है, न कि केवल एक महामारी के रूप में। जबकि चिकित्सा विशेषज्ञ प्रभावी टीकाकरण तैयार करने और दुनिया का टीकाकरण करने पर ध्यान केंद्रित कर रहे हैं, डेटा वैज्ञानिकों बहुत पीछे नहीं हैं.
नए मामले, दैनिक सक्रिय गिनती, मृत्यु दर और परीक्षण आँकड़े सभी सार्वजनिक किए जा रहे हैं। पिछली सदी के सार्स प्रकोप के आधार पर दैनिक आधार पर पूर्वानुमान लगाए जाते हैं। इसके लिए, आप प्रतिगमन विश्लेषण का उपयोग कर सकते हैं और वेक्टर मशीन-आधारित भविष्यवाणी मॉडल का समर्थन कर सकते हैं।
निष्कर्ष
संक्षेप में, हमने कुछ शीर्ष एमएल परियोजनाओं पर चर्चा की है जो मशीन लर्निंग प्रोग्रामिंग का परीक्षण करने के साथ-साथ इसके विचारों और कार्यान्वयन को समझने में आपकी सहायता करेंगे। मशीन लर्निंग को एकीकृत करने का तरीका जानने से आपको अपने पेशे में आगे बढ़ने में मदद मिल सकती है क्योंकि प्रौद्योगिकी हर उद्योग में हावी हो रही है।
मशीन लर्निंग सीखते समय, हम अनुशंसा करते हैं कि आप अपनी अवधारणाओं का अभ्यास करें और अपने सभी एल्गोरिदम लिखें। किसी प्रोजेक्ट को निष्पादित करने की तुलना में सीखते समय एल्गोरिदम लिखना अधिक महत्वपूर्ण है, और यह आपको विषयों को ठीक से समझने में भी लाभ प्रदान करता है।
एक जवाब लिखें