विषयसूची[लुकाउनुहोस्][देखाउनु]
हाम्रो दैनिक जीवनको हरेक पक्षमा प्रभाव पार्ने आर्टिफिसियल इन्टेलिजेन्स, र मेसिन लर्निङका कारण संसार चाँडै परिवर्तन हुँदैछ।
अपोइन्टमेन्ट बुक गर्न NLP र मेसिन लर्निङ प्रयोग गर्ने भ्वाइस सहायकहरूबाट, हाम्रो क्यालेन्डरमा घटनाहरू खोज्नुहोस्, र यन्त्रहरूमा संगीत बजाउनुहोस् जुन यत्तिको सही छ कि तिनीहरूले हामीले विचार गर्नुअघि नै हाम्रा आवश्यकताहरू अनुमान गर्न सक्छन्।
कम्प्यूटरहरूले चेस खेल्न सक्छन्, शल्यक्रिया गर्न सक्छन्, र मेसिन लर्निङ एल्गोरिदमको सहायताले स्मार्ट, अधिक मानव-जस्तै मेसिनहरूमा विकास गर्न सक्छन्।
हामी निरन्तर प्राविधिक विकासको समयमा छौं, र कम्प्युटरहरूले समयको साथ कसरी विकास गरेको देखेर, हामी भविष्यमा के हुनेछ भनेर भविष्यवाणी गर्न सक्छौं।
कम्प्युटिङ उपकरण र विधिहरूको लोकतन्त्रीकरण यस क्रान्तिको मुख्य पक्षहरू मध्ये एक हो जुन बाहिर खडा छ। डाटा वैज्ञानिकहरू विगत पाँच वर्षमा अत्याधुनिक विधिहरू सहज रूपमा लागू गरेर शक्तिशाली डाटा क्रन्चिङ कम्प्युटरहरू सिर्जना गरेको छ। नतिजाहरू आश्चर्यजनक छन्।
यस पोष्टमा, हामी नजिकबाट हेर्नेछौं मेशिन सिकाइ एल्गोरिदम र तिनीहरूका सबै भिन्नताहरू।
त्यसोभए, मेसिन लर्निङ एल्गोरिदमहरू के हुन्?
AI प्रणालीले आफ्नो कार्य पूरा गर्नको लागि प्रयोग गर्ने दृष्टिकोण-सामान्यतया, दिइएको इनपुट डेटाबाट आउटपुट मानहरू भविष्यवाणी गर्ने-लाई मेसिन लर्निङ एल्गोरिदम भनिन्छ।
मेसिन लर्निङ एल्गोरिदम भनेको डाटाको उपयोग गर्ने प्रक्रिया हो र उत्पादनका लागि तयार भएका मेसिन लर्निङ मोडेलहरू सिर्जना गर्न प्रयोग गरिन्छ। यदि मेसिन लर्निङ एउटा काम गर्ने रेल हो भने, मेसिन लर्निङ एल्गोरिदमहरू कामलाई साथमा लैजाने लोकोमोटिभहरू हुन्।
तपाईंले सम्बोधन गर्ने प्रयास गरिरहनुभएको व्यापारिक समस्या, तपाईंले प्रयोग गरिरहनुभएको डेटासेटको प्रकार, र तपाईंसँग उपलब्ध स्रोतहरूद्वारा उपयोग गर्नको लागि उत्तम मेसिन लर्निङ दृष्टिकोण निर्धारण गरिनेछ।
मेसिन लर्निङ एल्गोरिदमहरू ती हुन् जसले डेटा सेटलाई मोडेलमा परिणत गर्दछ। तपाईंले जवाफ दिन प्रयास गरिरहनुभएको समस्याको प्रकारमा निर्भर गर्दै, उपलब्ध प्रशोधन शक्ति, र तपाईंसँग भएको डाटाको प्रकार, पर्यवेक्षित, असुरक्षित, वा सुदृढीकरण सिकाउने एल्गोरिदमहरूले राम्रो प्रदर्शन गर्न सक्छन्।
त्यसोभए, हामीले पर्यवेक्षित, असुरक्षित, र सुदृढीकरण शिक्षाको बारेमा कुरा गर्यौं, तर तिनीहरू के हुन्? तिनीहरूलाई अन्वेषण गरौं।
पर्यवेक्षित, असुरक्षित र सुदृढीकरण शिक्षा
पर्यवेक्षित शिक्षण
पर्यवेक्षित शिक्षामा, AI मोडेल प्रदान गरिएको इनपुट र भविष्यवाणी गरिएको नतिजालाई प्रतिनिधित्व गर्ने लेबलको आधारमा विकसित गरिन्छ। इनपुट र आउटपुटको आधारमा, मोडेलले म्यापिङ समीकरण विकास गर्छ, र त्यो म्यापिङ समीकरण प्रयोग गरेर, यसले भविष्यमा इनपुटहरूको लेबलको पूर्वानुमान गर्छ।
मानौं हामीले एउटा कुकुर र बिरालोलाई छुट्याउन सक्ने मोडेल बनाउनु पर्छ। बिराला र कुकुरका धेरै तस्बिरहरू मोडेललाई तालिम दिनको लागि तिनीहरू बिरालाहरू वा कुकुरहरू हुन् भनेर संकेत गर्ने लेबलसहित मोडेलमा खुवाइन्छ।
मोडेलले ती छविहरूमा इनपुट फोटोहरूमा लेबलहरू सम्बन्धित समीकरण स्थापना गर्न खोज्छ। यदि मोडेलले यो छवि पहिले कहिल्यै नदेखेको भए पनि, प्रशिक्षण पछि, यो बिरालो वा कुकुरको हो कि भनेर पहिचान गर्न सक्छ।
अनसर्वेइज्ड लर्निंग
असुरक्षित सिकाइले एआई मोडेललाई लेबल नगरी इनपुटहरूमा मात्र तालिम दिन्छ। मोडेलले इनपुट डेटालाई सम्बन्धित विशेषताहरूसँग समूहहरूमा विभाजन गर्दछ।
इनपुटको भविष्यको लेबल त्यसपछि यसको विशेषताहरू वर्गीकरणहरू मध्ये एकसँग कत्तिको नजिक छ भन्ने आधारमा पूर्वानुमान गरिन्छ। हामीले रातो र नीलो बलहरूको समूहलाई दुई भागमा विभाजन गर्नुपर्ने अवस्थालाई विचार गर्नुहोस्।
मानौं कि बलहरूको अन्य विशेषताहरू समान छन्, रंगको अपवादको साथ। यसले बलहरूलाई कसरी दुई वर्गमा विभाजन गर्न सक्छ भन्ने आधारमा, मोडेलले बलहरू बीचको भिन्नताहरू खोज्छ।
बलहरूको दुई समूह - एउटा नीलो र एउटा रातो - जब बलहरूलाई तिनीहरूको रंगको आधारमा दुई समूहमा विभाजन गरिन्छ तब उत्पादन हुन्छ।
सुदृढीकरण अध्ययन
सुदृढीकरण सिकाइमा, एआई मोडेलले कुनै विशेष परिस्थितिमा काम गरेर समग्र नाफा बढाउन खोज्छ। यसको पूर्व परिणामहरूमा प्रतिक्रियाले मोडेललाई सिक्न मद्दत गर्दछ।
परिदृश्यको बारेमा सोच्नुहोस् जब रोबोटलाई अंक A र B बीचको मार्ग चयन गर्न निर्देशन दिइन्छ। रोबोटले पहिले कुनै पनि पाठ्यक्रम छनौट गर्दछ किनभने यसको कुनै पूर्व अनुभव छैन।
रोबोटले आफूले जाने बाटोमा इनपुट प्राप्त गर्छ र त्यसबाट ज्ञान प्राप्त गर्छ। रोबोटले अर्को पटक यस्तै परिस्थितिको सामना गर्दा समस्या समाधान गर्न इनपुट प्रयोग गर्न सक्छ।
उदाहरणका लागि, यदि रोबोटले विकल्प B छनोट गर्छ र सकारात्मक प्रतिक्रिया जस्ता पुरस्कार प्राप्त गर्छ भने, यसले आफ्नो पुरस्कार बढाउनको लागि बाटो B चयन गर्नुपर्छ भन्ने कुरा बुझ्छ।
अब अन्तमा के तपाई सबैले पर्खिरहनु भएको छ, एल्गोरिदम हो।
प्रमुख मेसिन लर्निंग एल्गोरिदम
1. रैखिक प्रतिगमन
पर्यवेक्षित शिक्षाबाट विचलित हुने सरल मेसिन लर्निङ दृष्टिकोण रैखिक प्रतिगमन हो। स्वतन्त्र चरहरूबाट ज्ञानको साथ, यो प्रायः रिग्रेसन समस्याहरू समाधान गर्न र निरन्तर निर्भर चरहरूमा भविष्यवाणीहरू सिर्जना गर्न प्रयोग गरिन्छ।
उत्तम फिटको रेखा खोज्नु, जसले निरन्तर निर्भर चरहरूको लागि नतिजाको भविष्यवाणी गर्न मद्दत गर्न सक्छ, रैखिक प्रतिगमनको उद्देश्य हो। घरको मूल्य, उमेर, र ज्याला निरन्तर मूल्यहरूका केही उदाहरणहरू हुन्।
सरल रैखिक प्रतिगमन भनेर चिनिने मोडेलले एक स्वतन्त्र चर र एक निर्भर चर बीचको सम्बन्ध गणना गर्न एक सीधा रेखा प्रयोग गर्दछ। बहु रेखीय प्रतिगमनमा दुई भन्दा बढी स्वतन्त्र चरहरू छन्।
एक रैखिक प्रतिगमन मोडेलमा चार अन्तर्निहित धारणाहरू छन्:
- रेखीयता: X र Y को माध्य बीच एक रेखीय जडान छ।
- Homoscedasticity: X को प्रत्येक मानको लागि, अवशिष्ट भिन्नता समान छ।
- स्वतन्त्रता: अवलोकनहरू स्वतन्त्रताको सन्दर्भमा एक अर्काबाट स्वतन्त्र छन्।
- सामान्यता: जब X निश्चित हुन्छ, Y लाई सामान्यतया वितरण गरिन्छ।
रैखिक प्रतिगमनले डेटाको लागि प्रशंसनीय रूपमा प्रदर्शन गर्दछ जुन रेखाहरूसँग अलग गर्न सकिन्छ। यसले नियमितीकरण, क्रस-प्रमाणीकरण, र आयाम घटाउने प्रविधिहरू प्रयोग गरेर ओभरफिटिंग नियन्त्रण गर्न सक्छ। यद्यपि, त्यहाँ उदाहरणहरू छन् जहाँ व्यापक सुविधा ईन्जिनियरिङ् आवश्यक छ, जुन कहिलेकाहीं ओभरफिटिंग र शोरको परिणाम हुन सक्छ।
2. लजिस्टिक रिग्रेसन
लजिस्टिक रिग्रेसन अर्को मेसिन लर्निङ प्रविधि हो जुन पर्यवेक्षित शिक्षाबाट अलग हुन्छ। यसको मुख्य प्रयोग वर्गीकरण हो, जबकि यो रिग्रेसन समस्याहरूको लागि पनि प्रयोग गर्न सकिन्छ।
लजिस्टिक रिग्रेसन स्वतन्त्र कारकहरूबाट जानकारी प्रयोग गरी वर्गीकृत निर्भर चर पूर्वानुमान गर्न प्रयोग गरिन्छ। लक्ष्य भनेको आउटपुटहरू वर्गीकरण गर्नु हो, जुन केवल ० र १ बीचमा आउन सक्छ।
इनपुटहरूको भारित कुल सिग्मोइड प्रकार्यद्वारा प्रशोधन गरिन्छ, एक सक्रियता प्रकार्य जसले ० र १ बीचको मानहरूलाई रूपान्तरण गर्छ।
लजिस्टिक रिग्रेसनको आधार अधिकतम सम्भावना अनुमान हो, विशिष्ट अवलोकन गरिएको डाटा दिइएको अनुमानित सम्भाव्यता वितरणको मापदण्डहरू गणना गर्ने विधि।
3. निर्णय रूख
अर्को मेसिन लर्निङ विधि जसले पर्यवेक्षित सिकाइलाई अलग गर्छ त्यो निर्णय रूख हो। दुवै वर्गीकरण र प्रतिगमन मुद्दाहरूको लागि, निर्णय रूख दृष्टिकोण नियोजित गर्न सकिन्छ।
यो निर्णय बनाउने उपकरण, जुन रूख जस्तो देखिन्छ, कार्यहरूको सम्भावित परिणामहरू, लागतहरू, र परिणामहरू देखाउन दृश्य प्रतिनिधित्वहरू प्रयोग गर्दछ। डाटालाई छुट्टाछुट्टै भागमा विभाजन गरेर, विचार मानव दिमागसँग मिल्दोजुल्दो छ।
हामीले यसलाई ग्रेन्युलेट गर्न सक्ने डेटालाई विभिन्न भागहरूमा विभाजित गरिएको छ। एक निर्णय रूख को मुख्य उद्देश्य एक प्रशिक्षण मोडेल निर्माण गर्न को लागी हो जुन लक्ष्य चर को वर्ग को पूर्वानुमान गर्न प्रयोग गर्न सकिन्छ। छुटेका मानहरू निर्णय रूख प्रयोग गरेर स्वचालित रूपमा ह्यान्डल गर्न सकिन्छ।
त्यहाँ एक-शट एन्कोडिङ, डमी चरहरू, वा अन्य डेटा पूर्व-उपचार चरणहरूको लागि कुनै आवश्यकता छैन। यो यस अर्थमा कठोर छ कि यसमा ताजा डाटा थप्न गाह्रो छ। यदि तपाईंले थप लेबल गरिएको डेटा पाउनुभयो भने, तपाईंले सम्पूर्ण डेटासेटमा रूखलाई पुन: तालिम दिनुपर्छ।
नतिजाको रूपमा, निर्णय रूखहरू गतिशील मोडेल परिवर्तन आवश्यक पर्ने कुनै पनि अनुप्रयोगको लागि खराब छनौट हो।
लक्ष्य चरको प्रकारको आधारमा, निर्णय रूखहरूलाई दुई प्रकारमा वर्गीकृत गरिएको छ:
- वर्गीय चर: एक निर्णय ट्री जसमा लक्ष्य चर वर्गीय छ।
- निरन्तर चर: एक निर्णय रूख जसमा लक्ष्य चर निरन्तर हुन्छ।
4. अनियमित वन
Random Forest Method अर्को मेसिन लर्निङ प्रविधि हो र यो वर्गीकरण र रिग्रेसन मुद्दाहरूमा व्यापक रूपमा प्रयोग गरिने पर्यवेक्षित मेसिन लर्निङ एल्गोरिदम हो। यो पनि रूख-आधारित विधि हो, निर्णय रूख जस्तै।
रूखहरूको वन, वा धेरै निर्णय रूखहरू, निर्णय गर्न अनियमित वन विधिद्वारा प्रयोग गरिन्छ। वर्गीकरण कार्यहरू ह्यान्डल गर्दा, अनियमित वन विधिले निरन्तर चरहरू समावेश गर्ने डेटासेटहरूसँग रिग्रेसन कार्यहरू ह्यान्डल गर्दा वर्गीकरण चरहरू प्रयोग गर्दछ।
एक समूह, वा धेरै मोडेलहरूको मिश्रण, यादृच्छिक वन विधिले के गर्छ, जसको मतलब भविष्यवाणीहरू केवल एउटाको सट्टा मोडेलहरूको समूह प्रयोग गरेर गरिन्छ।
दुबै वर्गीकरण र रिग्रेसन समस्याहरूको लागि प्रयोग गर्ने क्षमता, जसले आधुनिक मेसिन लर्निंग प्रणालीहरूको बहुमत बनाउँछ, अनियमित वनको मुख्य फाइदा हो।
दुई फरक रणनीतिहरू Ensemble द्वारा प्रयोग गरिन्छ:
- ब्यागिङ: यसो गर्दा, प्रशिक्षण डेटासेटको लागि थप डाटा उत्पादन गरिन्छ। पूर्वानुमानमा भिन्नता कम गर्न, यो गरिन्छ।
- बूस्टिङ भनेको क्रमिक मोडेलहरू निर्माण गरेर कमजोर सिकाउनेहरूलाई बलियो विद्यार्थीहरूसँग संयोजन गर्ने प्रक्रिया हो, जसको परिणामस्वरूप अधिकतम सटीकताका साथ अन्तिम मोडेल हुन्छ।
०४. भोली बेज
एक बाइनरी (दुई-कक्षा) र बहु-वर्ग वर्गीकरण मुद्दा Naive Bayes प्रविधि प्रयोग गरेर हल गर्न सकिन्छ। जब विधि बाइनरी वा श्रेणी इनपुट मानहरू प्रयोग गरी व्याख्या गरिन्छ, यो बुझ्न सजिलो छ। एक Naive Bayes वर्गीकरणकर्ता द्वारा बनाईएको एक धारणा हो कि एक वर्ग मा एक विशेषता को अस्तित्व को अन्य कुनै पनि विशेषताहरु को उपस्थिति मा कुनै असर छैन।
माथिको सूत्रले संकेत गर्छ:
- P(H): परिकल्पना H सही छ भन्ने सम्भावना। पूर्व सम्भाव्यतालाई यसलाई भनिन्छ।
- P(E): प्रमाणको सम्भावना
- P(E|H): सम्भाव्यता कि परिकल्पना प्रमाण द्वारा समर्थित छ।
- P(H|E): प्रमाण दिएर परिकल्पना सत्य हो भन्ने सम्भावना।
एक Naive Bayes वर्गीकरणकर्ताले यी विशेषताहरू एक-अर्कासँग जोडिएको भए तापनि एक निश्चित परिणामको सम्भावना निर्धारण गर्दा यी प्रत्येक विशेषताहरूलाई व्यक्तिगत रूपमा लिनेछ। ठूला डाटासेटहरूको लागि एक भोली बायेसियन मोडेल निर्माण गर्न सरल र प्रभावकारी छ।
यो आधारभूत हुँदा पनि सबैभन्दा जटिल वर्गीकरण प्रविधिहरू भन्दा राम्रो प्रदर्शन गर्न जानिन्छ। यो एल्गोरिदमहरूको संग्रह हो जुन सबै एकल विधिको सट्टा बेइज प्रमेयमा आधारित छन्।
6. K- निकटतम छिमेकीहरू
K-nearest छिमेकीहरू (kNN) प्रविधि पर्यवेक्षित मेसिन लर्निङको एक उपसमूह हो जुन वर्गीकरण र रिग्रेसन समस्याहरू सम्बोधन गर्न प्रयोग गर्न सकिन्छ। KNN एल्गोरिथ्मले तुलनात्मक वस्तुहरू नजिकै फेला पार्न सकिन्छ भन्ने अनुमान गर्छ।
म यसलाई समान विचारधाराका व्यक्तिहरूको भेलाको रूपमा सम्झन्छु। kNN ले निकटता, निकटता, वा दूरी प्रयोग गरी अन्य डेटा बिन्दुहरू बीचको समानताको विचारको फाइदा लिन्छ। नदेखेको डेटालाई निकटतम लेबल गरिएको अवलोकनयोग्य डेटा बिन्दुहरूमा आधारित लेबल गर्नको लागि, ग्राफमा बिन्दुहरू बीचको विभाजन निर्धारण गर्न गणितीय विधि प्रयोग गरिन्छ।
तपाईले डेटा बिन्दुहरू बीचको दूरी निर्धारण गर्न आवश्यक छ निकटतम तुलनात्मक स्पटहरू पहिचान गर्न। यसका लागि इक्लिडियन दूरी, ह्यामिङ दूरी, म्यानहट्टन दूरी, र मिन्कोव्स्की दूरी जस्ता दूरी मापनहरू प्रयोग गर्न सकिन्छ। K लाई निकटतम छिमेकी नम्बरको रूपमा चिनिन्छ, र यो प्राय: बिजोर संख्या हो।
KNN वर्गीकरण र प्रतिगमन समस्याहरूमा लागू गर्न सकिन्छ। KNN लाई रिग्रेसन समस्याहरूमा प्रयोग गर्दा गरिएको भविष्यवाणी K- सबैभन्दा समान घटनाहरूको माध्य वा मध्यमा आधारित हुन्छ।
KNN मा आधारित वर्गीकरण एल्गोरिदमको नतिजा K सबैभन्दा समान घटनाहरू बीच उच्चतम आवृत्ति भएको वर्गको रूपमा निर्धारण गर्न सकिन्छ। प्रत्येक उदाहरणले अनिवार्य रूपमा उनीहरूको वर्गको लागि भोट दिन्छ, र भविष्यवाणी सबैभन्दा बढी भोट प्राप्त गर्ने वर्गको हो।
7. K- मतलब
यो असुरक्षित शिक्षाको लागि एउटा प्रविधि हो जसले क्लस्टरिङ समस्याहरूलाई सम्बोधन गर्दछ। डाटा सेटहरू क्लस्टरहरूको निश्चित संख्यामा विभाजित हुन्छन्—यसलाई K भनिन्छ—यसरी प्रत्येक क्लस्टरका डाटा पोइन्टहरू समानतापूर्ण र अन्य क्लस्टरहरूमा भएकाहरूबाट भिन्न हुन्छन्।
K- मतलब क्लस्टरिङ पद्धति:
- प्रत्येक क्लस्टरको लागि, K- मतलब एल्गोरिदमले k सेन्ट्रोइडहरू, वा बिन्दुहरू चयन गर्दछ।
- निकटतम सेन्ट्रोइड वा K क्लस्टरहरूसँग, प्रत्येक डेटा बिन्दुले क्लस्टर बनाउँछ।
- अब, पहिले नै अवस्थित क्लस्टर सदस्यहरूको आधारमा नयाँ सेन्ट्रोइडहरू उत्पादन गरिन्छ।
- प्रत्येक डाटा पोइन्टको लागि सबैभन्दा नजिकको दूरी यी अद्यावधिक गरिएका सेन्ट्रोइडहरू प्रयोग गरेर गणना गरिन्छ। सेन्ट्रोइडहरू परिवर्तन नभएसम्म, यो प्रक्रिया दोहोर्याइएको छ।
यो छिटो, अधिक भरपर्दो, र बुझ्न सजिलो छ। यदि त्यहाँ समस्याहरू छन् भने, k-means 'अनुकूलताले समायोजन सरल बनाउँछ। जब डेटासेटहरू एक अर्काबाट अलग वा राम्रोसँग अलग हुन्छन्, परिणामहरू उत्कृष्ट हुन्छन्। यसले अनियमित डेटा वा आउटलियरहरू व्यवस्थापन गर्न सक्दैन।
8. समर्थन भेक्टर मेसिनहरू
डाटा वर्गीकरण गर्न SVM प्रविधि प्रयोग गर्दा, कच्चा डाटा n-आयामी ठाउँमा डटहरूको रूपमा देखाइन्छ (जहाँ n तपाईंसँग भएका सुविधाहरूको संख्या हो)। डाटालाई त्यसपछि सजिलै वर्गीकृत गर्न सकिन्छ किनभने प्रत्येक सुविधाको मान त्यसपछि एक विशेष समन्वयमा जडान हुन्छ।
डाटा अलग गर्न र ग्राफमा राख्न, वर्गीकरणकर्ता भनेर चिनिने लाइनहरू प्रयोग गर्नुहोस्। यो दृष्टिकोणले प्रत्येक डेटा बिन्दुलाई n-आयामी ठाउँमा बिन्दुको रूपमा प्लट गर्छ, जहाँ n तपाईंसँग भएका सुविधाहरूको संख्या हो र प्रत्येक सुविधाको मान एक विशिष्ट समन्वय मान हो।
हामी अब एक रेखा पत्ता लगाउनेछौं जसले डेटालाई डेटाको दुई सेटहरूमा विभाजन गर्दछ जुन फरक रूपमा वर्गीकृत गरिएको छ। प्रत्येक दुई समूहको निकटतम बिन्दुहरूबाट दूरी यस रेखाको साथमा सबैभन्दा टाढाको हुनेछ।
माथिको उदाहरणको रेखाबाट सबैभन्दा टाढा भएका दुईवटा नजिकका बिन्दुहरू हुनाले, फरक रूपमा वर्गीकृत गरिएका दुई समूहहरूमा डेटा विभाजन गर्ने रेखा मध्य रेखा हो। हाम्रो वर्गीकरणकर्ता यो रेखा हो।
9. आयाम घटाउने
आयाम घटाउने दृष्टिकोण प्रयोग गर्दै, प्रशिक्षण डेटामा कम इनपुट चर हुन सक्छ। सरल शब्दहरूमा, यसले तपाइँको सुविधा सेटको आकारलाई संकुचन गर्ने प्रक्रियालाई बुझाउँछ। कल्पना गरौं तपाईको डेटासेटमा १०० स्तम्भहरू छन्; आयाम कटौतीले त्यो रकमलाई २० स्तम्भहरूमा घटाउनेछ।
मोडेल स्वतः अधिक परिष्कृत बढ्छ र सुविधाहरूको संख्या बढ्दै जाँदा ओभरफिटिङ्को ठूलो जोखिम हुन्छ। ठूला आयामहरूमा डेटासँग काम गर्ने सबैभन्दा ठूलो समस्या भनेको "आयामिकताको अभिशाप" भनेर चिनिन्छ, जुन तब हुन्छ जब तपाइँको डेटामा विशेषताहरूको अत्यधिक संख्या हुन्छ।
निम्न तत्वहरू आयाम कमी पूरा गर्न प्रयोग गर्न सकिन्छ:
- उपयुक्त विशेषताहरू फेला पार्न र छनौट गर्न, सुविधा चयन नियोजित छ।
- पहिले नै अवस्थित सुविधाहरू प्रयोग गर्दै, सुविधा इन्जिनियरिङले म्यानुअल रूपमा नयाँ सुविधाहरू सिर्जना गर्दछ।
निष्कर्ष
असुरक्षित वा पर्यवेक्षित मेसिन लर्निङ दुवै सम्भव छ। यदि तपाइँको डाटा कम प्रचुर मात्रामा छ र प्रशिक्षणको लागि राम्रोसँग ट्याग गरिएको छ भने पर्यवेक्षित शिक्षा छनौट गर्नुहोस्।
ठूला डाटा सेटहरूले प्राय: प्रदर्शन गर्दछ र असुरक्षित शिक्षा प्रयोग गरेर राम्रो परिणामहरू उत्पादन गर्दछ। गहिरो शिक्षा विधिहरू उत्तम छन् यदि तपाईंसँग सजिलैसँग उपलब्ध हुने ठूलो डेटा सङ्कलन छ।
सुदृढीकरण शिक्षण र गहिरो सुदृढीकरण शिक्षा तपाईंले अध्ययन गर्नुभएको केही विषयहरू हुन्। तंत्रिका सञ्जालका विशेषताहरू, प्रयोगहरू, र अवरोधहरू अब तपाइँलाई स्पष्ट छन्। अन्तिम तर कम्तिमा होइन, तपाईंले विभिन्न प्रोग्रामिङ भाषाहरू, IDEs, र प्लेटफर्महरूका लागि विकल्पहरू विचार गर्नुभयो जब यो तपाईंको आफ्नै सिर्जना गर्ने कुरा आयो। मेशिन शिक्षा मोडेलहरु.
तपाईले गर्नु पर्ने अर्को कुरा भनेको प्रत्येक अध्ययन र प्रयोग गर्न सुरु गर्नु हो मेशिन सिकाइ दृष्टिकोण। विषय फराकिलो भए पनि कुनै पनि विषयको गहिराइमा ध्यान दिएमा केही घण्टामै बुझ्न सकिन्छ। प्रत्येक विषय अरूबाट एक्लै खडा छ।
तपाईंले एक पटकमा एउटा मुद्दाको बारेमा सोच्नुपर्छ, यसलाई अध्ययन गर्नुपर्छ, यसलाई व्यवहारमा राख्नु पर्छ, र यसमा एल्गोरिदम(हरू) लागू गर्न आफ्नो रोजाइको भाषा प्रयोग गर्नुपर्छ।
जवाफ छाड्नुस्