सालों से टेक में डीप लर्निंग सुर्खियां बटोर रही है। और, यह समझना आसान है कि क्यों।
आर्टिफिशियल इंटेलिजेंस की यह शाखा स्वास्थ्य सेवा से लेकर बैंकिंग से लेकर परिवहन तक के क्षेत्रों को बदल रही है, जिससे पहले अकल्पनीय प्रगति हो रही है।
डीप लर्निंग परिष्कृत एल्गोरिदम के एक सेट पर बनाया गया है जो भारी मात्रा में डेटा से जटिल पैटर्न को निकालना और भविष्यवाणी करना सीखता है।
हम इस पोस्ट में सबसे अच्छे 15 डीप लर्निंग एल्गोरिदम देखेंगे, कन्वर्सेशनल न्यूरल नेटवर्क्स से लेकर जनरेटिव एडवरसैरियल नेटवर्क्स से लेकर लॉन्ग शॉर्ट-टर्म मेमोरी नेटवर्क्स तक।
यह पोस्ट आवश्यक अंतर्दृष्टि प्रदान करेगी कि क्या आप एक हैं शुरुआती या गहरी शिक्षा में विशेषज्ञ.
1. ट्रांसफार्मर नेटवर्क
ट्रांसफॉर्मर नेटवर्क बदल गए हैं कंप्यूटर दृष्टि और प्राकृतिक भाषा प्रसंस्करण (एनएलपी) अनुप्रयोग। वे आने वाले डेटा का विश्लेषण करते हैं और लंबी दूरी के रिश्तों को पकड़ने के लिए ध्यान देने वाली प्रक्रियाओं को नियोजित करते हैं। यह उन्हें पारंपरिक सीक्वेंस-टू-सीक्वेंस मॉडल की तुलना में तेज बनाता है।
ट्रांसफॉर्मर नेटवर्क को पहली बार वासवानी एट अल द्वारा "अटेंशन इज़ ऑल यू नीड" प्रकाशन में वर्णित किया गया था।
इनमें एक एनकोडर और एक डिकोडर (2017) शामिल हैं। ट्रांसफॉर्मर मॉडल ने विभिन्न एनएलपी अनुप्रयोगों में प्रदर्शन का प्रदर्शन किया है, जिनमें शामिल हैं भावना विश्लेषण, पाठ वर्गीकरण और मशीनी अनुवाद।
अनुप्रयोगों के लिए कंप्यूटर दृष्टि में ट्रांसफार्मर-आधारित मॉडल का भी उपयोग किया जा सकता है। वे ऑब्जेक्ट रिकग्निशन और इमेज कैप्शनिंग कर सकते हैं।
2. लॉन्ग शॉर्ट-टर्म मेमोरी नेटवर्क (LSTMs)
लॉन्ग शॉर्ट-टर्म मेमोरी नेटवर्क्स (LSTMs) एक रूप हैं तंत्रिका नेटवर्क विशेष रूप से अनुक्रमिक इनपुट को संभालने के लिए बनाया गया है। उन्हें "दीर्घकालिक" कहा जाता है क्योंकि वे अनावश्यक जानकारी को भूलते हुए भी लंबे समय से ज्ञान को याद कर सकते हैं।
LSTM कुछ "गेट्स" के माध्यम से संचालित होते हैं जो नेटवर्क के अंदर सूचना के प्रवाह को नियंत्रित करते हैं। सूचना को महत्वपूर्ण माना जाता है या नहीं, इसके आधार पर, ये द्वार या तो इसे अंदर जाने दे सकते हैं या इसे रोक सकते हैं।
यह तकनीक LSTM को पिछले समय के चरणों से जानकारी को वापस बुलाने या भूलने में सक्षम बनाती है, जो वाक् पहचान, प्राकृतिक भाषा प्रसंस्करण और समय श्रृंखला भविष्यवाणी जैसे कार्यों के लिए महत्वपूर्ण है।
LSTM किसी भी मामले में बेहद फायदेमंद होते हैं जहां आपके पास अनुक्रमिक डेटा होता है जिसका मूल्यांकन या पूर्वानुमान किया जाना है। वे अक्सर बोले गए शब्दों को टेक्स्ट में बदलने के लिए या इन में वॉइस रिकग्निशन सॉफ़्टवेयर में उपयोग किए जाते हैं स्टॉक बाजार पिछले डेटा के आधार पर भविष्य की कीमतों का पूर्वानुमान लगाने के लिए विश्लेषण।
3. स्वयं आयोजन मानचित्र (एसओएम)
एसओएम एक तरह के कृत्रिम होते हैं तंत्रिका नेटवर्क जो सीख सकता है और निम्न-आयामी वातावरण में जटिल डेटा का प्रतिनिधित्व करते हैं। विधि उच्च-आयामी इनपुट डेटा को दो-आयामी ग्रिड में परिवर्तित करके संचालित होती है, जिसमें प्रत्येक इकाई या न्यूरॉन इनपुट स्पेस के एक अलग हिस्से का प्रतिनिधित्व करता है।
न्यूरॉन्स एक साथ जुड़े हुए हैं और एक सामयिक संरचना बनाते हैं, जिससे उन्हें इनपुट डेटा को सीखने और समायोजित करने की अनुमति मिलती है। तो, एसओएम अप्रशिक्षित शिक्षा पर आधारित है।
एल्गोरिथ्म की जरूरत नहीं है लेबल किए गए डेटा से सीखना। इसके बजाय, यह चर के बीच पैटर्न और सहसंबंध खोजने के लिए इनपुट डेटा की सांख्यिकीय विशेषताओं का उपयोग करता है।
प्रशिक्षण चरण के दौरान, न्यूरॉन्स इनपुट डेटा का सबसे अच्छा संकेत होने के लिए प्रतिस्पर्धा करते हैं। और, वे स्वयं को एक सार्थक संरचना में व्यवस्थित करते हैं। SOMs में अनुप्रयोगों की एक विस्तृत श्रृंखला होती है, जिसमें छवि और वाक् पहचान, डेटा माइनिंग और पैटर्न पहचान शामिल हैं।
वे के लिए उपयोगी हैं जटिल डेटा की कल्पना करना, क्लस्टरिंग संबंधित डेटा बिंदु, और असामान्यताओं या आउटलेयर का पता लगाना।
4. गहरा सुदृढीकरण सीखना
गहरा सुदृढीकरण सीखना एक प्रकार की मशीन लर्निंग है जिसमें एक एजेंट को पुरस्कार प्रणाली के आधार पर निर्णय लेने के लिए प्रशिक्षित किया जाता है। यह एजेंट को अपने परिवेश से बातचीत करने और परीक्षण और त्रुटि के माध्यम से सीखने के द्वारा कार्य करता है।
एजेंट को उसके द्वारा की जाने वाली हर क्रिया के लिए पुरस्कृत किया जाता है, और इसका उद्देश्य यह सीखना है कि समय के साथ इसके लाभों को कैसे अनुकूलित किया जाए। इसका उपयोग एजेंटों को गेम खेलना, ऑटोमोबाइल चलाना और यहां तक कि रोबोट का प्रबंधन करना सिखाने के लिए किया जा सकता है।
क्यू-लर्निंग एक प्रसिद्ध डीप रीनफोर्समेंट लर्निंग पद्धति है। यह किसी विशेष राज्य में एक निश्चित कार्रवाई करने के मूल्य का आकलन करके और उस अनुमान को अद्यतन करने के द्वारा संचालित होता है क्योंकि एजेंट पर्यावरण के साथ बातचीत करता है।
एजेंट तब इन अनुमानों का उपयोग यह निर्धारित करने के लिए करता है कि किस कार्रवाई के परिणामस्वरूप सबसे बड़ा इनाम मिलने की संभावना है। क्यू-लर्निंग का उपयोग एजेंटों को अटारी गेम खेलने के लिए शिक्षित करने के साथ-साथ डेटा केंद्रों में ऊर्जा के उपयोग को बेहतर बनाने के लिए किया गया है।
डीप क्यू-नेटवर्क्स एक अन्य प्रसिद्ध डीप रीनफोर्समेंट लर्निंग मेथड (डीक्यूएन) है। डीक्यूएन क्यू-लर्निंग के समान हैं जिसमें वे तालिका के बजाय गहरे तंत्रिका नेटवर्क का उपयोग करके क्रिया मूल्यों का अनुमान लगाते हैं।
यह उन्हें कई वैकल्पिक क्रियाओं के साथ विशाल, जटिल सेटिंग्स से निपटने में सक्षम बनाता है। डीक्यूएन का उपयोग एजेंटों को गो और डोटा 2 जैसे गेम खेलने के लिए प्रशिक्षित करने के साथ-साथ रोबोट बनाने के लिए किया गया है जो चलना सीख सकते हैं।
5. आवर्तक तंत्रिका नेटवर्क (आरएनएन)
RNN एक प्रकार का तंत्रिका नेटवर्क है जो आंतरिक स्थिति को बनाए रखते हुए अनुक्रमिक डेटा को संसाधित कर सकता है। इसे एक किताब पढ़ने वाले व्यक्ति के समान समझें, जहां प्रत्येक शब्द उसके पहले आने वाले के संबंध में पच जाता है।
RNN इसलिए भाषण मान्यता, भाषा अनुवाद और यहां तक कि एक वाक्यांश में अगले शब्द की भविष्यवाणी करने जैसे कार्यों के लिए आदर्श हैं।
आरएनएन फीडबैक लूप का उपयोग करके हर बार कदम के आउटपुट को अगली बार कदम के इनपुट से जोड़ने के लिए काम करते हैं। यह नेटवर्क को भविष्य के समय चरणों के लिए अपनी भविष्यवाणियों को सूचित करने के लिए पूर्व समय चरण की जानकारी का उपयोग करने में सक्षम बनाता है। दुर्भाग्य से, इसका मतलब यह भी है कि RNN लुप्त हो रहे ढाल के मुद्दे के प्रति संवेदनशील हैं, जिसमें प्रशिक्षण के लिए उपयोग किए जाने वाले ग्रेडिएंट बहुत छोटे हो जाते हैं और नेटवर्क दीर्घकालिक संबंधों को सीखने के लिए संघर्ष करता है।
इस स्पष्ट बाधा के बावजूद, आरएनएन ने अनुप्रयोगों की एक विस्तृत श्रृंखला में उपयोग पाया है। इन अनुप्रयोगों में प्राकृतिक भाषा प्रसंस्करण, वाक् पहचान और यहां तक कि संगीत उत्पादन भी शामिल है।
Google अनुवाद, उदाहरण के लिए, विभिन्न भाषाओं में अनुवाद करने के लिए RNN-आधारित प्रणाली का उपयोग करता है, जबकि सिरी, आभासी सहायक, आवाज़ का पता लगाने के लिए RNN-आधारित प्रणाली का उपयोग करता है। आरएनएन का उपयोग स्टॉक की कीमतों की भविष्यवाणी करने और यथार्थवादी टेक्स्ट और ग्राफिक्स बनाने के लिए भी किया जाता है।
6. कैप्सूल नेटवर्क
कैप्सूल नेटवर्क एक नए प्रकार का तंत्रिका नेटवर्क डिज़ाइन है जो डेटा में पैटर्न और सहसंबंधों की अधिक प्रभावी ढंग से पहचान कर सकता है। वे न्यूरॉन्स को "कैप्सूल" में व्यवस्थित करते हैं जो इनपुट के कुछ पहलुओं को एन्कोड करते हैं।
इस तरह वे अधिक सटीक भविष्यवाणियां कर सकते हैं। कैप्सूल नेटवर्क कैप्सूल की कई परतों को नियोजित करके इनपुट डेटा से उत्तरोत्तर जटिल गुण निकालते हैं।
कैप्सूल नेटवर्क्स की तकनीक उन्हें दिए गए इनपुट के पदानुक्रमित प्रतिनिधित्व को सीखने में सक्षम बनाती है। वे कैप्सूल के बीच संचार करके तस्वीर के अंदर वस्तुओं के बीच स्थानिक कनेक्शन को सही ढंग से एन्कोड कर सकते हैं।
ऑब्जेक्ट आइडेंटिफिकेशन, पिक्चर सेगमेंटेशन और नेचुरल लैंग्वेज प्रोसेसिंग कैप्सूल नेटवर्क के सभी एप्लिकेशन हैं।
कैप्सूल नेटवर्क में नियोजित किए जाने की क्षमता है स्वायत्त ड्राइविंग प्रौद्योगिकियों। वे ऑटोमोबाइल, लोगों और यातायात संकेतों जैसी वस्तुओं को पहचानने और अलग करने में सिस्टम की सहायता करते हैं। ये प्रणालियाँ अपने वातावरण में वस्तुओं के व्यवहार के बारे में अधिक सटीक भविष्यवाणी करके टकराव से बच सकती हैं।
7. परिवर्तनशील ऑटोएन्कोडर (वीएई)
वीएई गहन शिक्षण उपकरण का एक रूप है जिसका उपयोग अप्रशिक्षित शिक्षण के लिए किया जाता है। डेटा को निम्न-आयामी स्थान में एन्कोड करके और फिर इसे मूल स्वरूप में वापस डिकोड करके, वे डेटा में पैटर्न को पहचानना सीख सकते हैं।
वे एक जादूगर की तरह हैं जो एक खरगोश को एक टोपी में बदल सकते हैं और फिर एक बन्नी में बदल सकते हैं! यथार्थवादी दृश्य या संगीत उत्पन्न करने के लिए वीएई फायदेमंद होते हैं। और, उनका उपयोग नए डेटा का उत्पादन करने के लिए किया जा सकता है जो मूल डेटा के तुलनीय है।
वीएई गुप्त कोडब्रेकर के समान हैं। वे अंतर्निहित खोज सकते हैं डेटा की संरचना इसे सरल टुकड़ों में तोड़कर, ठीक वैसे ही जैसे किसी पहेली को कैसे तोड़ा जाता है। वे उस जानकारी का उपयोग नए डेटा के निर्माण के लिए कर सकते हैं जो भागों को छांटने के बाद मूल जैसा दिखता है।
यह भारी फ़ाइलों को संपीड़ित करने या एक निश्चित शैली में ताज़ा ग्राफिक्स या संगीत बनाने के लिए आसान हो सकता है। वीएई ताजा सामग्री भी तैयार कर सकते हैं, जैसे कि समाचार कहानियां या संगीत गीत।
8. जनरेटिव एडवरसैरियल नेटवर्क (GANs)
जीएएन (जनरेटिव एडवरसैरियल नेटवर्क) एक गहन शिक्षण प्रणाली का एक रूप है जो मूल के समान नया डेटा उत्पन्न करता है। वे दो नेटवर्कों को प्रशिक्षित करके संचालित होते हैं: एक जनरेटर और एक विवेचक नेटवर्क।
जनरेटर नए डेटा का उत्पादन करता है जो मूल के बराबर होता है।
और, विवेचक मूल और निर्मित डेटा के बीच अंतर करने का प्रयास करता है। दो नेटवर्कों को अग्रानुक्रम में प्रशिक्षित किया जाता है, जिसमें जनरेटर विवेचक को धोखा देने का प्रयास करता है और विवेचक मूल डेटा को ठीक से पहचानने का प्रयास करता है।
जीएएन को एक जालसाज और एक जासूस के बीच एक क्रॉस के रूप में देखें। जनरेटर एक जालसाज के समान कार्य करता है, जो मूल के समान नई कलाकृति का निर्माण करता है।
विवेचक एक जासूस के रूप में कार्य करता है, जो वास्तविक कलाकृति और जालसाजी के बीच अंतर करने का प्रयास करता है। दो नेटवर्कों को मिलकर प्रशिक्षित किया जाता है, जनरेटर के साथ प्रशंसनीय नकली बनाने में सुधार होता है और विवेचक उन्हें पहचानने में सुधार करता है।
GANs के कई उपयोग हैं, जिनमें मनुष्यों या जानवरों की यथार्थवादी तस्वीरें बनाने से लेकर नया संगीत या लेखन बनाने तक शामिल हैं। उनका उपयोग डेटा वृद्धि के लिए भी किया जा सकता है, जिसमें प्रशिक्षण मशीन लर्निंग मॉडल के लिए एक बड़ा डेटासेट बनाने के लिए वास्तविक डेटा के साथ उत्पादित डेटा का संयोजन शामिल है।
9. डीप क्यू-नेटवर्क्स (DQNs)
डीप क्यू-नेटवर्क्स (DQNs) एक प्रकार का निर्णय लेने वाला रीइन्फोर्समेंट लर्निंग एल्गोरिथम है। वे एक क्यू-फ़ंक्शन सीखकर काम करते हैं जो किसी विशेष स्थिति में एक निश्चित कार्रवाई करने के लिए अपेक्षित इनाम की भविष्यवाणी करता है।
क्यू-फ़ंक्शन परीक्षण और त्रुटि द्वारा सिखाया जाता है, एल्गोरिदम विभिन्न क्रियाओं का प्रयास करता है और परिणामों से सीखता है।
इसे ए की तरह समझें वीडियो खेल चरित्र विभिन्न कार्यों के साथ प्रयोग कर रहा है और खोज कर रहा है कि कौन सी सफलता की ओर ले जाती है! डीक्यूएन एक गहरे तंत्रिका नेटवर्क का उपयोग करके क्यू-फ़ंक्शन को प्रशिक्षित करते हैं, जिससे उन्हें कठिन निर्णय लेने वाले कार्यों के लिए प्रभावी टूल बना दिया जाता है।
उन्होंने गो और शतरंज जैसे खेलों के साथ-साथ रोबोटिक्स और सेल्फ-ड्राइविंग ऑटोमोबाइल में भी मानव चैंपियन को हराया है। इसलिए, कुल मिलाकर, DQN समय के साथ अपने निर्णय लेने के कौशल को बढ़ाने के लिए अनुभव से सीखकर काम करते हैं।
10. रेडियल बेसिस फंक्शन नेटवर्क (आरबीएफएन)
रेडियल बेसिस फ़ंक्शन नेटवर्क (RBFNs) एक प्रकार का न्यूरल नेटवर्क है जिसका उपयोग अनुमानित कार्यों और वर्गीकरण कार्यों को करने के लिए किया जाता है। वे रेडियल आधार कार्यों के संग्रह का उपयोग करके इनपुट डेटा को उच्च-आयामी स्थान में परिवर्तित करके संचालित करते हैं।
नेटवर्क का आउटपुट आधार कार्यों का एक रैखिक संयोजन है, और प्रत्येक रेडियल आधार फ़ंक्शन इनपुट स्पेस में एक केंद्र बिंदु का प्रतिनिधित्व करता है।
आरबीएफएन विशेष रूप से जटिल इनपुट-आउटपुट इंटरैक्शन वाली स्थितियों के लिए प्रभावी होते हैं, और उन्हें पर्यवेक्षित और अनुपयोगी शिक्षा सहित तकनीकों की एक विस्तृत श्रृंखला का उपयोग करके सिखाया जा सकता है। उनका उपयोग वित्तीय भविष्यवाणियों से लेकर चित्र और भाषण मान्यता से लेकर चिकित्सा निदान तक किसी भी चीज़ के लिए किया गया है।
RBFNs को एक GPS सिस्टम के रूप में मानें जो चुनौतीपूर्ण इलाके में अपना रास्ता खोजने के लिए एंकर पॉइंट्स की एक श्रृंखला का उपयोग करता है। नेटवर्क का आउटपुट एंकर पॉइंट्स का एक संयोजन है, जो रेडियल आधार कार्यों के लिए खड़ा होता है।
हम जटिल जानकारी के माध्यम से ब्राउज़ कर सकते हैं और सटीक भविष्यवाणी कर सकते हैं कि आरबीएफएन को नियोजित करके एक परिदृश्य कैसे बदलेगा।
11. मल्टीलेयर परसेप्ट्रॉन (एमएलपी)
मल्टीलेयर परसेप्ट्रॉन (MLP) नामक तंत्रिका नेटवर्क का एक विशिष्ट रूप वर्गीकरण और प्रतिगमन जैसे पर्यवेक्षित शिक्षण कार्यों के लिए उपयोग किया जाता है। वे लिंक किए गए नोड्स, या न्यूरॉन्स की कई परतों को स्टैक करके संचालित करते हैं, प्रत्येक परत के साथ आने वाले डेटा को गैर-रैखिक रूप से बदलते हैं।
एमएलपी में, प्रत्येक न्यूरॉन नीचे की परत में न्यूरॉन्स से इनपुट प्राप्त करता है और ऊपर की परत में न्यूरॉन्स को संकेत भेजता है। प्रत्येक न्यूरॉन का आउटपुट एक सक्रियण फ़ंक्शन का उपयोग करके निर्धारित किया जाता है, जो नेटवर्क को अरैखिकता देता है।
वे इनपुट डेटा के परिष्कृत निरूपण को सीखने में सक्षम हैं क्योंकि उनमें कई छिपी हुई परतें हो सकती हैं।
एमएलपी को विभिन्न प्रकार के कार्यों पर लागू किया गया है, जैसे भावना विश्लेषण, धोखाधड़ी का पता लगाना और आवाज और चित्र पहचान। एमएलपी की तुलना एक कठिन मामले को हल करने के लिए एक साथ काम करने वाले जांचकर्ताओं के समूह से की जा सकती है।
एक साथ, वे तथ्यों को एक साथ जोड़ सकते हैं और इस तथ्य के बावजूद अपराध को हल कर सकते हैं कि प्रत्येक के पास विशेषता का एक विशेष क्षेत्र है।
12. संवेदी तंत्रिका नेटवर्क (सीएनएन)
छवियों और वीडियो को दृढ़ तंत्रिका नेटवर्क (सीएनएन), तंत्रिका नेटवर्क का एक रूप का उपयोग करके संसाधित किया जाता है। वे इनपुट डेटा से महत्वपूर्ण विशेषताओं को निकालने के लिए सीखने योग्य फिल्टर या गुठली के एक सेट को नियोजित करके कार्य करते हैं।
फिल्टर इनपुट पिक्चर पर ग्लाइड करते हैं, एक फीचर मैप बनाने के लिए कनवल्शन को अंजाम देते हैं जो इमेज के आवश्यक पहलुओं को कैप्चर करता है।
जैसा कि सीएनएन चित्र विशेषताओं के पदानुक्रमित प्रतिनिधित्व को सीखने में सक्षम हैं, वे दृश्य डेटा की भारी मात्रा वाली स्थितियों के लिए विशेष रूप से सहायक होते हैं। कई अनुप्रयोगों ने उनका उपयोग किया है, जैसे ऑब्जेक्ट डिटेक्शन, पिक्चर वर्गीकरण और फेस डिटेक्शन।
सीएनएन को एक ऐसे चित्रकार के रूप में देखें जो उत्कृष्ट कृति बनाने के लिए कई ब्रशों का उपयोग करता है। प्रत्येक ब्रश एक कर्नेल है, और कलाकार कई गुठली मिलाकर एक जटिल, यथार्थवादी छवि बना सकता है। हम तस्वीरों से महत्वपूर्ण विशेषताओं को निकाल सकते हैं और सीएनएन का उपयोग करके छवि की सामग्री का सटीक अनुमान लगाने के लिए उनका उपयोग कर सकते हैं।
13. गहरा विश्वास नेटवर्क (डीबीएन)
DBN तंत्रिका नेटवर्क का एक रूप है जिसका उपयोग अनपर्यवेक्षित शिक्षण कार्यों जैसे कि आयामीता में कमी और फीचर लर्निंग के लिए किया जाता है। वे प्रतिबंधित बोल्ट्ज़मैन मशीनों (आरबीएम) की कई परतों को ढेर करके कार्य करते हैं, जो इनपुट डेटा को पुनर्गठित करने के लिए सीखने में सक्षम दो-परत तंत्रिका नेटवर्क हैं।
डीबीएन उच्च-आयामी डेटा मुद्दों के लिए बहुत फायदेमंद होते हैं क्योंकि वे इनपुट का एक कॉम्पैक्ट और कुशल प्रतिनिधित्व सीख सकते हैं। उनका उपयोग आवाज की पहचान से लेकर चित्र वर्गीकरण से लेकर दवा की खोज तक किसी भी चीज के लिए किया गया है।
उदाहरण के लिए, शोधकर्ताओं ने एस्ट्रोजेन रिसेप्टर को दवा उम्मीदवारों के बाध्यकारी संबंध का अनुमान लगाने के लिए डीबीएन नियोजित किया। डीबीएन को रासायनिक विशेषताओं और बाध्यकारी समानता के संग्रह पर प्रशिक्षित किया गया था, और यह उपन्यास दवा उम्मीदवारों के बाध्यकारी संबंधों की सटीक भविष्यवाणी करने में सक्षम था।
यह दवा विकास और अन्य उच्च-आयामी डेटा अनुप्रयोगों में DBNs के उपयोग पर प्रकाश डालता है।
14. ऑटोएन्कोडर
Autoencoders तंत्रिका नेटवर्क हैं जिनका उपयोग अप्रशिक्षित शिक्षण कार्यों के लिए किया जाता है। उनका उद्देश्य इनपुट डेटा का पुनर्निर्माण करना है, जिसका अर्थ है कि वे जानकारी को एक कॉम्पैक्ट प्रतिनिधित्व में एन्कोड करना सीखेंगे और फिर इसे मूल इनपुट में वापस डिकोड करेंगे।
डेटा संपीड़न, शोर हटाने और विसंगति का पता लगाने के लिए ऑटोएन्कोडर बहुत प्रभावी हैं। उनका उपयोग फ़ीचर लर्निंग के लिए भी किया जा सकता है, जहाँ ऑटोएन्कोडर के कॉम्पैक्ट प्रतिनिधित्व को पर्यवेक्षित शिक्षण कार्य में फीड किया जाता है।
कक्षा में नोट्स लेने वाले छात्र होने के लिए ऑटोएन्कोडर पर विचार करें। छात्र व्याख्यान को सुनता है और सबसे प्रासंगिक बिंदुओं को संक्षिप्त और कुशल तरीके से लिखता है।
बाद में, छात्र अपने नोट्स का उपयोग करके पाठ को पढ़ और याद कर सकते हैं। दूसरी ओर, एक ऑटोएन्कोडर, इनपुट डेटा को एक कॉम्पैक्ट प्रतिनिधित्व में एन्कोड करता है जिसे बाद में विसंगति का पता लगाने या डेटा संपीड़न जैसे विभिन्न उद्देश्यों के लिए नियोजित किया जा सकता है।
15. प्रतिबंधित बोल्ट्जमान मशीनें (आरबीएम)
RBMs (प्रतिबंधित बोल्ट्जमैन मशीनें) एक प्रकार का जनरेटिव न्यूरल नेटवर्क है, जिसका उपयोग अनपेक्षित शिक्षण कार्यों के लिए किया जाता है। वे एक दृश्यमान परत और एक छिपी हुई परत से बने होते हैं, प्रत्येक परत में न्यूरॉन्स जुड़े होते हैं, लेकिन एक ही परत के भीतर नहीं।
आरबीएम को कंट्रास्टिव डायवर्जेंस नामक तकनीक का उपयोग करके प्रशिक्षित किया जाता है, जिसमें प्रशिक्षण डेटा की संभावना को अनुकूलित करने के लिए दृश्य और छिपी परतों के बीच भार को बदलना शामिल है। सीखे गए वितरण से नमूना लेकर प्रशिक्षित होने के बाद आरबीएम ताज़ा डेटा बना सकते हैं।
छवि और भाषण पहचान, सहयोगी फ़िल्टरिंग, और विसंगति का पता लगाने वाले सभी अनुप्रयोग हैं जो आरबीएम को नियोजित करते हैं। उपयोगकर्ता के व्यवहार से सीखने के पैटर्न के अनुरूप सिफारिशें बनाने के लिए उन्हें अनुशंसा प्रणालियों में भी उपयोग किया गया है।
उच्च-आयामी डेटा का एक कॉम्पैक्ट और कुशल प्रतिनिधित्व बनाने के लिए फीचर लर्निंग में आरबीएम का भी उपयोग किया गया है।
समापन और क्षितिज पर आशाजनक विकास
डीप लर्निंग मेथड्स, जैसे कन्वर्सेशनल न्यूरल नेटवर्क्स (CNNs) और रिकरंट न्यूरल नेटवर्क्स (RNNs), सबसे उन्नत आर्टिफिशियल इंटेलिजेंस दृष्टिकोणों में से हैं। सीएनएन ने तस्वीर और ऑडियो पहचान को बदल दिया है, जबकि आरएनएन ने प्राकृतिक भाषा प्रसंस्करण और अनुक्रमिक डेटा विश्लेषण में महत्वपूर्ण रूप से उन्नत किया है।
इन दृष्टिकोणों के विकास में अगला कदम उनकी दक्षता और मापनीयता में सुधार पर ध्यान केंद्रित करने की संभावना है, जिससे उन्हें बड़े और अधिक जटिल डेटासेट का विश्लेषण करने की अनुमति मिलती है, साथ ही उनकी व्याख्यात्मकता और कम लेबल वाले डेटा से सीखने की क्षमता में वृद्धि होती है।
डीप लर्निंग में स्वास्थ्य देखभाल, वित्त और स्वायत्त प्रणालियों जैसे क्षेत्रों में प्रगति की अनुमति देने की संभावना है क्योंकि यह आगे बढ़ता है।
एक जवाब लिखें