विषय - सूची[छिपाना][प्रदर्शन]
गहन शिक्षण में सबसे सरल लेकिन सबसे पेचीदा विचारों में से एक वस्तु का पता लगाना है। मूल विचार प्रत्येक वस्तु को क्रमिक वर्गों में विभाजित करना है जो तुलनीय लक्षणों का प्रतिनिधित्व करते हैं और फिर उसके चारों ओर एक बॉक्स बनाते हैं।
ये विशिष्ट विशेषताएं रूप या रंग जितनी सरल हो सकती हैं, जो उन्हें वर्गीकृत करने की हमारी क्षमता में सहायता करती हैं।
के आवेदन ऑब्जेक्ट डिटेक्शन कंप्यूटर विजन और इमेज प्रोसेसिंग में पर्याप्त सुधार के कारण चिकित्सा विज्ञान, स्वायत्त ड्राइविंग, रक्षा और सैन्य, सार्वजनिक प्रशासन और कई अन्य क्षेत्रों में व्यापक रूप से कार्यरत हैं।
यहां हमारे पास एमएमडिटेक्शन है, जो पाइटोरच पर बनाया गया एक शानदार ओपन-सोर्स ऑब्जेक्ट डिटेक्शन टूलसेट है। इस लेख में, हम MMDetection की विस्तार से जाँच करेंगे, इसके साथ व्यवहार करेंगे, इसकी विशेषताओं पर चर्चा करेंगे, और भी बहुत कुछ।
एचएमबी क्या है? एमएमडिटेक्शन?
RSI एमएमडिटेक्शन टूलबॉक्स को विशेष रूप से ऑब्जेक्ट आइडेंटिफिकेशन और इंस्टेंस सेगमेंटेशन से जुड़ी समस्याओं के लिए पायथन कोडबेस के रूप में बनाया गया था।
PyTorch कार्यान्वयन का उपयोग किया जाता है, और इसे मॉड्यूलर तरीके से बनाया जाता है। ऑब्जेक्ट रिकग्निशन और इंस्टेंस सेगमेंटेशन के लिए, प्रभावी मॉडलों की एक विस्तृत श्रृंखला को विभिन्न तरीकों में संकलित किया गया है।
यह प्रभावी अनुमान और तेजी से प्रशिक्षण की अनुमति देता है। दूसरी ओर, टूलबॉक्स में 200 से अधिक पूर्व-प्रशिक्षित नेटवर्क के लिए भार शामिल हैं, जिससे यह वस्तु पहचान क्षेत्र में त्वरित सुधार करता है।
वर्तमान तकनीकों को अनुकूलित करने या उपलब्ध मॉड्यूल का उपयोग करके एक नया डिटेक्टर बनाने की क्षमता के साथ, MMDetection एक बेंचमार्क के रूप में कार्य करता है।
टूलबॉक्स की मुख्य विशेषता सामान्य से सीधे, मॉड्यूलर भागों का समावेश है वस्तु का पता लगाना ढांचा जिसका उपयोग अद्वितीय पाइपलाइन या अद्वितीय मॉडल बनाने के लिए किया जा सकता है।
इस टूलकिट की बेंचमार्किंग क्षमताएं मौजूदा ढांचे के शीर्ष पर एक नया डिटेक्टर ढांचा बनाना और इसके प्रदर्शन की तुलना करना आसान बनाती हैं।
विशेषताएं
- लोकप्रिय और आधुनिक डिटेक्शन फ्रेमवर्क, जैसे कि फास्टर आरसीएनएन, मास्क आरसीएनएन, रेटिनानेट, आदि सीधे टूलकिट द्वारा समर्थित हैं।
- फ़ाइन-ट्यूनिंग (या नए सिरे से प्रशिक्षण) के लिए 360+ पूर्व-प्रशिक्षित मॉडल का उपयोग।
- COCO, Cityscapes, LVIS, और PASCAL VOC सहित प्रसिद्ध विज़न डेटासेट के लिए।
- GPU पर, सभी मूलभूत बॉक्स और मास्क संचालन निष्पादित किए जाते हैं। अन्य कोडबेस, जैसे डिटेक्ट्रॉन 2, मास्कआरसीएनएन-बेंचमार्क, और सिंपलडेट, को इससे तेज गति से या इसके समकक्ष प्रशिक्षित किया जा सकता है।
- शोधकर्ताओं ने तोड़ दिया वस्तु का पता लगाना ढांचे को कई मॉड्यूल में विभाजित करता है, जिसे बाद में एक अद्वितीय ऑब्जेक्ट डिटेक्शन सिस्टम बनाने के लिए जोड़ा जा सकता है।
MMडिटेक्शन आर्किटेक्चर
MMDetection एक सामान्य डिज़ाइन निर्दिष्ट करता है जिसे किसी भी मॉडल पर लागू किया जा सकता है क्योंकि यह विभिन्न प्रकार के पूर्व-निर्मित मॉडल वाला टूलबॉक्स है, जिनमें से प्रत्येक का अपना आर्किटेक्चर है। निम्नलिखित घटक इस समग्र वास्तुकला को बनाते हैं:
- आधार: बैकबोन, जैसे कि ResNet-50 अंतिम पूरी तरह से कनेक्टेड परत के बिना, वह घटक है जो एक छवि को फीचर मैप में परिवर्तित करता है।
- गरदन: गर्दन वह खंड है जो रीढ़ की हड्डी को सिर से जोड़ता है। बैकबोन के कच्चे फीचर मैप्स पर, यह कुछ समायोजन या पुन: विन्यास करता है। फ़ीचर पिरामिड नेटवर्क एक उदाहरण (FPN) है।
- घना सिर (एंकरहेड/एंकरफ्रीहेड): यह वह घटक है जो फीचर मैप्स के घने क्षेत्रों पर संचालित होता है, जैसे एंकरहेड और एंकरफ्रीहेड, जैसे आरपीएनहेड, रेटिनाहेड और एफसीओएसहेड।
- आरओआईएक्सट्रैक्टर: RoIPooling- जैसे ऑपरेटरों के उपयोग के साथ, यह वह खंड है जो RoIwise सुविधाओं को एकल या फीचर मैप के संग्रह से खींचता है। सिंगलआरओआईएक्सट्रैक्टर नमूना फीचर पिरामिड के मिलान स्तर से आरओआई सुविधाओं को निकालता है।
- आरओआईहेड (BBoxHead/MaskHead): यह सिस्टम का वह हिस्सा है जो इनपुट के रूप में RoI विशेषताओं का उपयोग करता है और RoI-आधारित कार्य-विशिष्ट भविष्यवाणियां उत्पन्न करता है, जैसे बाउंडिंग बॉक्स वर्गीकरण/प्रतिगमन और मुखौटा भविष्यवाणी।
एकल-चरण और दो-चरण डिटेक्टरों के निर्माण को उपरोक्त अवधारणाओं का उपयोग करके चित्रित किया गया है। हम केवल कुछ नए भागों का निर्माण करके और कुछ मौजूदा भागों को मिलाकर अपनी प्रक्रियाओं को विकसित कर सकते हैं।
MMDetection में शामिल मॉडलों की सूची
MMDetection कई प्रसिद्ध मॉडल और कार्य-उन्मुख मॉड्यूल के लिए शीर्ष पायदान कोडबेस प्रदान करता है। वे मॉडल जो पहले बनाए जा चुके हैं और अनुकूलनीय विधियाँ जिनका उपयोग MMDetection टूलबॉक्स के साथ किया जा सकता है, नीचे सूचीबद्ध हैं। जैसे-जैसे अधिक मॉडल और तरीके जोड़े जाते हैं, सूची बढ़ती रहती है।
- फास्ट आर-सीएनएन
- तेज़ आर-सीएनएन
- मास्क आर-सीएनएन
- रेटिनानेट
- DCN
- DCNv2
- कैस्केड आर-सीएनएन
- M2Det
- GHM
- स्क्रैचडेट
- डबल-हेड आर-सीएनएन
- ग्रिड आर-सीएनएन
- एफएसएफ़
- तुला आर-सीएनएन
- जीसीनेट
- एचआरनेट
- मास्क स्कोरिंग आर-सीएनएन
- एफसीओएस
- एसएसडी
- आर-एफसीएन
- मिश्रित प्रेसिजन प्रशिक्षण
- वजन मानकीकरण
- हाइब्रिड टास्क कैस्केड
- गाइडेड एंकरिंग
- सामान्यीकृत ध्यान
MMDetection का उपयोग करके ऑब्जेक्ट डिटेक्शन मॉडल का निर्माण
इस ट्यूटोरियल में, हम Google कोलाब नोटबुक होंगे क्योंकि इसे सेट करना और उपयोग करना आसान है।
स्थापना
हमें जो कुछ भी चाहिए उसे स्थापित करने के लिए, हम पहले आवश्यक पुस्तकालय स्थापित करेंगे और MMdetection GitHub प्रोजेक्ट को क्लोन करेंगे।
इंपोर्टिंग एनवी
हमारी परियोजना के लिए पर्यावरण अब भंडार से आयात किया जाएगा।
पुस्तकालयों और एमएमडिटेक्शन आयात करना
अब हम निश्चित रूप से MM डिटेक्शन के साथ आवश्यक पुस्तकालयों का आयात करेंगे।
पूर्व-प्रशिक्षित चौकियों को डाउनलोड करें
MMडिटेक्शन से पूर्व-प्रशिक्षित मॉडल चौकियों को अब आगे के समायोजन और अनुमान के लिए डाउनलोड किया जाना चाहिए।
बिल्डिंग मॉडल
अब हम मॉडल का निर्माण करेंगे और चौकियों को डेटासेट पर लागू करेंगे।
डिटेक्टर का अनुमान लगाएं
अब जबकि मॉडल का निर्माण और लोड ठीक से हो गया है, आइए देखें कि यह कितना उत्कृष्ट है। हम MMDetection के उच्च-स्तरीय API अनुमान डिटेक्टर का उपयोग करते हैं। इस एपीआई को अनुमान प्रक्रिया को आसान बनाने के लिए डिज़ाइन किया गया था।
परिणाम
आइए एक नजर डालते हैं नतीजों पर।
निष्कर्ष
अंत में, MMDetection टूलबॉक्स ने हाल ही में जारी किए गए कोडबेस जैसे SimpleDet, Detectron, और Maskrcnn-बेंचमार्क से बेहतर प्रदर्शन किया। एक बड़े मॉडल संग्रह के साथ,
MMDetection अब अत्याधुनिक तकनीक है। MMDetection दक्षता और प्रदर्शन के मामले में अन्य सभी कोडबेस से बेहतर प्रदर्शन करता है।
MMdetection के बारे में सबसे अच्छी चीजों में से एक यह है कि अब आप केवल एक अलग कॉन्फ़िगरेशन फ़ाइल को इंगित कर सकते हैं, एक अलग चेकपॉइंट डाउनलोड कर सकते हैं, और यदि आप मॉडल बदलना चाहते हैं तो वही कोड चला सकते हैं।
मैं उन्हें देखने की सलाह देता हूं निर्देश यदि आप किसी भी चरण में समस्याओं का सामना करते हैं या उनमें से कुछ को अलग तरीके से पूरा करना चाहते हैं।
एक जवाब लिखें