एमएलफ्लो - ओपन-सोर्स एमएल लाइफसाइकिल प्लेटफार्म

विषय - सूची[छिपाना][प्रदर्शन]

एमएल चुनौतियां
एमएलफ्लो क्या है?
एमएलफ्लो घटक: वे कैसे काम करते हैं?+-
निष्कर्ष

मशीन सीखने के विकास की कोशिश करने वाला हर कोई समझता है कि यह कितना मुश्किल है। सॉफ्टवेयर विकास में मानक समस्याओं के अलावा, मशीन लर्निंग (एमएल) विकास कई अतिरिक्त बाधाओं का परिचय देता है।

डेटा तैयार करने से लेकर मॉडल प्रशिक्षण तक, एमएल जीवनचक्र के हर चरण में मदद के लिए सैकड़ों ओपन सोर्स टूल उपलब्ध हैं।

पारंपरिक सॉफ्टवेयर विकास के विपरीत, जब टीमें प्रत्येक चरण के लिए एक उपकरण चुनती हैं, तो एमएल के साथ आप आमतौर पर हर उपलब्ध टूल (जैसे, एल्गोरिदम) का पता लगाना चाहते हैं कि क्या यह परिणामों में सुधार करता है।

नतीजतन, एमएल डेवलपर्स को सैकड़ों पुस्तकालयों का उपयोग और उत्पादन करना चाहिए।

मशीन लर्निंग एल्गोरिदम में हजारों अनुकूलन योग्य पैरामीटर होते हैं, और यह पहचानना मुश्किल है कि मॉडल बनाने के लिए प्रत्येक प्रयोग में कौन से पैरामीटर, कोड और डेटा गए, चाहे आप अकेले काम करें या टीम में।

उचित निगरानी के बिना, टीमें अक्सर उसी कोड को फिर से काम करने के लिए संघर्ष करती हैं। चाहे आप एक डेटा वैज्ञानिक हों, अपने प्रशिक्षण कोड को उत्पादन के उपयोग के लिए एक इंजीनियर को स्थानांतरित कर रहे हों, या आप किसी समस्या का निदान करने के लिए अपने पिछले काम पर वापस जा रहे हों, एमएल वर्कफ़्लो के चरणों को पीछे हटाना महत्वपूर्ण है।

कई परिनियोजन विधियों और परिवेशों का उपयोग करने के लिए एक मॉडल को उत्पादन में ले जाना मुश्किल हो सकता है (उदाहरण के लिए, REST सेवा, बैच अनुमान, या मोबाइल एप्लिकेशन)। किसी भी पुस्तकालय से इनमें से किसी भी उपकरण में मॉडल को स्थानांतरित करने के लिए कोई सामान्य तरीका नहीं है, और इस प्रकार प्रत्येक नई तैनाती एक जोखिम पेश करती है।

इन मुद्दों के कारण, यह स्पष्ट है कि पारंपरिक सॉफ्टवेयर विकास के रूप में स्थिर, अनुमानित और व्यापक रूप से उपयोग किए जाने के लिए एमएल विकास में काफी सुधार होना चाहिए।

एमएल चुनौतियां

विभिन्न प्रकार के औजारों की भरमार है। डेटा तैयार करने से लेकर मॉडल प्रशिक्षण तक, मशीन सीखने के जीवनचक्र के हर चरण में मदद के लिए सैकड़ों सॉफ़्टवेयर समाधान उपलब्ध हैं। इसके अलावा, पारंपरिक सॉफ्टवेयर विकास के विपरीत, जब टीम मशीन लर्निंग (एमएल) में प्रत्येक चरण के लिए एक उपकरण चुनती है, तो आप अक्सर यह देखने के लिए हर उपलब्ध टूल (जैसे, एल्गोरिथम) का पता लगाना चाहते हैं कि क्या यह परिणामों में सुधार करता है। नतीजतन, एमएल डेवलपर्स को सैकड़ों पुस्तकालयों का उपयोग और उत्पादन करना चाहिए।
प्रयोगों का ट्रैक रखना मुश्किल है। मशीन लर्निंग एल्गोरिदम में हजारों अनुकूलन योग्य पैरामीटर होते हैं, और यह पहचानना मुश्किल है कि मॉडल बनाने के लिए प्रत्येक प्रयोग में कौन से पैरामीटर, कोड और डेटा गए, चाहे आप अकेले काम करें या टीम में।
मशीन लर्निंग को लागू करना मुश्किल है। कई परिनियोजन विधियों और परिवेशों का उपयोग करने के लिए एक मॉडल को उत्पादन में ले जाना मुश्किल हो सकता है (उदाहरण के लिए, REST सेवा, बैच अनुमान, या मोबाइल एप्लिकेशन)। किसी भी पुस्तकालय से इनमें से किसी भी उपकरण में मॉडलों को स्थानांतरित करने के लिए कोई सामान्य तरीका नहीं है। इस प्रकार, प्रत्येक नई तैनाती एक जोखिम का परिचय देती है।

एचएमबी क्या है? एमएलफ्लो?

MLflow मशीन सीखने के जीवन चक्र के लिए एक खुला स्रोत मंच है। यह एक खुले इंटरफ़ेस अवधारणा पर आधारित है, जो कई आवश्यक सार तत्वों का प्रस्ताव करता है जो वर्तमान बुनियादी ढांचे और मशीन लर्निंग एल्गोरिदम को सिस्टम के साथ आसानी से एकीकृत करने की अनुमति देता है।

1 2

इसका तात्पर्य यह है कि यदि आप एक डेवलपर हैं जो एमएलफ्लो का उपयोग करना चाहते हैं लेकिन एक असमर्थित ढांचे का उपयोग कर रहे हैं, तो ओपन इंटरफेस डिज़ाइन उस ढांचे को एकीकृत करने और प्लेटफॉर्म के साथ काम करना शुरू करने के लिए अपेक्षाकृत सरल बनाता है। व्यवहार में, इसका तात्पर्य है कि MLflow का उद्देश्य किसी के साथ कार्य करना है यंत्र अधिगम पुस्तकालय या भाषा।

इसके अलावा, MLflow दोहराव को बढ़ावा देता है, जिसका अर्थ है कि समान प्रशिक्षण या उत्पादन मशीन लर्निंग कोड को पर्यावरण से स्वतंत्र समान परिणामों के साथ चलाने का इरादा है, चाहे क्लाउड में, स्थानीय वर्कस्टेशन पर, या नोटबुक में।

अंत में, MLflow को स्केलेबिलिटी के लिए बनाया गया है, इसलिए इसका उपयोग डेटा वैज्ञानिकों की एक छोटी टीम के साथ-साथ सैकड़ों मशीन लर्निंग प्रैक्टिशनर्स वाली एक बड़ी कंपनी द्वारा किया जा सकता है।

MLflow किसी भी मशीन लर्निंग लाइब्रेरी, एल्गोरिथम, परिनियोजन टूल या भाषा के साथ संगत है। इसके निम्नलिखित फायदे भी हैं:

किसी भी क्लाउड सेवा के साथ काम करने के लिए डिज़ाइन किया गया।
अपाचे स्पार्क के साथ विशाल डेटा के पैमाने।
MLflow विभिन्न प्रकार के ओपन-सोर्स मशीन लर्निंग फ्रेमवर्क के साथ संगत है, जिसमें Apache Spark, TensorFlow, तथा साईकिट-लर्न.

यदि आपके पास पहले से कोड है, तो इसके साथ MLflow का उपयोग किया जा सकता है। आप अपने ढांचे और मॉडलों को उद्यमों के बीच साझा भी कर सकते हैं क्योंकि यह है खुले स्रोत.

एमएलफ्लो घटक: वे कैसे काम करते हैं?

MLflow, ML जीवनचक्र के प्रबंधन के लिए एक स्वतंत्र और खुला स्रोत प्लेटफ़ॉर्म है, जिसमें प्रयोग, प्रतिलिपि प्रस्तुत करने योग्यता, परिनियोजन और एकल मॉडल रजिस्ट्री शामिल है। वर्तमान में, MLflow के चार घटक हैं:

2 3

1. एमएलफ़्लो ट्रैकिंग

मैं एमएलफ्लो ट्रैकिंग के साथ शुरुआत करने जा रहा हूं। MLflow एक केंद्रीकृत प्रशिक्षण मेटाडेटा ट्रैकिंग रिपॉजिटरी से जुड़ी विभिन्न आवश्यक अवधारणाओं के संग्रह का समर्थन करता है। पहली धारणा महत्वपूर्ण हाइपरपैरामीटर या कॉन्फ़िगरेशन नॉब्स का एक संग्रह है जो मॉडल के प्रदर्शन को प्रभावित करती है। MLflow के API और केंद्रीकृत ट्रैकिंग सेवा का उपयोग करके इन सभी को संरक्षित किया जा सकता है।

उपयोगकर्ता अपने मशीन लर्निंग मॉडल की सफलता के बारे में जानकारी प्राप्त करने के लिए प्रदर्शन डेटा भी रिकॉर्ड कर सकते हैं। इसके अलावा, दोहराव के लिए, MLflow उपयोगकर्ताओं को विशिष्ट स्रोत कोड को लॉग करने की अनुमति देता है जिसका उपयोग एक मॉडल के साथ-साथ इसके संस्करण को बनाने के लिए किया गया था, जो प्रत्येक मॉडल को एक विशिष्ट प्रतिबद्ध हैश से जोड़ने के लिए Git के साथ कसकर एकीकृत करता है।

MLflow का उपयोग कलाकृतियों को लॉग करने के लिए किया जा सकता है, जो कि प्रशिक्षण, परीक्षण डेटा और पुनरुत्पादन के लिए स्वयं मॉडल सहित कोई भी मनमानी फ़ाइलें हैं।

इसका मतलब यह है कि अगर मैं एक डेवलपर हूं जिसने अभी-अभी एक मॉडल को प्रशिक्षित किया है, तो मैं इसे केंद्रीकृत ट्रैकिंग सेवा के लिए जारी रख सकता हूं, और मेरा एक सहयोगी इसे बाद में लोड कर सकता है और या तो उस मॉडल को प्रशिक्षित और प्रयोग या उत्पादन करना जारी रख सकता है ताकि एक विशिष्ट आवश्यकता को पूरा किया जा सके। .

अपना मशीन लर्निंग कोड निष्पादित करते समय और बाद में परिणाम देखते समय, ट्रैकिंग एक एपीआई है जो आपको पैरामीटर, कोड संस्करण, मीट्रिक और आउटपुट फ़ाइलों को लॉग करने की अनुमति देती है। यह अन्य भाषाओं के अलावा पायथन, आर और जावा में लिखा गया है। यह एक आरईएसटी एपीआई के रूप में भी पहुंच योग्य है, जिसका उपयोग इसके ऊपर ऐप्स बनाने के लिए किया जा सकता है।

मुख्य विशेषताएं

कई डेवलपर्स अपने स्थानीय पीसी पर एमएलफ्लो का उपयोग करते हैं, जहां बैकएंड और आर्टिफैक्ट स्टोरेज डिस्क पर एक निर्देशिका साझा करते हैं।
कई उपयोगकर्ता अपने स्थानीय पीसी पर MLflow चलाने के लिए SQLite, एक SQLAlchemy-संगत डेटाबेस का भी उपयोग करते हैं।
MLflow वितरित आर्किटेक्चर का भी समर्थन करता है। इनमें ट्रैकिंग सर्वर, बैकएंड स्टोर और आर्टिफैक्ट स्टोर सभी अलग-अलग सर्वर पर होस्ट किए जाते हैं।
यदि रन एक एमएलफ्लो प्रोजेक्ट द्वारा शुरू किया गया था, तो गिट प्रतिबद्ध हैश का उपयोग किया गया था। चलाने के लिए डेटा लॉग करने के लिए MLflow Python, R, Java और REST API का उपयोग किया जा सकता है।

अधिक जानकारी के लिए, आप अधिकारी देख सकते हैं दस्तावेज़ीकरण.

2. एमएलफ्लो प्रोजेक्ट्स

ट्रैकिंग घटकों के माध्यम से जाने के बाद, मैं एमएलफ्लो परियोजनाओं के बारे में बात करना चाहता हूं, जो निष्पादन संदर्भ की परवाह किए बिना मॉडल प्रशिक्षण सत्रों के लिए एक दोहराने योग्य पैकेजिंग संरचना है।

व्यवसाय मशीन लर्निंग प्रशिक्षण तकनीकों की एक विस्तृत श्रृंखला का उपयोग करते हैं, लेकिन वे इन प्रशिक्षण उपकरणों का उपयोग विविध संदर्भों में भी करते हैं। उदाहरण के लिए, वे अपने प्रशिक्षण कोड को क्लाउड पर, स्थानीय पीसी पर या नोटबुक में निष्पादित कर सकते हैं।

यह समस्या की ओर ले जाता है कि मशीन सीखने के परिणामों को दोहराना मुश्किल है। अक्सर, एक ही समान प्रशिक्षण कोड दो अलग-अलग स्थानों में समान परिणाम निष्पादित या उत्पन्न नहीं करता है।

MLflow द्वारा प्रदान किया गया समाधान एक स्व-निहित प्रशिक्षण कोड प्रोजेक्ट परिभाषा है जिसमें सभी मशीन लर्निंग प्रशिक्षण कोड, साथ ही इसके संस्करण पुस्तकालय निर्भरता, सेटिंग्स और प्रशिक्षण और परीक्षण डेटा शामिल हैं।

MLflow मशीन सीखने की प्रशिक्षण प्रक्रिया के लिए आवश्यकताओं के पूरे सेट का स्पष्ट रूप से वर्णन करके निष्पादन संदर्भों में प्रतिलिपि प्रस्तुत करने योग्यता सुनिश्चित करता है। यह उन सभी पुस्तकालयों को स्थापित करके और उसी सिस्टम स्थिति को पूरा करके इसे पूरा करता है जिसमें कोड चल रहा है।

MLflow प्रोजेक्ट एक डायरेक्टरी से ज्यादा कुछ नहीं है। यह एक निर्देशिका है जिसमें प्रशिक्षण कोड, पुस्तकालय निर्भरता परिभाषा, और प्रशिक्षण सत्र के लिए आवश्यक अन्य डेटा, साथ ही यह वैकल्पिक कॉन्फ़िगरेशन फ़ाइल शामिल है।

इन पुस्तकालय आवश्यकताओं को विभिन्न तरीकों से परिभाषित किया जा सकता है। उदाहरण के लिए, उपयोगकर्ता अपनी प्रशिक्षण कोड लाइब्रेरी आवश्यकताओं को सूचीबद्ध करने के लिए YAML-स्वरूपित एनाकोंडा पर्यावरण विनिर्देश प्रदान कर सकते हैं। MLflow कंटेनर के भीतर प्रशिक्षण कोड निष्पादित करेगा। ऐसे मामले में, वे एक डॉकर कंटेनर भी शामिल कर सकते हैं।

अंत में, MLflow में इन परियोजनाओं को चलाने के लिए एक कमांड-लाइन इंटरफ़ेस (CLI) है, साथ ही साथ Python, और Java API भी हैं। इन परियोजनाओं को उपयोगकर्ता के स्थानीय सिस्टम के साथ-साथ विभिन्न दूरस्थ सेटिंग्स जैसे कि डेटाब्रिक्स जॉब शेड्यूलर और कुबेरनेट्स पर चलाया जा सकता है। MLflow प्रोजेक्ट आपको डेटा साइंस कोड को दोहराने योग्य और पुन: प्रयोज्य तरीके से पैकेज करने की अनुमति देता है, जो ज्यादातर मानकों पर आधारित होता है।

परियोजना घटक में परियोजनाओं के प्रबंधन के लिए एपीआई के साथ-साथ कमांड-लाइन उपयोगिताओं शामिल हैं। ये क्षमताएं गारंटी देती हैं कि मशीन सीखने की प्रक्रिया बनाने के लिए परियोजनाओं को एक साथ जोड़ा जा सकता है।

मुख्य विशेषताएं

MLflow परियोजना के वातावरण का समर्थन करता है, जिसमें डॉकर कंटेनर वातावरण, कोंडा पर्यावरण और सिस्टम वातावरण शामिल हैं।
किसी भी Git रिपॉजिटरी या स्थानीय निर्देशिका को MLflow प्रोजेक्ट माना जा सकता है; डिफ़ॉल्ट रूप से; आप किसी भी शेल का उपयोग कर सकते हैं या पायथन लिपि निर्देशिका में प्रोजेक्ट प्रविष्टि बिंदु के रूप में।
गैर-पायथन निर्भरता, जैसे कि जावा लाइब्रेरी, को डॉकर कंटेनरों का उपयोग करके कैप्चर किया जा सकता है।
आप प्रोजेक्ट फ़ाइल को प्रोजेक्ट की रूट डायरेक्टरी में जोड़कर MLflow प्रोजेक्ट पर अधिक नियंत्रण प्राप्त कर सकते हैं, जो कि YAML सिंटैक्स में एक टेक्स्ट फ़ाइल है।

अधिक जानकारी के लिए, आप अधिकारी देख सकते हैं दस्तावेज़ीकरण.

3. एमएलफ्लो मॉडल

अब, मैं एमएलफ्लो मॉडल पर चर्चा करना चाहता हूं, एक सामान्य-उद्देश्य मॉडल प्रारूप जो उत्पादन संदर्भों की एक विस्तृत श्रृंखला का समर्थन करता है। MLflow मॉडल का कारण अब काफी हद तक परियोजनाओं के समान है।

फिर, हम देखते हैं कि मॉडलों की एक विस्तृत श्रृंखला का उपयोग करके मॉडल तैयार किए जा सकते हैं, लेकिन प्रशिक्षण वातावरण के विपरीत, उन्हें बड़ी संख्या में स्थितियों में भी उत्पादित या तैनात किया जा सकता है।

इन सेटिंग्स में वास्तविक समय की सेवा के लिए उपकरण शामिल हैं, जैसे कुबेरनेट्स या अमेज़ॅन सेजमेकर, साथ ही स्ट्रीमिंग और बैच स्कोरिंग, जैसे स्पार्क। इसके अलावा, कुछ व्यवसाय पूर्व-कॉन्फ़िगर किए गए क्लाउड इंस्टेंस पर चलने वाली RESTful वेब सेवा के रूप में मॉडल को तैनात करना चुन सकते हैं।

एक MLflow मॉडल, एक परियोजना की तरह, एक निर्देशिका संरचना है। इसमें एक कॉन्फ़िगरेशन फ़ाइल और, इस बार, प्रशिक्षण कोड के बजाय एक क्रमबद्ध मॉडल आर्टिफैक्ट शामिल है। इसमें एक परियोजना के रूप में दोहराव के लिए निर्भरता का यह सेट भी शामिल है। इस बार, हम कोंडा परिवेश के संदर्भ में मूल्यांकन निर्भरता पर गौर करेंगे।

इसके अतिरिक्त, MLflow में लोकप्रिय फ्रेमवर्क की एक श्रृंखला से MLflow प्रारूप में मॉडल को क्रमबद्ध करने के लिए मॉडल जनरेशन टूल शामिल हैं। अंत में, MLflow किसी भी MLflow मॉडल को सेवाओं की एक श्रृंखला के लिए उत्पादन और जोड़ने के लिए तैनाती, एपीआई जोड़ता है, और ये एपीआई पायथन, जावा, आर और एक सीएलआई प्रारूप में सुलभ हैं।

मॉडल पैकेजिंग मॉडल के लिए एक मानक संरचना के साथ एक घटक है जिसे डाउनस्ट्रीम टूल जैसे कि अनुमान लगाने वाले सर्वरों द्वारा उपयोग और समझा जा सकता है डाटब्रिक्स बैच अनुमान मंच। उत्पादन के लिए एक मॉडल की पैकेजिंग करते समय यह घटक घंटों के बीस्पोक कोड को बचाता है।

MLflow मॉडल मशीन लर्निंग मॉडल को विभिन्न रूपों में पैक करने के लिए एक मानक है जिसे "फ्लेवर" के रूप में जाना जाता है। MLflow विभिन्न प्रकार के मॉडलों को परिनियोजित करने में आपकी सहायता करने के लिए बहुत सारे उपकरण प्रदान करता है। प्रत्येक एमएलफ्लो मॉडल को एक निर्देशिका के रूप में रखा जाता है जिसमें मनमानी फाइलों के साथ-साथ एमएल मॉडल डिस्क्रिप्टर फ़ाइल होती है जिसमें स्वादों की सूची होती है जिसमें इसका उपयोग किया जा सकता है।

मुख्य विशेषताएं

MLflow के सभी अंतर्निहित परिनियोजन उपकरण कई "मानक" स्वाद प्रदान करते हैं, जैसे कि "पायथन फ़ंक्शन" स्वाद जो बताता है कि मॉडल को पायथन फ़ंक्शन के रूप में कैसे चलाया जाए।
प्रत्येक MLflow मॉडल में एक निर्देशिका होती है जिसमें मनमानी फ़ाइलें होती हैं, साथ ही निर्देशिका के मूल में एक ML मॉडल फ़ाइल होती है जो मॉडल के कई स्वादों को परिभाषित करती है।
मॉडल को संग्रहीत करते समय, MLflow आपको एक कोंडा पर्यावरण पैरामीटर निर्दिष्ट करने की अनुमति देता है जिसमें मॉडल की निर्भरताएँ होती हैं। यदि कोई कोंडा वातावरण निर्दिष्ट नहीं है, तो मॉडल के स्वाद के आधार पर एक डिफ़ॉल्ट वातावरण का निर्माण किया जाता है। उसके बाद, Conda पर्यावरण conda.yaml में संग्रहित हो जाता है।

अधिक जानकारी के लिए, आप अधिकारी देख सकते हैं दस्तावेज़ीकरण.

4. MLflow मॉडल रजिस्ट्री

एक मॉडल रजिस्ट्री लर्न्ड मशीन लर्निंग (एमएल) मॉडल के लिए एक भंडार है। मॉडल रजिस्ट्री एपीआई और एक वेब-आधारित एप्लिकेशन से बनी होती है जिसका उपयोग एक टीम के रूप में विभिन्न चरणों में मॉडल को बनाए रखने के लिए किया जाता है। मॉडल वंशावली, मॉडल संस्करण, आसान चरण संक्रमण, और एनोटेशन मॉडल रजिस्ट्री में उपलब्ध क्षमताओं में से कुछ हैं।

एक मॉडल रजिस्ट्री, मॉडल के अलावा, मॉडल के निर्माण के लिए उपयोग किए गए डेटा और प्रशिक्षण कार्यों के बारे में जानकारी (मेटाडेटा) शामिल है। एमएल मॉडल के लिए वंश बनाने के लिए इन आवश्यक इनपुट का ट्रैक रखना महत्वपूर्ण है। इस संबंध में, एक मॉडल रजिस्ट्री पारंपरिक सॉफ्टवेयर के समान कार्य करती है संस्करण नियंत्रण सिस्टम (उदाहरण के लिए, गिट, एसवीएन) और आर्टिफैक्ट रिपोजिटरी (उदाहरण के लिए, आर्टिफैक्टरी, पीईपीआई)।

मॉडल रजिस्ट्री एक ढांचा है जो डेटा वैज्ञानिकों और मशीन लर्निंग इंजीनियरों को अन्य टीमों के साथ सहयोग के लिए अपने मॉडल को प्रकाशित, परीक्षण, निगरानी, प्रबंधन और वितरित करने की अनुमति देता है। अनिवार्य रूप से, मॉडल रजिस्ट्री का उपयोग तब किया जाता है जब आप अपना परीक्षण चरण पूरा कर लेते हैं और टीम और हितधारकों के साथ अपने निष्कर्ष साझा करने के लिए तैयार होते हैं।

MLflow मॉडल रजिस्ट्री आपके मॉडल और उनके जीवनकाल को एक केंद्रीय स्थान से प्रबंधित करने के लिए एक API और एक उपयोगकर्ता इंटरफ़ेस प्रदान करती है। मॉडल वंश, मॉडल संस्करण, एनोटेशन, और चरण संक्रमण सभी रजिस्ट्री के माध्यम से उपलब्ध हैं।

MLflow में, एक पंजीकृत मॉडल एक अद्वितीय नाम और मेटाडेटा, मॉडल संस्करण, संक्रमणकालीन चरणों और एक मॉडल वंश के साथ होता है। एक या अधिक मॉडल संस्करण एक पंजीकृत मॉडल में पाए जा सकते हैं। रजिस्ट्री में पंजीकृत होने पर एक नया मॉडल संस्करण 1 माना जाता है। निम्नलिखित संस्करण को समान नाम वाले किसी भी नए मॉडल में जोड़ा जाता है।

आप किसी भी मॉडल संस्करण के लिए किसी भी समय एक चरण निर्दिष्ट कर सकते हैं। हालांकि, चरणों को एमएलफ्लो चरणों के तहत सौंपा जाना चाहिए जिन्हें औपचारिक रूप से निर्दिष्ट किया गया है, जैसे स्टेजिंग, उत्पादन और संग्रहीत। एक मॉडल संस्करण को एक चरण से दूसरे चरण में स्थानांतरित किया जा सकता है।

MLflow आपको शीर्ष-स्तरीय मॉडल और प्रत्येक विशिष्ट संस्करण दोनों को एनोटेट करने के लिए मार्कडाउन का उपयोग करने की अनुमति देता है। आप विवरण के साथ-साथ अन्य प्रासंगिक जानकारी शामिल कर सकते हैं, जैसे कि एल्गोरिथम स्पष्टीकरण, कार्यप्रणाली और उपयोग किए गए डेटासेट।

मुख्य विशेषताएं

अपने स्वयं के MLflow सर्वर को होस्ट करते समय UI या API के माध्यम से मॉडल रजिस्ट्री तक पहुँचने के लिए, आपको डेटाबेस-समर्थित बैकएंड स्टोर का उपयोग करना चाहिए।
मॉडल रजिस्ट्री को एमएलफ्लो मॉडल फ्लेवर या एमएलफ्लो क्लाइंट ट्रैकिंग एपीआई इंटरफेस के माध्यम से भी एक्सेस किया जा सकता है। उदाहरण के लिए, आप MLflow प्रयोग चलाने के दौरान या अपने सभी प्रयोग चलने के बाद एक मॉडल पंजीकृत कर सकते हैं।
हर कोई MLflow का उपयोग करके अपने मॉडल का प्रशिक्षण शुरू नहीं करेगा। परिणामस्वरूप, आपके पास MLflow का उपयोग करने से पहले कुछ मॉडलों को प्रशिक्षित किया जा सकता है। मॉडलों को फिर से प्रशिक्षित करने के बजाय, आप बस अपने संग्रहीत मॉडल को मॉडल रजिस्ट्री के साथ पंजीकृत करना चाहते हैं।

अधिक जानकारी के लिए, आप अधिकारी देख सकते हैं दस्तावेज़ीकरण.

निष्कर्ष

MLflow एक उत्कृष्ट और लगातार बढ़ता ML जीवनचक्र उपकरण है। आप इसे अपने वर्तमान टूल और प्लेटफॉर्म के साथ नियोजित कर सकते हैं।

यह कई प्रोग्रामिंग भाषाओं का समर्थन करता है, जिसमें पायथन, जावा और आर शामिल हैं। आप इसके उपयोगकर्ता के अनुकूल डिजाइन के लिए धन्यवाद, विभिन्न मॉडल संस्करणों को जल्दी से ट्रैक, सहेज और तुलना कर सकते हैं।

MLflow को आज़माएं और हमें अपना अनुभव बताएं!

एमएलफ्लो - ओपन-सोर्स एमएल लाइफसाइकिल प्लेटफार्म

एमएल चुनौतियां

एचएमबी क्या है? एमएलफ्लो?