هرڪو جنهن مشين سکيا جي ترقي جي ڪوشش ڪئي آهي سمجهي ٿو ته اهو ڪيترو ڏکيو آهي. سافٽ ويئر ڊولپمينٽ ۾ معياري مسئلن کان علاوه، مشين لرننگ (ML) ڊولپمينٽ اضافي رڪاوٽون متعارف ڪرايو.
ايم ايل لائف سائيڪل جي هر مرحلي ۾ مدد لاءِ سوين اوپن سورس ٽولز موجود آهن، ڊيٽا تيار ڪرڻ کان وٺي ماڊل ٽريننگ ذريعي.
روايتي سافٽ ويئر ڊولپمينٽ جي برعڪس، جڏهن ٽيمون هر قدم لاءِ هڪ اوزار چونڊينديون آهن، ML سان توهان عام طور تي هر دستياب اوزار (مثال طور، الگورٿم) کي ڳولڻ چاهيو ٿا ته ڏسو ته ڇا اهو نتيجو بهتر ڪري ٿو.
نتيجي طور، ايم ايل ڊولپرز کي لازمي طور استعمال ڪرڻ ۽ سوين لائبريريون پيدا ڪرڻ گهرجن.
مشين لرننگ الگورتھمز ۾ ھزارين حسب ضرورت پيرا ميٽرز شامل آھن، ۽ اھو سڃاڻڻ مشڪل آھي ته ڪھڙا پيرا ميٽر، ڪوڊ، ۽ ڊيٽا ھر تجربي ۾ ھڪ ماڊل ٺاھڻ لاءِ ويا، ڇا توھان اڪيلو ڪم ڪريو ٿا يا ٽيم ۾.
مناسب نگراني جي بغير، ٽيمون اڪثر ڪري جدوجهد ڪرڻ لاء ساڳيو ڪوڊ ٻيهر ڪم ڪرڻ لاء. ڇا توهان هڪ ڊيٽا سائنسدان آهيو جيڪو توهان جي ٽريننگ ڪوڊ کي هڪ انجنيئر ڏانهن منتقل ڪري رهيا آهيو پيداوار جي استعمال لاءِ، يا توهان واپس وڃي رهيا آهيو پنهنجي پوئين ڪم تي ڪنهن مسئلي جي تشخيص ڪرڻ لاءِ، ML ورڪ فلو جا قدم پوئتي هٽڻ انتهائي اهم آهي.
ھڪڙي ماڊل کي پيداوار ڏانھن منتقل ڪرڻ مشڪل ٿي سگھي ٿو ڪيترن ئي ترتيب ڏيڻ جي طريقن ۽ ماحول جي ڪري جيڪي استعمال ٿيڻ گهرجن (مثال طور، REST سرونگ، بيچ انفرنس، يا موبائل ايپس). ماڊلز کي ڪنهن به لائبريري مان ڪنهن به اوزار ڏانهن منتقل ڪرڻ جو ڪو عام طريقو ناهي، ۽ اهڙيء طرح هر نئين تعیناتي هڪ خطرو متعارف ڪرايو آهي.
انهن مسئلن جي ڪري، اهو واضح آهي ته ايم ايل ڊولپمينٽ کي خاص طور تي بهتر بنائڻ گهرجي جيئن مستحڪم، پيش گوئي، ۽ وڏي پيماني تي روايتي سافٽ ويئر ڊولپمينٽ طور استعمال ڪيو وڃي.
ايم ايل چئلينجز
- اتي مختلف اوزارن جي گھڻائي آھي. سوين سافٽ ويئر حل موجود آهن مشين جي سکيا واري زندگي جي هر مرحلي ۾ مدد لاءِ، ڊيٽا جي تياري کان وٺي ماڊل ٽريننگ تائين. ان کان علاوه، روايتي سافٽ ويئر ڊولپمينٽ جي برعڪس، جڏهن ٽيمون هر قدم لاءِ هڪ اوزار چونڊينديون آهن، مشين لرننگ (ML) ۾، توهان اڪثر چاهيو ٿا هر دستياب ٽول (مثال طور، الگورٿم) کي اهو ڏسڻ لاءِ ته ڇا اهو نتيجو بهتر ڪري ٿو. نتيجي طور، ايم ايل ڊولپرز کي لازمي طور استعمال ڪرڻ ۽ سوين لائبريريون پيدا ڪرڻ گهرجن.
- تجربن جي ٽريڪ رکڻ ڏکيو آهي. مشين لرننگ الگورتھمز ۾ ھزارين حسب ضرورت پيرا ميٽرز شامل آھن، ۽ اھو سڃاڻڻ مشڪل آھي ته ڪھڙا پيرا ميٽر، ڪوڊ، ۽ ڊيٽا ھر تجربي ۾ ھڪ ماڊل ٺاھڻ لاءِ ويا، ڇا توھان اڪيلو ڪم ڪريو ٿا يا ٽيم ۾.
- مشين سکيا تي عمل ڪرڻ ڏکيو آهي. ھڪڙي ماڊل کي پيداوار ڏانھن منتقل ڪرڻ مشڪل ٿي سگھي ٿو ڪيترن ئي ترتيب ڏيڻ جي طريقن ۽ ماحول جي ڪري جيڪي استعمال ٿيڻ گهرجن (مثال طور، REST سرونگ، بيچ انفرنس، يا موبائل ايپس). ماڊلز کي ڪنهن به لائبريري مان انهن اوزارن ۾ منتقل ڪرڻ جو ڪو عام طريقو ناهي. اهڙيء طرح، هر نئين تعیناتي هڪ خطرو متعارف ڪرايو آهي.
ڇا آھي ايم ايل فلو?
MLflow مشين سکيا واري زندگي جي چڪر لاءِ هڪ کليل ذريعو پليٽ فارم آهي. اهو هڪ کليل انٽرفيس تصور تي مبني آهي، ڪيترن ئي ضروري تجزين کي پيش ڪري ٿو جيڪي موجوده انفراسٽرڪچر ۽ مشين لرننگ الگورتھم کي آساني سان سسٽم سان ضم ٿيڻ جي اجازت ڏين ٿا.
ان جو مطلب اهو آهي ته جيڪڏهن توهان هڪ ڊولپر آهيو جيڪو MLflow استعمال ڪرڻ چاهي ٿو پر هڪ اڻ سڌريل فريم ورڪ استعمال ڪري رهيو آهي، اوپن انٽرفيس ڊيزائن ان فريم ورڪ کي ضم ڪرڻ ۽ پليٽ فارم سان ڪم ڪرڻ شروع ڪرڻ لاءِ نسبتاً آسان بڻائي ٿي. عملي طور تي، هن جو مطلب آهي ته MLflow ڪنهن سان ڪم ڪرڻ جو ارادو آهي مشين جي سکيا لائبريري يا ٻولي.
ان کان علاوه، MLflow ريپٽيبلٽي کي فروغ ڏئي ٿو، جنهن جو مطلب آهي ته ساڳي ٽريننگ يا پروڊڪشن مشين لرننگ ڪوڊ ساڳئي نتيجن سان هلائڻ جو مقصد آهي ماحول کان آزاد، چاهي بادل ۾، مقامي ورڪ اسٽيشن تي، يا هڪ نوٽ بڪ ۾.
آخرڪار، MLflow اسڪيبلبلٽي لاءِ ٺاهيو ويو آهي، تنهن ڪري اهو استعمال ڪري سگهجي ٿو ڊيٽا سائنسدانن جي هڪ ننڍڙي ٽيم سان گڏو گڏ هڪ وڏي ڪمپني سان گڏ سوين مشين سکيا عملي.
MLflow ڪنهن به مشين لرننگ لائبريري، الگورٿم، ڊيپلائيمينٽ ٽول، يا ٻولي سان مطابقت رکي ٿو. اهو پڻ هيٺيان فائدا آهن:
- ڪنهن به ڪلائوڊ سروس سان هلائڻ لاءِ ٺهيل.
- Apache Spark سان وڏي ڊيٽا تائين اسڪيل.
- MLflow مختلف قسم جي اوپن سورس مشين لرننگ فريم ورڪ سان مطابقت رکي ٿو، بشمول Apache Spark، TensorFlow، ۽ SciKit- سکو.
جيڪڏهن توهان وٽ پهريان ئي ڪوڊ آهي، MLflow ان سان استعمال ڪري سگهجي ٿو. توھان شايد پنھنجي فريم ورڪ ۽ ماڊل کي ادارن جي وچ ۾ حصيداري ڪري سگھو ٿا ڇو ته اھو آھي کليل ذريعو.
MLflow اجزاء: اهي ڪيئن ڪم ڪن ٿا؟
ايم ايل فلو ايم ايل لائف سائيڪل کي منظم ڪرڻ لاءِ هڪ مفت ۽ اوپن سورس پليٽ فارم آهي، جنهن ۾ تجربا، ٻيهر پيداواري صلاحيت، مقرري، ۽ هڪ واحد ماڊل رجسٽري شامل آهي. في الحال، ايم ايل فلو جا چار حصا آهن:
1. MLflow ٽريڪنگ
مان MLflow ٽريڪنگ سان شروع ڪرڻ وارو آهيان. MLflow مرڪزي تربيتي ميٽا ڊيٽا ٽريڪنگ ريپوزٽري سان ڳنڍيل مختلف ضروري تصورن جي مجموعن کي سپورٽ ڪري ٿو. پهريون تصور نازڪ هائپرپراميٽرز يا ترتيب واري نوب جو هڪ مجموعو آهي جيڪو ماڊل ڪارڪردگي تي اثر انداز ڪري ٿو. استعمال ڪندي MLflow جي APIs ۽ هڪ مرڪزي ٽريڪنگ سروس انهن سڀني کي محفوظ ڪري سگهي ٿي.
استعمال ڪندڙ شايد ڪارڪردگي ڊيٽا کي رڪارڊ ڪري سگھن ٿا انھن جي مشين جي سکيا واري ماڊل جي ڪاميابي ۾ بصيرت حاصل ڪرڻ لاء. ان کان علاوه، ورجائي جي قابليت لاء، MLflow صارفين کي مخصوص سورس ڪوڊ کي لاگ ان ڪرڻ جي اجازت ڏئي ٿو جيڪو استعمال ڪيو ويو ماڊل ۽ ان جو نسخو ٺاهڻ لاءِ استعمال ڪيو ويو گٽ سان مضبوطي سان ضم ٿي هر ماڊل کي مخصوص ڪمٽ هيش سان ڳنڍڻ لاءِ.
MLflow استعمال ڪري سگھجن ٿا آرٽيڪلز کي لاگ ان ڪرڻ لاءِ، جيڪي ڪي به صوابديدي فائلون آھن جن ۾ ٽريننگ، ٽيسٽ ڊيٽا، ۽ ماڊل پاڻ کي ٻيهر پيدا ڪرڻ لاءِ.
ان جو مطلب اهو آهي ته جيڪڏهن مان هڪ ڊولپر آهيان جنهن صرف هڪ ماڊل کي تربيت ڏني آهي، مان ان کي مرڪزي ٽريڪنگ سروس ڏانهن جاري رکي سگهان ٿو، ۽ منهنجو هڪ ساٿي ان کي بعد ۾ لوڊ ڪري سگهي ٿو ۽ يا ته ٽريننگ جاري رکي سگهي ٿو ۽ تجربو يا پيداوار جاري رکي ٿو هڪ مخصوص ضرورت کي پورو ڪرڻ لاءِ ماڊل. .
جڏهن توهان جي مشين لرننگ ڪوڊ تي عمل ڪندي ۽ بعد ۾ نتيجا ڏسي رهيا آهيو، ٽريڪنگ هڪ API آهي جيڪو توهان کي پيرا ميٽرز، ڪوڊ ورزن، ميٽرڪس، ۽ آئوٽ پٽ فائلن کي لاگ ان ڪرڻ جي اجازت ڏئي ٿو. اهو Python، R، ۽ Java، ٻين ٻولين ۾ لکيل آهي. اهو REST API جي طور تي پڻ رسائي لائق آهي، جيڪو شايد ان جي مٿان ايپس ٺاهڻ لاءِ استعمال ٿي سگهي ٿو.
اهم خصوصيتون
- ڪيترائي ڊولپر استعمال ڪن ٿا MLflow پنھنجي مقامي پي سي تي، جتي پس منظر ۽ آرٽيڪل اسٽوريج ڊسڪ تي ڊاريڪٽري شيئر ڪن ٿا.
- ڪيترائي صارف پڻ ملازمت ڪندا آهن SQLite، هڪ SQLAlchemy-مطابقت رکندڙ ڊيٽابيس، انهن جي مقامي پي سي تي MLflow هلائڻ لاءِ.
- MLflow پڻ ورهايل فن تعمير کي سپورٽ ڪري ٿو. ٽريڪنگ سرور، پس منظر اسٽور، ۽ آرٽيڪل اسٽور اهي سڀئي ميزبان آهن انهن ۾ مختلف سرورز تي.
- جيڪڏهن رن شروع ڪيو ويو ايم ايل فلو پروجيڪٽ طرفان، گٽ ڪمٽ هيش استعمال ڪيو ويو. MLflow Python، R، Java، ۽ REST APIs استعمال ٿي سگھن ٿيون لاگ ان ڊيٽا کي هلائڻ لاءِ.
وڌيڪ معلومات لاء، توهان کي چيڪ ڪري سگهو ٿا سرڪاري دستاويز.
2. MLFlow منصوبا
اسان جي ٽريڪنگ اجزاء جي ذريعي وڃڻ کان پوء، مان MLflow منصوبن جي باري ۾ ڳالهائڻ چاهيان ٿو، جيڪي ماڊل ٽريننگ سيشن لاء هڪ ورجائي سگهڻ واري پيڪنگنگ ڍانچي آهن، بغير عملدرآمد جي حوالي سان.
ڪاروبار استعمال ڪن ٿا مشين جي سکيا واري تربيتي ٽيڪنالاجي جي وسيع رينج، پر اهي پڻ استعمال ڪن ٿا انهن تربيتي اوزارن کي مختلف سيٽن جي حوالي سان. مثال طور، اهي شايد ڪلائوڊ تي، مقامي پي سي تي، يا هڪ نوٽ بڪ ۾ پنهنجو ٽريننگ ڪوڊ جاري ڪري رهيا آهن.
اهو مسئلو آهي ته مشين سکيا جا نتيجا نقل ڪرڻ ڏکيو آهي. گهڻو ڪري، ساڳيو هڪجهڙو ٽريننگ ڪوڊ ٻن الڳ هنڌن تي ساڳيو نتيجو عمل يا حاصل نٿو ڪري.
MLflow پاران مهيا ڪيل حل هڪ خود شامل ٽريننگ ڪوڊ پروجيڪٽ جي تعريف آهي جنهن ۾ شامل آهي سڀ مشين سکيا ٽريننگ ڪوڊ، گڏو گڏ ان جي ورزن لائبريري انحصار، سيٽنگون، ۽ ٽريننگ ۽ ٽيسٽ ڊيٽا.
MLflow هڪ مشين لرننگ ٽريننگ جي عمل لاءِ ضرورتن جي پوري سيٽ کي واضح طور تي بيان ڪندي عملدرآمد جي حوالي سان ٻيهر پيداواري صلاحيت کي يقيني بڻائي ٿو. اهو مڪمل ڪري ٿو انهن سڀني لائبريرين کي نصب ڪندي ۽ ساڳئي سسٽم جي حالت کي پورو ڪندي ڪوڊ ۾ هلندڙ آهي.
MLflow پروجيڪٽ ڊاريڪٽري کان وڌيڪ ڪجھ به ناهي. اها هڪ ڊاريڪٽري آهي جنهن ۾ شامل آهي ٽريننگ ڪوڊ، لائبريري انحصار جي تعريف، ۽ ٻيو ڊيٽا جيڪو ٽريننگ سيشن لاءِ ضروري آهي، انهي سان گڏ هي اختياري ترتيب واري فائيل.
اهي لائبريري گهرجون مختلف طريقن سان بيان ڪري سگهجن ٿيون. استعمال ڪندڙ ڪري سگھن ٿا، مثال طور، YAML-فارميٽ ٿيل ايناڪونڊا ماحول جي وضاحت فراهم ڪرڻ لاءِ انھن جي ٽريننگ ڪوڊ لائبريري جي ضرورتن کي لسٽ ڪرڻ لاءِ. MLflow ٽريننگ ڪوڊ کي ڪنٽينر اندر عمل ڪندو. اهڙي صورت ۾، اهي به شامل ڪري سگهن ٿا هڪ Docker ڪنٽينر.
آخرڪار، MLflow انهن منصوبن کي هلائڻ لاء هڪ ڪمانڊ لائن انٽرفيس (CLI) آهي، انهي سان گڏ پٿون، ۽ جاوا APIs. اهي منصوبا استعمال ڪندڙ جي مقامي سسٽم تي هلائي سگهجن ٿا ۽ گڏوگڏ مختلف ريموٽ سيٽنگون جهڙوڪ Databricks جاب شيڊولر ۽ ڪبرنيٽس. MLflow پروجيڪٽ توهان کي ڊيٽا سائنس ڪوڊ پيڪيج ڪرڻ جي اجازت ڏين ٿا هڪ ورجائي ۽ ٻيهر قابل استعمال انداز ۾، گهڻو ڪري معيار تي ٻڌل.
پروجيڪٽ جي اجزاء ۾ هڪ API شامل آهي انهي سان گڏ ڪمانڊ لائين افاديت منصوبن کي منظم ڪرڻ لاء. اهي صلاحيتون ضمانت ڏين ٿيون ته منصوبن کي گڏ ڪري سگهجي ٿو مشين سکيا وارو عمل ٺاهڻ لاءِ.
اهم خصوصيتون
- MLflow پروجيڪٽ ماحول کي سپورٽ ڪري ٿو، بشمول ڊڪر ڪنٽينر ماحول، ڪانڊا ماحول، ۽ سسٽم ماحول.
- ڪنهن به Git مخزن يا مقامي ڊاريڪٽري کي سمجهي سگهجي ٿو MLflow پروجيڪٽ؛ ڊفالٽ طور؛ توهان ڪنهن به شيل يا استعمال ڪري سگهو ٿا پٿون اسڪرپٽ ڊاريڪٽري ۾ پروجيڪٽ انٽري پوائنٽ جي طور تي.
- غير پٿون انحصار، جهڙوڪ جاوا لائبريريون، ڊاکر ڪنٽينرز استعمال ڪندي پڪڙي سگهجن ٿيون.
- توھان حاصل ڪري سگھوٿا ھڪڙي MLflow پروجيڪٽ تي پروجيڪٽ فائل شامل ڪندي پروجيڪٽ جي روٽ ڊاريڪٽري ۾، جيڪا YAML نحو ۾ ھڪڙي ٽيڪسٽ فائل آھي.
وڌيڪ معلومات لاء، توهان کي چيڪ ڪري سگهو ٿا سرڪاري دستاويز.
3. MLflow ماڊلز
ھاڻي، مان MLflow ماڊلز تي بحث ڪرڻ چاھيان ٿو، ھڪڙو عام-مقصد ماڊل فارميٽ جيڪو پيداوار جي حوالي سان وسيع رينج کي سپورٽ ڪري ٿو. MLflow ماڊلز جو سبب هاڻي منصفانه طور تي ساڳيو آهي جيئن منصوبن لاءِ.
ٻيهر، اسان ڏسون ٿا ته ماڊل ٺاهي سگھجن ٿيون اوزارن جي وسيع رينج کي استعمال ڪندي، پر اهي پڻ پيدا ڪري سگھجن ٿيون يا حالتن جي وڏي حد ۾ ترتيب ڏني وئي، جيئن تربيتي ماحول جي مخالفت.
اهي سيٽنگون شامل آهن حقيقي وقت جي خدمت لاءِ اوزار، جهڙوڪ ڪبرنيٽس يا Amazon SageMaker، گڏوگڏ اسٽريمنگ ۽ بيچ اسڪورنگ، جهڙوڪ اسپارڪ. ان کان علاوه، ڪجهه ڪاروبار چونڊ ڪري سگھن ٿا ماڊلز کي ترتيب ڏيڻ لاءِ RESTful ويب سروس جي طور تي هلندڙ اڳوڻي ترتيب ڏنل بادل مثال تي.
ھڪڙو MLflow ماڊل، ھڪڙي منصوبي وانگر، ھڪڙي ڊاريڪٽري جي جوڙجڪ آھي. ان ۾ ھڪڙي ترتيب واري فائل شامل آھي ۽، ھن ڀيري، ھڪڙي سيريل ٿيل ماڊل نموني جي بدران ٽريننگ ڪوڊ. اهو پڻ شامل آهي انحصار جو هي سيٽ هڪ منصوبي جي طور تي ورجائي قابليت لاءِ. هن ڀيري، اسان هڪ ڪانڊا ماحول جي حوالي سان تشخيص جي انحصار تي نظر ڪنداسين.
اضافي طور تي، ايم ايل فلو ۾ ماڊل نسل جا اوزار شامل آهن MLflow فارميٽ ۾ ماڊلز کي سيريل ڪرڻ لاءِ مشهور فريم ورڪ جي حد کان. آخرڪار، MLflow شامل ڪري ٿو، APIs جي پيداوار ۽ ڳنڍڻ لاءِ ڪنهن به ايم ايل فلو ماڊل کي خدمتن جي هڪ حد تائين، ۽ اهي APIs پٿون، جاوا، آر، ۽ هڪ CLI فارميٽ ۾ رسائي لائق آهن.
ماڊل ھڪڙو جزو آھن ھڪڙو معياري ڍانچي سان گڏ پيڪنگنگ ماڊل لاءِ جيڪي استعمال ڪري سگھجن ٿا ۽ سمجھي سگھجن ٿا ھيٺيون اوزار جھڙوڪ انفرينسنگ سرورز يا بنيادي دستاويزن بيچ انفرنسنگ پليٽ فارم. هي جزو بيسپوڪ ڪوڊ جا ڪلاڪ بچائيندو آهي جڏهن پيداوار لاءِ ماڊل کي پيڪنگ ڪندي.
MLflow ماڊل پيڪنگ مشين لرننگ ماڊل لاءِ هڪ معيار آهي مختلف شڪلن ۾ جنهن کي ”ذائقو“ چيو وڃي ٿو. MLflow توهان کي مختلف قسم جا ماڊل ترتيب ڏيڻ ۾ مدد ڏيڻ لاءِ ڪيترائي اوزار مهيا ڪري ٿو. هر MLflow ماڊل هڪ ڊاريڪٽري جي طور تي رکيل آهي جنهن ۾ صوابديدي فائلون شامل آهن ۽ انهي سان گڏ هڪ ML ماڊل بيان ڪندڙ فائل ذائقن جي فهرست سان جنهن ۾ اهو استعمال ٿي سگهي ٿو.
اهم خصوصيتون
- MLflow جا سڀ بلٽ ان ڊيپلائيمينٽ ٽولز گھڻن ”معياري“ ذائقن کي پيش ڪن ٿا، جھڙوڪ ”Python فنڪشن“ فليور جيڪو وضاحت ڪري ٿو ته ماڊل کي پائٿون فنڪشن جي طور تي ڪيئن هلائڻو آھي.
- هر MLflow ماڊل هڪ ڊائريڪٽري تي مشتمل هوندو آهي جنهن ۾ صوابديدي فائلون هونديون آهن، انهي سان گڏ هڪ ML ماڊل فائل ڊاريڪٽري جي روٽ تي هوندي آهي جيڪا ماڊل جي ڪيترن ئي ذائقن کي بيان ڪري ٿي.
- جڏهن هڪ ماڊل کي محفوظ ڪري رهيو آهي، MLflow توهان کي هڪ Conda ماحول جي پيٽرولر جي وضاحت ڪرڻ جي اجازت ڏئي ٿو جنهن ۾ ماڊل جي انحصار شامل آهي. جيڪڏهن ڪا به ڪانڊا ماحول بيان نه ڪيو ويو آهي، ماڊل جي ذائقي تي ٻڌل هڪ ڊفالٽ ماحول ٺاهيو ويندو آهي. ان کان پوء، Conda ماحول conda.yaml ۾ ذخيرو ٿيل آهي.
وڌيڪ معلومات لاء، توهان کي چيڪ ڪري سگهو ٿا سرڪاري دستاويز.
4. MLflow ماڊل رجسٽري
هڪ ماڊل رجسٽري سکيا مشين جي سکيا (ML) ماڊلز لاءِ هڪ مخزن آهي. ماڊل رجسٽري APIs مان ٺهيل آهي ۽ ويب تي ٻڌل ايپليڪيشن جيڪا ٽيم جي طور تي مختلف مرحلن ۾ ماڊل کي برقرار رکڻ لاءِ استعمال ڪئي ويندي آهي. ماڊل لائينج، ماڊل ورزننگ، آسان اسٽيج جي منتقلي، ۽ تشريح صرف ڪجھ صلاحيتون آھن جيڪي ماڊل رجسٽري ۾ موجود آھن.
هڪ ماڊل رجسٽري، پاڻ ماڊلز کان علاوه، معلومات (ميٽا ڊيٽا) تي مشتمل هوندي آهي ڊيٽا ۽ تربيتي ڪمن بابت جيڪي ماڊل ٺاهڻ لاءِ استعمال ڪيا ويندا آهن. ايم ايل ماڊلز لاءِ نسب ٺاهڻ لاءِ انهن گهربل انپٽس جو باخبر رکڻ ضروري آهي. انهي سلسلي ۾، هڪ ماڊل رجسٽري ڪم ڪري ٿو ساڳي طرح روايتي سافٽ ويئر جي نسخي سنڀالڻ سسٽم (مثال طور، Git، SVN) ۽ آرٽيڪل ريپوزٽريز (مثال طور، آرٽيڪلري، PyPI).
ماڊل رجسٽري هڪ فريم ورڪ آهي جيڪو ڊيٽا سائنسدانن ۽ مشين لرننگ انجنيئرن کي ٻين ٽيمن سان تعاون لاءِ پنهنجا ماڊل شايع ڪرڻ، جانچڻ، مانيٽر ڪرڻ، انتظام ڪرڻ ۽ ورهائڻ جي اجازت ڏئي ٿو. لازمي طور تي، ماڊل رجسٽري کي ملازمت ڏني ويندي آهي هڪ دفعو توهان پنهنجي جاچ واري مرحلي کي مڪمل ڪيو ۽ توهان جي نتيجن کي ٽيم ۽ اسٽيڪ هولڊرز سان حصيداري ڪرڻ لاءِ تيار آهيو.
MLflow ماڊل رجسٽري هڪ API ۽ يوزر انٽرفيس مهيا ڪري ٿي توهان جي ماڊلز کي منظم ڪرڻ ۽ انهن جي عمر کي مرڪزي هنڌ کان. ماڊل نسب، ماڊل ورزننگ، تشريح، ۽ اسٽيج ٽرانسشنز سڀ موجود آهن رجسٽري ذريعي.
MLflow ۾، هڪ رجسٽرڊ ماڊل اهو آهي جيڪو هڪ منفرد نالو ۽ ميٽا ڊيٽا سان، ماڊل ورزن، عبوري مرحلن، ۽ هڪ ماڊل نسب. ھڪڙي يا وڌيڪ ماڊل ورجن ھڪڙي رجسٽرڊ ماڊل ۾ ملي سگھن ٿا. هڪ نئون ماڊل ورزن 1 سمجهيو ويندو آهي جڏهن اهو رجسٽري ۾ رجسٽر ٿيل آهي. هيٺ ڏنل نسخو ساڳئي نالي سان ڪنهن به نئين ماڊل ۾ شامل ڪيو ويو آهي.
توهان ڪنهن به وقت ڪنهن به ماڊل ورزن تي هڪ قدم تفويض ڪري سگهو ٿا. بهرحال، مرحلا لازمي طور تي MLflow مرحلن جي تحت مقرر ڪيا وڃن جيڪي رسمي طور تي بيان ڪيا ويا آهن، جهڙوڪ اسٽيجنگ، پيداوار، ۽ آرڪائيو. ھڪڙو ماڊل ورزن ھڪڙي اسٽيج کان ٻئي ڏانھن منتقل ڪري سگھجي ٿو.
MLflow توهان کي اجازت ڏئي ٿو مارڪ ڊائون استعمال ڪرڻ لاءِ ٻنهي مٿين سطح جي ماڊل ۽ هر مخصوص ورزن کي تشريح ڪرڻ لاءِ. توھان شامل ڪري سگھو ٿا تفصيل سان گڏو گڏ ٻيون لاڳاپيل معلومات، جھڙوڪ الورورٿم جي وضاحت، طريقو، ۽ استعمال ٿيل ڊيٽا سيٽ.
اهم خصوصيتون
- UI يا API ذريعي ماڊل رجسٽري تائين رسائي حاصل ڪرڻ لاءِ جڏهن توهان جي پنهنجي ايم ايل فلو سرور کي ميزباني ڪري رهيا آهيو، توهان کي لازمي طور استعمال ڪرڻ گهرجي ڊيٽابيس جي پٺڀرائي وارو پس منظر اسٽور.
- ماڊل رجسٽري تائين رسائي ٿي سگھي ٿي MLflow ماڊل فليور يا MLflow ڪلائنٽ ٽريڪنگ API انٽرفيس ذريعي. توھان ڪري سگھو ٿا، مثال طور، ھڪڙو ماڊل رجسٽر ڪريو ھڪڙي MLflow تجربو هلائڻ دوران يا توھان جي سڀني تجربن جي ھلڻ کان پوء.
- نه هرڪو پنهنجي ماڊل کي MLflow استعمال ڪندي ٽريننگ شروع ڪندو. نتيجي طور، توھان وٽ ٿي سگھي ٿو ڪجھ ماڊلز MLflow استعمال ڪرڻ کان پھريائين. ماڊلز کي ٻيهر تربيت ڏيڻ بجاءِ، توهان صرف پنهنجي ذخيرو ٿيل ماڊلز کي ماڊل رجسٽري سان رجسٽر ڪرڻ چاهيو ٿا.
وڌيڪ معلومات لاء، توهان کي چيڪ ڪري سگهو ٿا سرڪاري دستاويز.
ٿڪل
MLflow هڪ بهترين ۽ مسلسل وڌندڙ ML لائف سائيڪل جو اوزار آهي. توھان ان کي پنھنجي موجوده اوزار ۽ پليٽ فارمن سان گڏ ملازمت ڪري سگھو ٿا.
اهو ڪيترن ئي پروگرامنگ ٻولين کي سپورٽ ڪري ٿو، جن ۾ پٿون، جاوا، ۽ آر شامل آهن. توهان پڻ جلدي ٽريڪ ڪري سگهو ٿا، محفوظ ڪري سگهو ٿا ۽ مختلف ماڊل ورزن جو مقابلو ڪري سگهو ٿا ان جي صارف دوست ڊيزائن جي مهرباني.
MLflow کي هڪ ڪوشش ڏيو ۽ اسان کي ٻڌايو ته توهان جو تجربو!
جواب ڇڏي وڃو