ภาคส่วนต่างๆ ทั่วโลกกำลังเริ่มลงทุนในแมชชีนเลิร์นนิง (ML) มากขึ้น
โมเดล ML สามารถเปิดตัวและดำเนินการโดยทีมผู้เชี่ยวชาญได้ตั้งแต่แรก แต่อุปสรรคที่ใหญ่ที่สุดประการหนึ่งคือการถ่ายทอดความรู้ที่ได้รับไปยังโมเดลถัดไป เพื่อให้สามารถขยายกระบวนการได้
เพื่อปรับปรุงและสร้างมาตรฐานกระบวนการที่เกี่ยวข้องกับการจัดการวงจรชีวิตของแบบจำลอง ทีมที่สร้างแบบจำลองการเรียนรู้ด้วยเครื่องกำลังใช้เทคนิค MLOps มากขึ้น
อ่านต่อเพื่อค้นหาข้อมูลเพิ่มเติมเกี่ยวกับเครื่องมือและแพลตฟอร์ม MLOps ที่ดีที่สุดที่มีอยู่ในปัจจุบัน และวิธีที่เครื่องมือเหล่านี้จะทำให้การเรียนรู้ของเครื่องง่ายขึ้นจากเครื่องมือ นักพัฒนา และจุดยืนของขั้นตอน
MLOps คืออะไร?
เทคนิคในการสร้างนโยบาย บรรทัดฐาน และแนวทางปฏิบัติที่ดีที่สุดสำหรับโมเดลแมชชีนเลิร์นนิงเรียกว่า "การดำเนินการแมชชีนเลิร์นนิง" หรือ "MLOps"
MLOps มีเป้าหมายเพื่อรับประกันวงจรชีวิตทั้งหมดของการพัฒนา ML ตั้งแต่แนวคิดไปจนถึงการใช้งาน ได้รับการจัดทำเป็นเอกสารและจัดการอย่างพิถีพิถันเพื่อผลลัพธ์ที่ดีที่สุด แทนที่จะใช้เวลาและทรัพยากรจำนวนมากโดยไม่มีกลยุทธ์
เป้าหมายของ MLOps คือการจัดทำแนวปฏิบัติที่ดีที่สุดในลักษณะที่ทำให้การพัฒนาการเรียนรู้ของเครื่องสามารถปรับขนาดได้มากขึ้นสำหรับตัวดำเนินการและนักพัฒนา ML ตลอดจนเพื่อเพิ่มคุณภาพและความปลอดภัยของโมเดล ML
บางคนอ้างถึง MLOps ว่า "DevOps สำหรับการเรียนรู้ของเครื่อง" เนื่องจากประสบความสำเร็จในการใช้หลักการ DevOps กับสาขาเฉพาะด้านของการพัฒนาเทคโนโลยี
นี่เป็นวิธีคิดที่มีประโยชน์เกี่ยวกับ MLO เพราะเช่นเดียวกับ DevOps ที่เน้นการแบ่งปันความรู้ การทำงานร่วมกัน และแนวทางปฏิบัติที่ดีที่สุดระหว่างทีมและเครื่องมือต่างๆ
MLOps มอบกรอบงานสำหรับนักพัฒนา นักวิทยาศาสตร์ข้อมูล และทีมปฏิบัติการสำหรับความร่วมมือ และด้วยเหตุนี้ จึงได้ผลิตแบบจำลอง ML ที่ทรงพลังที่สุด
ทำไมต้องใช้เครื่องมือ MLOps
เครื่องมือ MLOps สามารถทำหน้าที่ได้หลากหลายสำหรับทีม ML อย่างไรก็ตาม เครื่องมือเหล่านี้มักถูกแบ่งออกเป็นสองกลุ่ม: การจัดการแพลตฟอร์มและการจัดการส่วนประกอบแต่ละส่วน
แม้ว่าผลิตภัณฑ์ MLOps บางอย่างจะเน้นที่ฟังก์ชันหลักเดียวเท่านั้น เช่น การจัดการข้อมูลหรือเมตาดาต้า เครื่องมืออื่นๆ ใช้กลยุทธ์ที่ครอบคลุมมากขึ้น และจัดเตรียมแพลตฟอร์ม MLOps เพื่อควบคุมแง่มุมต่างๆ ของวงจรชีวิต ML
ค้นหาโซลูชัน MLOps ที่ช่วยทีมของคุณในการจัดการด้านการพัฒนา ML เหล่านี้ ไม่ว่าคุณจะกำลังมองหาผู้เชี่ยวชาญหรือเครื่องมือที่กว้างกว่า:
- การจัดการข้อมูล
- การออกแบบและการสร้างแบบจำลอง
- การจัดการโครงการและสถานที่ทำงาน
- การปรับใช้โมเดล ML และการบำรุงรักษาอย่างต่อเนื่อง
- การจัดการวงจรชีวิตตั้งแต่ต้นจนจบ ซึ่งโดยทั่วไปมีให้โดยแพลตฟอร์ม MLOps ที่ให้บริการเต็มรูปแบบ
เครื่องมือ MLOps
1. ม.ล.โฟลว์
วงจรชีวิตของแมชชีนเลิร์นนิงถูกควบคุมโดย MLflow แพลตฟอร์มโอเพนซอร์ส และรวมถึงการลงทะเบียนโมเดลส่วนกลาง การปรับใช้ และการทดลอง
MLflow สามารถใช้ได้กับทีมทุกขนาด ทั้งแบบเดี่ยวและแบบรวม ห้องสมุดไม่มีผลต่อเครื่องมือ
ภาษาการเขียนโปรแกรมและไลบรารีการเรียนรู้ของเครื่องสามารถใช้ประโยชน์ได้
เพื่อให้การฝึกอบรม ปรับใช้ และจัดการแอปพลิเคชันการเรียนรู้ของเครื่องได้ง่ายขึ้น MLFlow โต้ตอบกับเฟรมเวิร์กการเรียนรู้ของเครื่องจำนวนหนึ่ง ซึ่งรวมถึง TensorFlow และพิทอร์ช
นอกจากนี้ MLflow ยังมี API ที่ใช้งานง่ายซึ่งสามารถรวมไว้ในโปรแกรมหรือไลบรารีการเรียนรู้ของเครื่องที่มีอยู่ได้
MLflow มีคุณสมบัติหลักสี่ประการที่อำนวยความสะดวกในการติดตามและวางแผนการทดลอง:
- การติดตาม MLflow – API และ UI สำหรับการบันทึกพารามิเตอร์ของรหัสการเรียนรู้ของเครื่อง เวอร์ชัน ตัวชี้วัด และสิ่งประดิษฐ์ ตลอดจนสำหรับการแสดงและเปรียบเทียบผลลัพธ์ในภายหลัง
- โครงการ MLflow – รหัสการเรียนรู้ของเครื่องบรรจุภัณฑ์ในรูปแบบที่ใช้ซ้ำได้ ทำซ้ำได้สำหรับการถ่ายโอนไปยังการผลิตหรือการแบ่งปันกับนักวิทยาศาสตร์ข้อมูลอื่น ๆ
- MLflow Models – บำรุงรักษาและปรับใช้โมเดลกับช่วงของการให้บริการโมเดลและการอนุมานระบบจากไลบรารี ML ต่างๆ
- MLflow Model Registry – แหล่งจัดเก็บโมเดลส่วนกลางที่ช่วยให้สามารถจัดการอายุการใช้งานทั้งหมดของโมเดล MLflow ได้ ซึ่งรวมถึงการกำหนดเวอร์ชันโมเดล การเปลี่ยนขั้นตอน และหมายเหตุประกอบ
2. KubeFlow
กล่องเครื่องมือ ML สำหรับ Kubernetes เรียกว่า Kubeflow บรรจุภัณฑ์และการจัดการคอนเทนเนอร์ Docker ช่วยในการบำรุงรักษา ระบบการเรียนรู้ของเครื่อง.
ด้วยการลดความซับซ้อนของการรัน orchestration และการปรับใช้เวิร์กโฟลว์แมชชีนเลิร์นนิง จะช่วยส่งเสริมความสามารถในการปรับขนาดของโมเดลการเรียนรู้ของเครื่อง
เป็นโครงการโอเพนซอร์ซที่มีกลุ่มเครื่องมือเสริมและกรอบงานที่ได้รับการคัดสรรมาอย่างดี ซึ่งปรับให้เข้ากับความต้องการ ML ที่แตกต่างกัน
งานฝึกอบรม ML แบบยาว การทดลองด้วยตนเอง ความสามารถในการทำซ้ำ และความท้าทายของ DevOps ได้ด้วย Kubeflow Pipelines
สำหรับแมชชีนเลิร์นนิงหลายขั้นตอน รวมถึงการฝึกอบรม การพัฒนาไปป์ไลน์ และการบำรุงรักษา โน๊ตบุ๊ค Jupyter, Kubeflow นำเสนอบริการและการบูรณาการเฉพาะทาง
ทำให้ง่ายต่อการจัดการและติดตามอายุการใช้งานของปริมาณงาน AI ของคุณ รวมถึงการปรับใช้โมเดลแมชชีนเลิร์นนิง (ML) และไปป์ไลน์ข้อมูลกับคลัสเตอร์ Kubernetes
มันมี:
- โน้ตบุ๊กสำหรับใช้ SDK เพื่อโต้ตอบกับระบบ
- อินเทอร์เฟซผู้ใช้ (UI) สำหรับควบคุมและตรวจสอบการทำงาน งาน และการทดลอง
- เพื่อออกแบบโซลูชันแบบ end-to-end อย่างรวดเร็วโดยไม่ต้องสร้างใหม่ทุกครั้ง และนำส่วนประกอบและไปป์ไลน์กลับมาใช้ใหม่
- Kubeflow Pipelines เป็นส่วนประกอบหลักของ Kubeflow หรือการติดตั้งแบบสแตนด์อโลน
3. การควบคุมเวอร์ชันข้อมูล
โซลูชันการควบคุมเวอร์ชันโอเพนซอร์สสำหรับโปรเจ็กต์การเรียนรู้ของเครื่องเรียกว่า DVC หรือ Data Version Control
ไม่ว่าคุณจะเลือกภาษาใดก็ตาม มันเป็นเครื่องมือทดลองที่ช่วยในการกำหนดไปป์ไลน์
DVC ใช้โค้ด การกำหนดเวอร์ชันข้อมูล และความสามารถในการทำซ้ำเพื่อช่วยคุณประหยัดเวลาเมื่อคุณพบปัญหาเกี่ยวกับโมเดล ML เวอร์ชันก่อนหน้าของคุณ
นอกจากนี้ คุณสามารถใช้ไปป์ไลน์ DVC เพื่อฝึกโมเดลของคุณและแจกจ่ายให้กับสมาชิกในทีมของคุณ DVC สามารถจัดการการจัดระเบียบข้อมูลขนาดใหญ่และการกำหนดเวอร์ชันได้ และสามารถจัดเก็บข้อมูลในลักษณะที่เข้าถึงได้ง่าย
แม้ว่าจะมีคุณลักษณะการติดตามการทดสอบ (จำกัด) บางส่วน แต่ส่วนใหญ่จะเน้นที่ข้อมูลและการกำหนดเวอร์ชันและการจัดการไปป์ไลน์
มันมี:
- เป็นสตอเรจที่ไม่เชื่อเรื่องพระเจ้า ดังนั้นจึงสามารถใช้การจัดเก็บข้อมูลได้หลากหลายประเภท
- มันให้สถิติการติดตามเช่นกัน
- วิธีการที่สร้างไว้ล่วงหน้าในการรวมสเตจ ML เข้ากับ DAG และรันไปป์ไลน์ทั้งหมดตั้งแต่ต้นจนจบ
- การพัฒนาทั้งหมดของโมเดล ML แต่ละรุ่นสามารถติดตามได้โดยใช้โค้ดทั้งหมดและที่มาของข้อมูล
- ความสามารถในการทำซ้ำโดยรักษาการกำหนดค่าเริ่มต้น ป้อนข้อมูล และรหัสโปรแกรมสำหรับการทดสอบอย่างซื่อสัตย์
4. ช้าง
Pachyderm เป็นโปรแกรมควบคุมเวอร์ชันสำหรับการเรียนรู้ของเครื่องและวิทยาศาสตร์ข้อมูล คล้ายกับ DVC
นอกจากนี้ เนื่องจากมันถูกสร้างโดยใช้ นักเทียบท่าและ Kubernetesมันสามารถดำเนินการและปรับใช้แอปพลิเคชันการเรียนรู้ของเครื่องบนแพลตฟอร์มคลาวด์ใดก็ได้
Pachyderm รับประกันว่าข้อมูลแต่ละชิ้นที่ใช้ในแบบจำลองการเรียนรู้ของเครื่องสามารถติดตามและกำหนดเวอร์ชันได้
ใช้เพื่อสร้าง แจกจ่าย จัดการ และจับตาดูโมเดลการเรียนรู้ของเครื่อง การลงทะเบียนรุ่น ระบบการจัดการแบบจำลอง และกล่องเครื่องมือ CLI รวมอยู่ด้วย
นักพัฒนาสามารถสร้างระบบอัตโนมัติและขยายวงจรชีวิตการเรียนรู้ของเครื่องโดยใช้รากฐานข้อมูลของ Pachyderm ซึ่งรับประกันความสามารถในการทำซ้ำ
รองรับมาตรฐานการกำกับดูแลข้อมูลที่เข้มงวด ลดค่าใช้จ่ายในการประมวลผลและจัดเก็บข้อมูล และช่วยธุรกิจในการนำความคิดริเริ่มด้านวิทยาศาสตร์ข้อมูลออกสู่ตลาดได้รวดเร็วยิ่งขึ้น
5. โพลิแอกซอน
การใช้แพลตฟอร์ม Polyaxon จะทำให้โปรเจ็กต์แมชชีนเลิร์นนิงและแอปพลิเคชันการเรียนรู้เชิงลึกสามารถทำซ้ำและจัดการได้ตลอดวงจรชีวิต
Polyaxon สามารถโฮสต์และจัดการเครื่องมือ และสามารถวางไว้ในศูนย์ข้อมูลหรือผู้ให้บริการระบบคลาวด์ เช่น Torch, Tensorflow และ MXNet ซึ่งรองรับเฟรมเวิร์กการเรียนรู้เชิงลึกยอดนิยมทั้งหมด
เมื่อพูดถึงการประสานกัน Polyaxon ช่วยให้คุณใช้ประโยชน์สูงสุดจากคลัสเตอร์ของคุณโดยการกำหนดเวลางานและการทดสอบผ่าน CLI, แดชบอร์ด, SDK หรือ REST API
มันมี:
- คุณสามารถใช้เวอร์ชันโอเพนซอร์สได้ในขณะนี้ แต่ยังมีตัวเลือกสำหรับองค์กรอีกด้วย
- แม้ว่าจะครอบคลุมวงจรชีวิตทั้งหมด รวมถึงการประสานการวิ่ง แต่ก็มีความสามารถมากกว่านั้นอีกมาก
- ด้วยเอกสารอ้างอิงทางเทคนิค แนวทางการเริ่มต้นใช้งาน สื่อการเรียนรู้ คู่มือ บทช่วยสอน บันทึกการเปลี่ยนแปลง และอื่นๆ จึงเป็นแพลตฟอร์มที่มีการจัดทำเอกสารอย่างดี
- ด้วยแดชบอร์ดข้อมูลเชิงลึกการทดสอบ คุณสามารถจับตาดู ติดตาม และประเมินการทดสอบการเพิ่มประสิทธิภาพแต่ละรายการได้
6. ดาวหาง
ดาวหางเป็นแพลตฟอร์มสำหรับการเรียนรู้ด้วยเครื่องเมตาที่ติดตาม เปรียบเทียบ อธิบาย และปรับปรุงการทดลองและแบบจำลอง
คุณสามารถดูและเปรียบเทียบการทดสอบทั้งหมดของคุณได้ในที่เดียว
มันทำงานสำหรับงานแมชชีนเลิร์นนิง ทุกที่ที่ทำโค้ดของคุณ และกับไลบรารีแมชชีนเลิร์นนิง
ดาวหางเหมาะสำหรับกลุ่มบุคคล บุคคล สถาบันการศึกษา ธุรกิจ และใครก็ตามที่ต้องการเห็นภาพการทดลองอย่างรวดเร็ว ปรับปรุงการทำงาน และทำการทดลอง
นักวิทยาศาสตร์ด้านข้อมูลและทีมสามารถติดตาม ชี้แจง ปรับปรุง และเปรียบเทียบการทดลองและแบบจำลองโดยใช้ Comet แพลตฟอร์มการเรียนรู้เมตาแมชชีนที่โฮสต์ด้วยตนเองและบนคลาวด์
มันมี:
- มีความสามารถมากมายสำหรับสมาชิกในทีมในการแบ่งปันงาน
- มีการบูรณาการหลายอย่างที่ทำให้ง่ายต่อการเชื่อมโยงกับเทคโนโลยีอื่น ๆ
- ทำงานได้ดีกับไลบรารี ML ปัจจุบัน
- ดูแลการจัดการผู้ใช้
- เปิดใช้งานการเปรียบเทียบการทดสอบ ซึ่งรวมถึงการเปรียบเทียบโค้ด พารามิเตอร์ไฮเปอร์ เมตริก การคาดการณ์ การขึ้นต่อกัน และเมตริกของระบบ
- จัดเตรียมโมดูลเฉพาะสำหรับข้อมูลการมองเห็น เสียง ข้อความ และข้อมูลแบบตารางที่ช่วยให้คุณเห็นภาพตัวอย่าง
7. ออปทูน่า
Optuna เป็นระบบสำหรับการเพิ่มประสิทธิภาพไฮเปอร์พารามิเตอร์แบบอัตโนมัติที่สามารถนำไปใช้กับทั้งการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึกตลอดจนสาขาอื่นๆ
ประกอบด้วยอัลกอริธึมล้ำสมัยมากมายที่คุณสามารถเลือก (หรือลิงก์) ทำให้ง่ายต่อการแจกจ่ายการฝึกอบรมผ่านคอมพิวเตอร์จำนวนมาก และให้การแสดงภาพผลลัพธ์ที่น่าดึงดูดใจ
ไลบรารีแมชชีนเลิร์นนิงยอดนิยม เช่น PyTorch, TensorFlow, Keras, FastAI, sci-kit-learn, LightGBM และ XGBoost ถูกรวมเข้ากับไลบรารีนี้
มีอัลกอริธึมล้ำสมัยที่ช่วยให้ลูกค้าได้ผลลัพธ์เร็วขึ้นด้วยการลดตัวอย่างที่ดูไม่น่าเป็นไปได้อย่างรวดเร็ว
โดยใช้อัลกอริธึมแบบ Python จะทำการค้นหาไฮเปอร์พารามิเตอร์ในอุดมคติโดยอัตโนมัติ Optuna สนับสนุนการค้นหาไฮเปอร์พารามิเตอร์แบบขนานในหลายเธรดโดยไม่ต้องแก้ไขโค้ดดั้งเดิม
มันมี:
- รองรับการฝึกอบรมแบบกระจายบนคลัสเตอร์เช่นเดียวกับคอมพิวเตอร์เครื่องเดียว (หลายกระบวนการ) (หลายโหนด)
- รองรับเทคนิคการตัดแต่งหลายอย่างเพื่อเพิ่มความเร็วการบรรจบกัน (และใช้การคำนวณน้อยลง)
- มีการสร้างภาพข้อมูลที่มีศักยภาพหลากหลาย เช่น พล็อตแบบสไลซ์ พล็อตรูปร่าง และพิกัดคู่ขนาน
8. เคโดร
Kedro เป็นเฟรมเวิร์ก Python ฟรีสำหรับการเขียนโค้ดที่สามารถอัปเดตและดูแลสำหรับโครงการวิทยาศาสตร์ข้อมูล
โดยนำแนวคิดจากแนวทางปฏิบัติที่ดีที่สุดในวิศวกรรมซอฟต์แวร์มาสู่โค้ดแมชชีนเลิร์นนิง Python เป็นรากฐานของเครื่องมือประสานเวิร์กโฟลว์นี้
เพื่อให้กระบวนการ ML ของคุณง่ายขึ้นและแม่นยำยิ่งขึ้น คุณสามารถพัฒนาเวิร์กโฟลว์ที่ทำซ้ำได้ บำรุงรักษาได้ และเป็นโมดูล
Kedro รวมเอาหลักการทางวิศวกรรมซอฟต์แวร์ เช่น ความเป็นโมดูล การแยกความรับผิดชอบ และการกำหนดเวอร์ชันในสภาพแวดล้อมการเรียนรู้ของเครื่อง
บนพื้นฐานของ Cookiecutter Data Science จึงมีกรอบงานโครงการทั่วไปที่ปรับเปลี่ยนได้
ตัวเชื่อมต่อข้อมูลอย่างง่ายจำนวนหนึ่งที่ใช้ในการจัดเก็บและโหลดข้อมูลในระบบไฟล์และรูปแบบไฟล์ต่างๆ ได้รับการจัดการโดยแค็ตตาล็อกข้อมูล มันทำให้โปรเจ็กต์แมชชีนเลิร์นนิงมีประสิทธิภาพมากขึ้นและทำให้การสร้างไปป์ไลน์ข้อมูลง่ายขึ้น
มันมี:
- Kedro อนุญาตให้ปรับใช้เครื่องที่แยกย้ายกันไปหรืออยู่คนเดียว
- คุณสามารถทำการพึ่งพาโดยอัตโนมัติระหว่างโค้ด Python และการแสดงภาพเวิร์กโฟลว์โดยใช้ไปป์ไลน์ที่เป็นนามธรรม
- ด้วยการใช้โค้ดแบบโมดูลาร์ที่นำกลับมาใช้ใหม่ได้ เทคโนโลยีนี้ช่วยอำนวยความสะดวกในการทำงานร่วมกันเป็นทีมในระดับต่างๆ และปรับปรุงประสิทธิภาพการทำงานในสภาพแวดล้อมการเขียนโค้ด
- เป้าหมายหลักคือการเอาชนะข้อเสียของโน้ตบุ๊ก Jupyter สคริปต์แบบใช้ครั้งเดียวและโค้ดกาวโดยการเขียนโปรแกรมวิทยาศาสตร์ข้อมูลที่บำรุงรักษาได้
9. เบนโตะML
การสร้างปลายทาง API ของแมชชีนเลิร์นนิงทำได้ง่ายขึ้นด้วย BentoML
มีโครงสร้างพื้นฐานทั่วไปแต่มีการควบแน่นเพื่อย้ายโมเดลการเรียนรู้ของเครื่องที่เรียนรู้ไปสู่การผลิต
ช่วยให้คุณสามารถจัดแพ็คเกจโมเดลที่เรียนรู้เพื่อใช้ในการตั้งค่าการใช้งานจริง ตีความโดยใช้เฟรมเวิร์ก ML ใดก็ได้ รองรับทั้งการให้บริการแบบกลุ่มออฟไลน์และการให้บริการ API ออนไลน์
เซิร์ฟเวอร์โมเดลประสิทธิภาพสูงและเวิร์กโฟลว์ที่ยืดหยุ่นคือคุณสมบัติของ BentoML
นอกจากนี้ เซิร์ฟเวอร์ยังมีไมโครแบทช์ที่ปรับเปลี่ยนได้ แนวทางแบบครบวงจรสำหรับการจัดระเบียบโมเดลและการติดตามขั้นตอนการปรับใช้มีให้โดยแดชบอร์ด UI
จะไม่มีการหยุดทำงานของเซิร์ฟเวอร์เนื่องจากกลไกการทำงานเป็นแบบแยกส่วนและการกำหนดค่าสามารถใช้ซ้ำได้ เป็นแพลตฟอร์มที่ยืดหยุ่นสำหรับการจัดหา จัดระเบียบ และปรับใช้โมเดล ML
มันมี:
- มีการออกแบบโมดูลาร์ที่ปรับเปลี่ยนได้
- เปิดใช้งานการปรับใช้ในหลายแพลตฟอร์ม
- ไม่สามารถจัดการการปรับขนาดแนวนอนโดยอัตโนมัติ
- เปิดใช้งานรูปแบบแบบจำลองเดียว การจัดการแบบจำลอง บรรจุภัณฑ์แบบจำลอง และการให้บริการแบบจำลองที่มีประสิทธิภาพสูง
10. เซลดอน
นักวิทยาศาสตร์ข้อมูลสามารถสร้าง ปรับใช้ และจัดการโมเดลการเรียนรู้ของเครื่องและการทดลองในขนาดต่างๆ บน Kubernetes โดยใช้เฟรมเวิร์ก Seldon Core แบบโอเพนซอร์ส
TensorFlow, sci-kit-learn, Spark, R, Java และ H2O เป็นเพียงชุดเครื่องมือบางส่วนที่ได้รับการสนับสนุน
นอกจากนี้ยังเชื่อมต่อกับ Kubeflow และ OpenShift ของ RedHat คอร์ Seldon แปลงโมเดลการเรียนรู้ของเครื่อง (รุ่น ML) หรือตัวตัดภาษา (ภาษา เช่น Python, Java เป็นต้น) ให้เป็นไมโครเซอร์วิส REST/GRPC ที่ใช้งานจริง
หนึ่งในเครื่องมือ MLOps ที่ดีที่สุดสำหรับการปรับปรุงกระบวนการเรียนรู้ของเครื่องคือเครื่องมือนี้
ง่ายต่อการจัดเก็บโมเดล ML และทดสอบการใช้งานและความปลอดภัยโดยใช้ Seldon Core
มันมี:
- การทำให้โมเดลใช้งานได้ง่ายขึ้นด้วยทางเลือกต่างๆ เช่น การปรับใช้ Canary
- เพื่อให้เข้าใจว่าเหตุใดจึงมีการคาดการณ์เฉพาะ ให้ใช้ตัวอธิบายแบบจำลอง
- เมื่อเกิดปัญหาขึ้น ให้จับตาดูรุ่นการผลิตโดยใช้ระบบแจ้งเตือน
สรุป
MLOps สามารถช่วยทำให้การเรียนรู้ของเครื่องดีขึ้นได้ MLOps สามารถเพิ่มความเร็วในการปรับใช้ ทำให้การรวบรวมและการดีบักข้อมูลง่ายขึ้น และปรับปรุงการทำงานร่วมกันระหว่างวิศวกรและนักวิทยาศาสตร์ข้อมูล
เพื่อให้คุณเลือกเครื่องมือ MLOps ที่เหมาะสมกับความต้องการของคุณมากที่สุด โพสต์นี้จะตรวจสอบโซลูชัน MLOps ยอดนิยม 10 รายการ ซึ่งส่วนใหญ่เป็นโอเพนซอร์ส
เขียนความเห็น