ຫຼາຍໆຂະແໜງການທົ່ວໂລກເລີ່ມລົງທຶນຫຼາຍຂື້ນໃນການຮຽນຮູ້ເຄື່ອງຈັກ (ML).
ຮູບແບບ ML ສາມາດເປີດຕົວໃນເບື້ອງຕົ້ນແລະດໍາເນີນການໂດຍທີມງານຜູ້ຊ່ຽວຊານ, ແຕ່ຫນຶ່ງໃນອຸປະສັກທີ່ໃຫຍ່ທີ່ສຸດແມ່ນການໂອນຄວາມຮູ້ທີ່ໄດ້ຮັບໄປສູ່ຮູບແບບຕໍ່ໄປເພື່ອໃຫ້ຂະບວນການສາມາດຂະຫຍາຍໄດ້.
ເພື່ອປັບປຸງແລະມາດຕະຖານຂະບວນການທີ່ກ່ຽວຂ້ອງກັບການຄຸ້ມຄອງວົງຈອນຊີວິດຂອງຕົວແບບ, ເຕັກນິກ MLOps ຖືກໃຊ້ເພີ່ມຂຶ້ນໂດຍທີມງານທີ່ສ້າງແບບຈໍາລອງການຮຽນຮູ້ເຄື່ອງຈັກ.
ສືບຕໍ່ການອ່ານເພື່ອຊອກຫາເພີ່ມເຕີມກ່ຽວກັບບາງເຄື່ອງມືແລະແພລະຕະຟອມ MLOps ທີ່ດີທີ່ສຸດທີ່ມີຢູ່ໃນມື້ນີ້ແລະວິທີທີ່ພວກເຂົາສາມາດເຮັດໃຫ້ການຮຽນຮູ້ເຄື່ອງຈັກງ່າຍຂຶ້ນຈາກເຄື່ອງມື, ຜູ້ພັດທະນາ, ແລະຈຸດຢືນຂອງຂັ້ນຕອນ.
MLOps ແມ່ນຫຍັງ?
ເຕັກນິກໃນການສ້າງນະໂຍບາຍ, ມາດຕະຖານ, ແລະການປະຕິບັດທີ່ດີທີ່ສຸດສໍາລັບຮູບແບບການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນເປັນທີ່ຮູ້ຈັກເປັນ "ການດໍາເນີນງານການຮຽນຮູ້ເຄື່ອງຈັກ," ຫຼື "MLOps."
MLOps ມີຈຸດປະສົງເພື່ອຄໍ້າປະກັນຕະຫຼອດຊີວິດຂອງການພັດທະນາ ML - ຕັ້ງແຕ່ແນວຄວາມຄິດຈົນເຖິງການໃຊ້ງານ - ໄດ້ຖືກບັນທຶກຢ່າງພິຖີພິຖັນແລະຄຸ້ມຄອງເພື່ອໃຫ້ໄດ້ຜົນທີ່ດີທີ່ສຸດແທນທີ່ຈະລົງທຶນເວລາແລະຊັບພະຍາກອນຫຼາຍໃນມັນໂດຍບໍ່ມີຍຸດທະສາດ.
ເປົ້າຫມາຍຂອງ MLOps ແມ່ນເພື່ອກໍານົດການປະຕິບັດທີ່ດີທີ່ສຸດໃນຮູບແບບທີ່ເຮັດໃຫ້ການພັດທະນາການຮຽນຮູ້ເຄື່ອງຈັກສາມາດຂະຫຍາຍໄດ້ຫຼາຍຂື້ນສໍາລັບຜູ້ປະກອບການແລະຜູ້ພັດທະນາ ML, ເຊັ່ນດຽວກັນກັບການເສີມຂະຫຍາຍຄຸນນະພາບແລະຄວາມປອດໄພຂອງຕົວແບບ ML.
ບາງຄົນອ້າງເຖິງ MLOps ເປັນ "DevOps ສໍາລັບການຮຽນຮູ້ເຄື່ອງຈັກ" ເນື່ອງຈາກວ່າມັນປະສົບຜົນສໍາເລັດນໍາໃຊ້ຫຼັກການຂອງ DevOps ກັບຂົງເຂດການພັດທະນາເຕັກໂນໂລຢີທີ່ພິເສດກວ່າ.
ນີ້ແມ່ນວິທີທີ່ມີປະໂຫຍດໃນການຄິດກ່ຽວກັບ MLOps ເພາະວ່າ, ເຊັ່ນດຽວກັບ DevOps, ມັນເນັ້ນຫນັກໃສ່ການແບ່ງປັນຄວາມຮູ້, ການຮ່ວມມື, ແລະການປະຕິບັດທີ່ດີທີ່ສຸດລະຫວ່າງທີມງານແລະເຄື່ອງມື.
MLOps ໃຫ້ນັກພັດທະນາ, ນັກວິທະຍາສາດຂໍ້ມູນ, ແລະທີມງານປະຕິບັດງານທີ່ມີກອບສໍາລັບການຮ່ວມມືແລະ, ດັ່ງນັ້ນ, ການຜະລິດແບບຈໍາລອງ ML ທີ່ມີປະສິດທິພາບທີ່ສຸດ.
ເປັນຫຍັງຕ້ອງໃຊ້ເຄື່ອງມື MLOps?
ເຄື່ອງມື MLOps ສາມາດປະຕິບັດຫນ້າທີ່ຫລາກຫລາຍສໍາລັບທີມງານ ML, ຢ່າງໃດກໍຕາມ, ພວກມັນມັກຈະແບ່ງອອກເປັນສອງກຸ່ມ: ການຄຸ້ມຄອງເວທີແລະການຄຸ້ມຄອງອົງປະກອບສ່ວນບຸກຄົນ.
ໃນຂະນະທີ່ບາງຜະລິດຕະພັນຂອງ MLOps ສຸມໃສ່ພຽງແຕ່ການທໍາງານຫຼັກດຽວ, ເຊັ່ນ: ການຄຸ້ມຄອງຂໍ້ມູນຫຼື metadata, ເຄື່ອງມືອື່ນໆຮັບຮອງເອົາຍຸດທະສາດທີ່ກວມເອົາຫຼາຍກວ່າເກົ່າແລະສະຫນອງເວທີ MLOps ເພື່ອຄວບຄຸມຫຼາຍດ້ານຂອງວົງຈອນຊີວິດ ML.
ຊອກຫາວິທີແກ້ໄຂ MLOps ທີ່ຊ່ວຍທີມງານຂອງທ່ານໃນການຄຸ້ມຄອງພື້ນທີ່ການພັດທະນາ ML ເຫຼົ່ານີ້, ບໍ່ວ່າທ່ານຈະຊອກຫາຜູ້ຊ່ຽວຊານຫຼືເຄື່ອງມືທີ່ກວ້າງຂວາງກວ່າ:
- ການຈັດການຂໍ້ມູນ
- ການອອກແບບແລະການສ້າງແບບຈໍາລອງ
- ການຄຸ້ມຄອງໂຄງການ ແລະບ່ອນເຮັດວຽກ
- ການນຳໃຊ້ຕົວແບບ ML ແລະການຮັກສາຢ່າງຕໍ່ເນື່ອງ
- ການຄຸ້ມຄອງວົງຈອນຊີວິດນັບແຕ່ຕົ້ນຈົນຈົບ, ເຊິ່ງໂດຍປົກກະຕິແມ່ນສະຫນອງໃຫ້ໂດຍການບໍລິການຢ່າງເຕັມທີ່ເວທີ MLOps.
MLOps ເຄື່ອງມື
1. MLFlow
ວົງຈອນຊີວິດການຮຽນຮູ້ຂອງເຄື່ອງຈັກຖືກຄວບຄຸມໂດຍ MLflow ແພລດຟອມ open-source ແລະປະກອບມີການລົງທະບຽນແບບຈໍາລອງສູນກາງ, ການນຳໃຊ້ ແລະການທົດລອງ.
MLflow ສາມາດຖືກນໍາໃຊ້ໂດຍທີມງານຂະຫນາດໃດກໍ່ຕາມ, ທັງສ່ວນບຸກຄົນແລະລວມ. ຫ້ອງສະຫມຸດບໍ່ມີເຄື່ອງມື.
ທຸກໆພາສາການຂຽນໂປລແກລມແລະຫ້ອງສະຫມຸດການຮຽນຮູ້ເຄື່ອງຈັກສາມາດນໍາໃຊ້ມັນໄດ້.
ເພື່ອເຮັດໃຫ້ມັນງ່າຍກວ່າໃນການຝຶກອົບຮົມ, ນຳໃຊ້, ແລະຈັດການແອັບພລິເຄຊັນການຮຽນຮູ້ເຄື່ອງຈັກ, MLFlow ພົວພັນກັບກອບການເຮັດວຽກຂອງເຄື່ອງຈັກ, ລວມທັງ TensorFlow ແລະ Pytorg.
ນອກຈາກນັ້ນ, MLflow ສະຫນອງ APIs ທີ່ງ່າຍຕໍ່ການໃຊ້ທີ່ສາມາດຖືກລວມເຂົ້າໃນໂຄງການການຮຽນຮູ້ເຄື່ອງຈັກຫຼືຫ້ອງສະຫມຸດທີ່ມີຢູ່.
MLflow ມີສີ່ລັກສະນະທີ່ສໍາຄັນທີ່ອໍານວຍຄວາມສະດວກໃນການຕິດຕາມແລະການວາງແຜນການທົດລອງ:
- ການຕິດຕາມ MLflow - API ແລະ UI ສໍາລັບການບັນທຶກຕົວກໍານົດການລະຫັດການຮຽນຮູ້ເຄື່ອງຈັກ, ຮຸ່ນ, metrics, ແລະ artifacts ເຊັ່ນດຽວກັນກັບການສະແດງຜົນຕໍ່ມາແລະກົງກັນຂ້າມກັບຜົນໄດ້ຮັບ.
- ໂຄງການ MLflow - ລະຫັດການຮຽນຮູ້ເຄື່ອງຫຸ້ມຫໍ່ໃນຮູບແບບທີ່ສາມາດນໍາມາໃຊ້ຄືນໄດ້, ສາມາດແຜ່ພັນໄດ້ສໍາລັບການໂອນໄປຫາການຜະລິດຫຼືແບ່ງປັນກັບນັກວິທະຍາສາດຂໍ້ມູນອື່ນໆ.
- MLflow Models - ການຮັກສາແລະ ນຳ ໃຊ້ແບບຈໍາລອງໄປສູ່ລະບົບການໃຫ້ບໍລິການແບບຈໍາລອງແລະ inference ຈາກຫ້ອງສະຫມຸດ ML ຕ່າງໆ.
- MLflow Model Registry – ຮ້ານຄ້າຕົວແບບສູນກາງທີ່ຊ່ວຍໃຫ້ການຄຸ້ມຄອງການຮ່ວມມືຂອງອາຍຸການທັງຫມົດຂອງຕົວແບບ MLflow, ລວມທັງການສ້າງແບບຈໍາລອງ, ການປ່ຽນຂັ້ນຕອນ, ແລະຄໍາບັນຍາຍ.
2. KubeFlow
ກ່ອງເຄື່ອງມື ML ສໍາລັບ Kubernetes ຖືກເອີ້ນວ່າ Kubeflow. ການຫຸ້ມຫໍ່ແລະການຄຸ້ມຄອງຕູ້ຄອນເທນເນີ Docker, ການຊ່ວຍເຫຼືອໃນການຮັກສາ ລະບົບການຮຽນຮູ້ເຄື່ອງຈັກ.
ໂດຍການເຮັດໃຫ້ການແລ່ນ orchestration ງ່າຍ ແລະການນຳໃຊ້ຂັ້ນຕອນການເຮັດວຽກຂອງການຮຽນຮູ້ເຄື່ອງຈັກ, ມັນສົ່ງເສີມການຂະຫຍາຍຕົວແບບການຮຽນຮູ້ເຄື່ອງຈັກ.
ມັນເປັນໂຄງການ open-source ທີ່ປະກອບມີກຸ່ມທີ່ເລືອກຢ່າງລະມັດລະວັງຂອງເຄື່ອງມືເສີມແລະກອບທີ່ເຫມາະສົມກັບຄວາມຕ້ອງການ ML ທີ່ແຕກຕ່າງກັນ.
ວຽກງານການຝຶກອົບຮົມ ML ຍາວ, ການທົດລອງຄູ່ມື, ການເຮັດເລື້ມຄືນ, ແລະການທ້າທາຍ DevOps ສາມາດຈັດການກັບ Kubeflow Pipelines.
ສໍາລັບຫຼາຍໆຂັ້ນຕອນຂອງການຮຽນຮູ້ເຄື່ອງຈັກ, ລວມທັງການຝຶກອົບຮົມ, ການພັດທະນາທໍ່, ແລະການບໍາລຸງຮັກສາ ປື້ມບັນທຶກ Jupyter, Kubeflow ໃຫ້ບໍລິການພິເສດແລະການເຊື່ອມໂຍງ.
ມັນເຮັດໃຫ້ມັນງ່າຍດາຍໃນການຈັດການ ແລະຕິດຕາມຕະຫຼອດຊີວິດຂອງວຽກ AI ຂອງທ່ານເຊັ່ນດຽວກັນກັບການນໍາໄປໃຊ້ແບບຈໍາລອງການຮຽນຮູ້ເຄື່ອງຈັກ (ML) ແລະທໍ່ຂໍ້ມູນໄປຫາກຸ່ມ Kubernetes.
ມັນສະເຫນີ:
- ປື້ມບັນທຶກສໍາລັບການນໍາໃຊ້ SDK ເພື່ອພົວພັນກັບລະບົບ
- ການໂຕ້ຕອບຜູ້ໃຊ້ (UI) ສໍາລັບການຄວບຄຸມແລະການຕິດຕາມການແລ່ນ, ວຽກ, ແລະການທົດລອງ
- ການອອກແບບການແກ້ໄຂຂັ້ນຕົ້ນເຖິງຈຸດຈົບຢ່າງວ່ອງໄວໂດຍບໍ່ຈໍາເປັນຕ້ອງສ້າງໃຫມ່ໃນແຕ່ລະຄັ້ງ, ແລະນໍາໃຊ້ອົງປະກອບແລະທໍ່ຄືນໃຫມ່.
- ໃນຖານະເປັນອົງປະກອບທີ່ສໍາຄັນຂອງ Kubeflow ຫຼືເປັນການຕິດຕັ້ງແບບດ່ຽວ, Kubeflow Pipelines ໄດ້ຖືກສະເຫນີ.
3. ການຄວບຄຸມເວີຊັນຂໍ້ມູນ
ການແກ້ໄຂການຄວບຄຸມເວີຊັນເປີດສໍາລັບໂຄງການການຮຽນຮູ້ເຄື່ອງຈັກເອີ້ນວ່າ DVC, ຫຼື Data Version Control.
ພາສາໃດກໍ່ຕາມທີ່ທ່ານເລືອກ, ມັນເປັນເຄື່ອງມືທົດລອງທີ່ຊ່ວຍໃນຄໍານິຍາມຂອງທໍ່.
DVC ໃຊ້ລະຫັດ, ສະບັບຂໍ້ມູນ, ແລະການສືບພັນເພື່ອຊ່ວຍໃຫ້ທ່ານປະຫຍັດເວລາເມື່ອທ່ານພົບບັນຫາກັບຮູບແບບ ML ຮຸ່ນກ່ອນຫນ້າຂອງທ່ານ.
ນອກຈາກນັ້ນ, ທ່ານສາມາດນໍາໃຊ້ທໍ່ DVC ເພື່ອຝຶກອົບຮົມຕົວແບບຂອງທ່ານແລະແຈກຢາຍມັນໃຫ້ກັບສະມາຊິກທີມຂອງທ່ານ. ການຈັດຕັ້ງຂໍ້ມູນໃຫຍ່ແລະການສ້າງເວີຊັນສາມາດໄດ້ຮັບການຈັດການໂດຍ DVC, ແລະຂໍ້ມູນສາມາດໄດ້ຮັບການເກັບຮັກສາໄວ້ໃນລັກສະນະທີ່ສາມາດເຂົ້າເຖິງໄດ້ຢ່າງງ່າຍດາຍ.
ເຖິງແມ່ນວ່າມັນປະກອບມີບາງ (ຈໍາກັດ) ລັກສະນະການຕິດຕາມການທົດລອງ, ມັນສ່ວນຫຼາຍແມ່ນສຸມໃສ່ການສະບັບຂໍ້ມູນແລະທໍ່ແລະການຄຸ້ມຄອງ.
ມັນສະເຫນີ:
- ມັນເປັນການເກັບຮັກສາທີ່ບໍ່ເຊື່ອຖື, ສະນັ້ນມັນເປັນໄປໄດ້ທີ່ຈະຈ້າງຄວາມຫຼາກຫຼາຍຂອງປະເພດການເກັບຮັກສາ.
- ມັນສະຫນອງສະຖິຕິການຕິດຕາມເຊັ່ນດຽວກັນ.
- ວິທີການທີ່ສ້າງຂຶ້ນກ່ອນຂອງການເຂົ້າຮ່ວມຂັ້ນຕອນ ML ເຂົ້າໄປໃນ DAG ແລະແລ່ນທໍ່ທັງຫມົດຕັ້ງແຕ່ຕົ້ນຈົນຈົບ.
- ການພັດທະນາທັງໝົດຂອງແຕ່ລະຕົວແບບ ML ສາມາດຕິດຕາມໄດ້ໂດຍໃຊ້ລະຫັດທັງໝົດ ແລະຂໍ້ມູນການພິສູດ.
- ການສືບພັນໂດຍການຮັກສາການຕັ້ງຄ່າເບື້ອງຕົ້ນ, ການປ້ອນຂໍ້ມູນ ແລະລະຫັດໂຄງການຢ່າງສັດຊື່ສຳລັບການທົດລອງ.
4. ປາchyderm
Pachyderm ເປັນໂຄງການຄວບຄຸມສະບັບສໍາລັບການຮຽນຮູ້ເຄື່ອງຈັກແລະວິທະຍາສາດຂໍ້ມູນ, ຄ້າຍຄືກັນກັບ DVC.
ນອກຈາກນັ້ນ, ເນື່ອງຈາກວ່າມັນຖືກສ້າງຂຶ້ນໂດຍໃຊ້ Docker ແລະ Kubernetes, ມັນສາມາດປະຕິບັດແລະນໍາໃຊ້ຄໍາຮ້ອງສະຫມັກການຮຽນຮູ້ເຄື່ອງຈັກໃນເວທີຟັງໄດ້.
Pachyderm ຮັບປະກັນວ່າຂໍ້ມູນແຕ່ລະອັນທີ່ບໍລິໂພກເຂົ້າໄປໃນຮູບແບບການຮຽນຮູ້ເຄື່ອງຈັກສາມາດຖືກຕິດຕາມຄືນແລະສະບັບ.
ມັນຖືກນໍາໃຊ້ເພື່ອສ້າງ, ແຈກຢາຍ, ຈັດການ, ແລະຕິດຕາມຮູບແບບການຮຽນຮູ້ຂອງເຄື່ອງຈັກ. ການລົງທະບຽນຕົວແບບ, ລະບົບການຈັດການແບບຈໍາລອງ, ແລະກ່ອງເຄື່ອງມື CLI ແມ່ນລວມທັງຫມົດ.
ນັກພັດທະນາສາມາດອັດຕະໂນມັດແລະຂະຫຍາຍວົງຈອນການຮຽນຮູ້ເຄື່ອງຈັກຂອງເຂົາເຈົ້າໂດຍໃຊ້ພື້ນຖານຂໍ້ມູນຂອງ Pachyderm, ເຊິ່ງຍັງຮັບປະກັນການເຮັດຊ້ໍາອີກ.
ມັນສະຫນັບສະຫນູນມາດຕະຖານການຄຸ້ມຄອງຂໍ້ມູນທີ່ເຂັ້ມງວດ, ຫຼຸດຜ່ອນຄ່າໃຊ້ຈ່າຍໃນການປຸງແຕ່ງຂໍ້ມູນແລະການເກັບຮັກສາ, ແລະຊ່ວຍທຸລະກິດໃນການນໍາຂໍ້ລິເລີ່ມວິທະຍາສາດຂໍ້ມູນຂອງພວກເຂົາໄປສູ່ຕະຫຼາດຢ່າງໄວວາ.
5. ໂພລີອາຊອນ
ການນໍາໃຊ້ແພລະຕະຟອມ Polyaxon, ໂຄງການການຮຽນຮູ້ເຄື່ອງຈັກແລະຄໍາຮ້ອງສະຫມັກການຮຽນຮູ້ເລິກສາມາດ replicated ແລະຄຸ້ມຄອງຕະຫຼອດຊີວິດຂອງເຂົາເຈົ້າ.
Polyaxon ສາມາດເປັນເຈົ້າພາບແລະຄຸ້ມຄອງເຄື່ອງມື, ແລະມັນສາມາດຖືກຈັດໃສ່ໃນສູນຂໍ້ມູນຫຼືຜູ້ໃຫ້ບໍລິການຟັງ. ເຊັ່ນ: Torch, Tensorflow, ແລະ MXNet, ເຊິ່ງສະຫນັບສະຫນູນທຸກກອບການຮຽນຮູ້ເລິກເຊິ່ງທີ່ສຸດ.
ໃນເວລາທີ່ມັນມາກັບ orchestration, Polyaxon ຊ່ວຍໃຫ້ທ່ານສາມາດໃຊ້ປະໂຫຍດສູງສຸດຈາກກຸ່ມຂອງທ່ານໂດຍການກໍານົດເວລາວຽກງານແລະການທົດສອບຜ່ານ CLI, dashboard, SDKs, ຫຼື REST API ຂອງພວກເຂົາ.
ມັນສະເຫນີ:
- ທ່ານສາມາດນໍາໃຊ້ສະບັບແຫຼ່ງເປີດໃນປັດຈຸບັນ, ແຕ່ວ່າມັນຍັງມີທາງເລືອກສໍາລັບການບໍລິສັດ.
- ເຖິງແມ່ນວ່າມັນກວມເອົາວົງຈອນຊີວິດທີ່ສົມບູນ, ລວມທັງການແລ່ນ orchestration, ມັນມີຄວາມສາມາດຫຼາຍ.
- ດ້ວຍເອກະສານອ້າງອິງດ້ານວິຊາການ, ການເລີ່ມຕົ້ນຄໍາແນະນໍາ, ອຸປະກອນການຮຽນຮູ້, ຄູ່ມື, tutorials, changelogs, ແລະອື່ນໆ, ມັນເປັນເວທີທີ່ມີເອກະສານທີ່ດີ.
- ດ້ວຍ dashboard ຄວາມເຂົ້າໃຈຂອງການທົດລອງ, ມັນເປັນໄປໄດ້ທີ່ຈະຕິດຕາມ, ຕິດຕາມ, ແລະປະເມີນແຕ່ລະການທົດລອງການເພີ່ມປະສິດທິພາບ.
6. Comet
Comet ເປັນເວທີສໍາລັບການຮຽນຮູ້ເຄື່ອງຈັກ meta ທີ່ຕິດຕາມ, ກົງກັນຂ້າມ, ອະທິບາຍ, ແລະປັບປຸງການທົດລອງແລະແບບຈໍາລອງ.
ການທົດລອງທັງໝົດຂອງທ່ານສາມາດເຫັນໄດ້ ແລະປຽບທຽບຢູ່ໃນບ່ອນດຽວ.
ມັນໃຊ້ໄດ້ກັບທຸກໜ້າວຽກການຮຽນຮູ້ຂອງເຄື່ອງຈັກ, ຢູ່ບ່ອນໃດກໍໄດ້ທີ່ລະຫັດຂອງເຈົ້າຖືກປະຕິບັດ, ແລະກັບຫ້ອງສະໝຸດການຮຽນຮູ້ເຄື່ອງຈັກໃດກໍໄດ້.
Comet ແມ່ນເຫມາະສົມສໍາລັບກຸ່ມ, ບຸກຄົນ, ສະຖາບັນການສຶກສາ, ທຸລະກິດ, ແລະຜູ້ອື່ນທີ່ຕ້ອງການໃຫ້ເຫັນພາບການທົດລອງຢ່າງໄວວາ, ປັບປຸງການເຮັດວຽກ, ແລະດໍາເນີນການທົດລອງ.
ນັກວິທະຍາສາດຂໍ້ມູນແລະທີມງານສາມາດຕິດຕາມ, ຊີ້ແຈງ, ປັບປຸງ, ແລະປຽບທຽບການທົດລອງແລະແບບຈໍາລອງໂດຍໃຊ້ແພລະຕະຟອມການຮຽນຮູ້ເຄື່ອງຈັກ meta-based ຕົນເອງແລະ cloud-based Comet.
ມັນສະເຫນີ:
- ຄວາມສາມາດຫຼາຍຢ່າງມີໃຫ້ສະມາຊິກໃນທີມເພື່ອແບ່ງປັນວຽກງານ.
- ມັນມີການເຊື່ອມໂຍງຫຼາຍຢ່າງທີ່ເຮັດໃຫ້ມັນງ່າຍດາຍທີ່ຈະເຊື່ອມໂຍງມັນກັບເຕັກໂນໂລຢີອື່ນໆ
- ເຮັດວຽກໄດ້ດີກັບຫ້ອງສະຫມຸດ ML ໃນປັດຈຸບັນ
- ເບິ່ງແຍງການຈັດການຜູ້ໃຊ້
- ການປຽບທຽບການທົດລອງໄດ້ຖືກເປີດໃຊ້, ລວມທັງການປຽບທຽບລະຫັດ, hyperparameters, metrics, ການຄາດຄະເນ, ການຂຶ້ນກັບ, ແລະ metrics ລະບົບ.
- ສະຫນອງໂມດູນທີ່ແຕກຕ່າງກັນສໍາລັບການວິໄສທັດ, ສຽງ, ຂໍ້ຄວາມ, ແລະຂໍ້ມູນຕາຕະລາງທີ່ຊ່ວຍໃຫ້ທ່ານສາມາດເບິ່ງເຫັນຕົວຢ່າງ.
7. Optuna
Optuna ເປັນລະບົບສໍາລັບການເພີ່ມປະສິດທິພາບຂອງ hyperparameter ອັດຕະໂນມັດທີ່ສາມາດຖືກນໍາໃຊ້ກັບການຮຽນຮູ້ຂອງເຄື່ອງຈັກແລະການຮຽນຮູ້ເລິກເຊັ່ນດຽວກັນກັບສາຂາອື່ນໆ.
ມັນມີຫຼາກຫຼາຍຂອງສູດການຄິດໄລ່ການຕັດແຂບຈາກທີ່ທ່ານສາມາດເລືອກ (ຫຼືການເຊື່ອມຕໍ່), ເຮັດໃຫ້ມັນງ່າຍດາຍຫຼາຍທີ່ຈະແຈກຢາຍການຝຶກອົບຮົມໃນໄລຍະຄອມພິວເຕີຈໍານວນຫລາຍ, ແລະສະຫນອງການເບິ່ງເຫັນຜົນໄດ້ຮັບທີ່ຫນ້າສົນໃຈ.
ຫ້ອງສະຫມຸດການຮຽນຮູ້ເຄື່ອງຈັກທີ່ນິຍົມເຊັ່ນ PyTorch, TensorFlow, Keras, FastAI, sci-kit-learn, LightGBM, ແລະ XGBoost ແມ່ນລວມເຂົ້າກັບມັນ.
ມັນສະຫນອງສູດການຄິດໄລ່ທີ່ທັນສະ ໄໝ ທີ່ຊ່ວຍໃຫ້ລູກຄ້າໄດ້ຮັບຜົນໄດ້ຮັບຢ່າງໄວວາໂດຍການຫຼຸດຜ່ອນຕົວຢ່າງທີ່ເບິ່ງຄືວ່າບໍ່ສົດໃສຢ່າງໄວວາ.
ການນໍາໃຊ້ສູດການຄິດໄລ່ທີ່ອີງໃສ່ Python, ມັນອັດຕະໂນມັດຊອກຫາ hyperparameters ທີ່ເຫມາະສົມ. Optuna ຊຸກຍູ້ການຄົ້ນຫາ hyperparameter ຂະຫນານໃນທົ່ວຫຼາຍຫົວຂໍ້ໂດຍບໍ່ມີການປ່ຽນແປງລະຫັດຕົ້ນສະບັບ.
ມັນສະເຫນີ:
- ມັນສະຫນັບສະຫນູນການແຈກຢາຍການຝຶກອົບຮົມໃນກຸ່ມເຊັ່ນດຽວກັນກັບຄອມພິວເຕີດຽວ (multi-process) (multi-node)
- ມັນສະຫນັບສະຫນູນເຕັກນິກການຕັດຈໍານວນຫນຶ່ງເພື່ອເລັ່ງການລວມເຂົ້າກັນ (ແລະໃຊ້ຄໍານວນຫນ້ອຍ)
- ມັນມີຄວາມຫລາກຫລາຍຂອງການສະແດງພາບທີ່ມີທ່າແຮງ, ເຊັ່ນ: ແຜ່ນບາງໆ, ດິນຕອນ contour, ແລະພິກັດຂະຫນານ.
8. ເຄໂດຣ
Kedro ເປັນກອບ Python ຟຣີສໍາລັບການຂຽນລະຫັດທີ່ສາມາດປັບປຸງແລະຮັກສາສໍາລັບໂຄງການວິທະຍາສາດຂໍ້ມູນ.
ມັນນໍາເອົາແນວຄວາມຄິດຈາກການປະຕິບັດທີ່ດີທີ່ສຸດໃນວິສະວະກໍາຊອບແວໄປສູ່ລະຫັດການຮຽນຮູ້ເຄື່ອງຈັກ. Python ແມ່ນພື້ນຖານຂອງເຄື່ອງມື orchestration workflow ນີ້.
ເພື່ອເຮັດໃຫ້ຂະບວນການ ML ຂອງທ່ານງ່າຍດາຍແລະຊັດເຈນກວ່າ, ທ່ານສາມາດພັດທະນາຂະບວນການເຮັດວຽກທີ່ຜະລິດຄືນໄດ້, ຮັກສາໄດ້, ແລະ modular.
Kedro ຮວມເອົາຫຼັກການດ້ານວິສະວະກຳຊອບແວ ເຊັ່ນ: modularity, ການແຍກຄວາມຮັບຜິດຊອບ, ແລະການສ້າງເວີຊັນເຂົ້າໃນສະພາບແວດລ້ອມການຮຽນຮູ້ຂອງເຄື່ອງຈັກ.
ບົນພື້ນຖານຂອງ Cookiecutter Data Science, ມັນສະຫນອງກອບໂຄງການທົ່ວໄປ, ສາມາດປັບຕົວໄດ້.
ຕົວເຊື່ອມຕໍ່ຂໍ້ມູນແບບງ່າຍໆຈຳນວນໜຶ່ງທີ່ໃຊ້ໃນການຈັດເກັບ ແລະໂຫຼດຂໍ້ມູນໃນທົ່ວລະບົບໄຟລ໌ ແລະ ຮູບແບບໄຟລ໌ຫຼາຍອັນ, ຖືກຈັດການໂດຍລາຍການຂໍ້ມູນ. ມັນເຮັດໃຫ້ໂຄງການການຮຽນຮູ້ເຄື່ອງຈັກມີປະສິດທິພາບຫຼາຍຂຶ້ນ ແລະເຮັດໃຫ້ມັນງ່າຍຂຶ້ນໃນການສ້າງທໍ່ຂໍ້ມູນ.
ມັນສະເຫນີ:
- Kedro ອະນຸຍາດໃຫ້ສໍາລັບການກະແຈກກະຈາຍຫຼືການປະຕິບັດເຄື່ອງດຽວ.
- ທ່ານສາມາດເຮັດໃຫ້ການເພິ່ງພາອາໄສອັດຕະໂນມັດລະຫວ່າງລະຫັດ Python ແລະການເບິ່ງເຫັນ workflow ໂດຍໃຊ້ຕົວຫຍໍ້ຂອງທໍ່.
- ໂດຍຜ່ານການນໍາໃຊ້ລະຫັດ modular, reusable, ເຕັກໂນໂລຊີນີ້ອໍານວຍຄວາມສະດວກໃນການຮ່ວມມືທີມງານໃນຫຼາຍລະດັບແລະປັບປຸງຜົນຜະລິດໃນສະພາບແວດລ້ອມການເຂົ້າລະຫັດ.
- ເປົ້າຫມາຍຕົ້ນຕໍແມ່ນເພື່ອເອົາຊະນະຂໍ້ບົກຜ່ອງຂອງປື້ມບັນທຶກ Jupyter, ສະຄິບດຽວ, ແລະລະຫັດກາວໂດຍການຂຽນໂຄງການວິທະຍາສາດຂໍ້ມູນທີ່ສາມາດຮັກສາໄວ້.
9. BentoML
ການສ້າງຈຸດສິ້ນສຸດ API ຂອງການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນເຮັດໃຫ້ງ່າຍຂຶ້ນດ້ວຍ BentoML.
ມັນສະຫນອງພື້ນຖານໂຄງລ່າງແບບປົກກະຕິແຕ່ condensed ເພື່ອຍ້າຍຮູບແບບການຮຽນຮູ້ເຄື່ອງຈັກເຂົ້າໄປໃນການຜະລິດ.
ມັນຊ່ວຍໃຫ້ທ່ານສາມາດຫຸ້ມຫໍ່ແບບຈໍາລອງທີ່ໄດ້ຮຽນຮູ້ເພື່ອໃຊ້ໃນການຕັ້ງຄ່າການຜະລິດ, ຕີລາຄາພວກມັນໂດຍໃຊ້ກອບ ML. ທັງການບໍລິການ batch ອອບໄລນ໌ ແລະການບໍລິການ API ອອນລາຍແມ່ນຮອງຮັບ.
ເຊີບເວີແບບຈໍາລອງທີ່ມີປະສິດທິພາບສູງແລະຂະບວນການເຮັດວຽກທີ່ມີຄວາມຍືດຫຍຸ່ນແມ່ນລັກສະນະຂອງ BentoML.
ນອກຈາກນັ້ນ, ເຄື່ອງແມ່ຂ່າຍສະຫນອງການປັບຕົວ micro-batching. ວິທີການທີ່ເປັນເອກະພາບໃນການຈັດຕັ້ງຕົວແບບ ແລະການຕິດຕາມຂັ້ນຕອນການນຳໃຊ້ແມ່ນສະໜອງໃຫ້ໂດຍ dashboard UI.
ຈະບໍ່ມີການຢຸດເວລາຂອງເຊີບເວີເພາະວ່າກົນໄກການເຮັດວຽກແມ່ນແບບໂມດູລາ ແລະການຕັ້ງຄ່າສາມາດນຳໃຊ້ຄືນໄດ້. ມັນເປັນເວທີທີ່ປ່ຽນແປງໄດ້ສໍາລັບການສະຫນອງ, ການຈັດຕັ້ງ, ແລະການນໍາໃຊ້ຕົວແບບ ML.
ມັນສະເຫນີ:
- ມັນມີການອອກແບບ modular ທີ່ສາມາດປັບຕົວໄດ້.
- ມັນເຮັດໃຫ້ການນໍາໃຊ້ໃນທົ່ວຫຼາຍເວທີ.
- ມັນບໍ່ສາມາດຈັດການການປັບຂະຫນາດຕາມລວງນອນໂດຍອັດຕະໂນມັດ.
- ມັນຊ່ວຍໃຫ້ຮູບແບບຕົວແບບດຽວ, ການຄຸ້ມຄອງແບບຈໍາລອງ, ການຫຸ້ມຫໍ່ແບບຈໍາລອງ, ແລະການຮັບໃຊ້ຮູບແບບທີ່ມີປະສິດທິພາບສູງ.
10. ເຊລດອນ
ນັກວິທະຍາສາດຂໍ້ມູນສາມາດສ້າງ, ນຳໃຊ້, ແລະຈັດການຮູບແບບການຮຽນຮູ້ຂອງເຄື່ອງຈັກ ແລະການທົດລອງຂະໜາດໃຫຍ່ໃນ Kubernetes ໂດຍໃຊ້ກອບການເປີດ Seldon Core.
TensorFlow, sci-kit-learn, Spark, R, Java, ແລະ H2O ແມ່ນພຽງແຕ່ສອງສາມຊຸດເຄື່ອງມືທີ່ໄດ້ຮັບການສະຫນັບສະຫນູນຈາກມັນ.
ມັນຍັງພົວພັນກັບ Kubeflow ແລະ OpenShift ຂອງ RedHat. ຫຼັກ Seldon ຫັນປ່ຽນຮູບແບບການຮຽນຮູ້ເຄື່ອງຈັກ (ແບບຈໍາລອງ ML) ຫຼືຕົວຫໍ່ພາສາ (ພາສາເຊັ່ນ Python, Java, ແລະອື່ນໆ) ໄປສູ່ການຜະລິດ microservices REST/GRPC.
ຫນຶ່ງໃນເຄື່ອງມື MLOps ທີ່ດີທີ່ສຸດສໍາລັບການປັບປຸງຂະບວນການການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນອັນນີ້.
ມັນງ່າຍດາຍທີ່ຈະບັນຈຸຕົວແບບ ML ແລະການທົດສອບສໍາລັບການນໍາໃຊ້ແລະຄວາມປອດໄພໂດຍໃຊ້ Seldon Core.
ມັນສະເຫນີ:
- ການນຳໃຊ້ຕົວແບບສາມາດເຮັດໄດ້ງ່າຍຂຶ້ນດ້ວຍທາງເລືອກຫຼາຍອັນ, ເຊັ່ນ: ການນຳໃຊ້ canary.
- ເພື່ອເຂົ້າໃຈວ່າເປັນຫຍັງການຄາດເດົາສະເພາະແມ່ນເຮັດ, ໃຊ້ຕົວອະທິບາຍຕົວແບບ.
- ເມື່ອເກີດບັນຫາ, ໃຫ້ຕິດຕາມເບິ່ງຮູບແບບການຜະລິດດ້ວຍລະບົບເຕືອນໄພ.
ສະຫຼຸບ
MLOps ສາມາດຊ່ວຍເຮັດໃຫ້ການປະຕິບັດການຮຽນຮູ້ຂອງເຄື່ອງຈັກດີຂຶ້ນ. MLOps ສາມາດເລັ່ງການນຳໃຊ້, ເຮັດໃຫ້ການເກັບກຳຂໍ້ມູນ ແລະການດີບັກງ່າຍຂຶ້ນ, ແລະປັບປຸງການຮ່ວມມືລະຫວ່າງວິສະວະກອນ ແລະນັກວິທະຍາສາດຂໍ້ມູນ.
ເພື່ອໃຫ້ເຈົ້າເລືອກເຄື່ອງມື MLOps ທີ່ ເໝາະ ສົມທີ່ສຸດກັບຄວາມຕ້ອງການຂອງເຈົ້າ, ບົດຂຽນນີ້ໄດ້ກວດເບິ່ງ 10 ວິທີແກ້ໄຂ MLOps ທີ່ນິຍົມ, ເຊິ່ງສ່ວນໃຫຍ່ແມ່ນ open-source.
ອອກຈາກ Reply ເປັນ