Daghang mga global nga sektor ang nagsugod sa pagpamuhunan nga labi ka dako sa pagkat-on sa makina (ML).
Ang mga modelo sa ML mahimong una nga ilansad ug operahan sa mga grupo sa mga espesyalista, apan usa sa pinakadako nga mga babag mao ang pagbalhin sa kahibalo nga nakuha sa sunod nga modelo aron ang mga proseso mapalapad.
Aron mapauswag ug ma-standardize ang mga proseso nga nahilambigit sa pagdumala sa siklo sa kinabuhi sa modelo, ang mga pamaagi sa MLOps labi nga gigamit sa mga koponan nga naghimo mga modelo sa pagkat-on sa makina.
Ipadayon ang pagbasa aron mahibal-an ang dugang bahin sa pipila sa labing kaayo nga mga himan ug platform sa MLOps nga magamit karon ug kung giunsa nila mahimo nga labi ka dali ang pagkat-on sa makina gikan sa usa ka himan, developer, ug baroganan sa pamaagi.
Unsa ang MLOps?
Usa ka teknik sa paghimo og mga polisiya, mga lagda, ug labing maayong mga gawi alang sa mga modelo sa pagkat-on sa makina nailhan nga "mga operasyon sa pagkat-on sa makina," o "MLOps."
Ang MLOps nagtumong sa paggarantiya sa tibuok kinabuhi sa pag-uswag sa ML — gikan sa pagpanamkon hangtod sa pag-deploy — maampingong gidokumento ug gidumala alang sa labing maayo nga mga resulta imbes nga mamuhunan ug daghang oras ug kahinguhaan niini nga wala’y estratehiya.
Ang tumong sa MLOps mao ang pag-codify sa pinakamaayong gawi sa paagi nga makahimo sa machine learning development nga mas scalable para sa ML operators ug developers, ingon man sa pagpalambo sa kalidad ug seguridad sa ML models.
Gitawag sa uban ang MLOps nga "DevOps para sa pagkat-on sa makina" tungod kay malampuson nga gigamit ang mga prinsipyo sa DevOps sa usa ka labi ka espesyal nga natad sa pag-uswag sa teknolohiya.
Kini usa ka mapuslanon nga paagi sa paghunahuna bahin sa mga MLOps tungod kay, sama sa DevOps, gipasiugda niini ang pagpaambit sa kahibalo, pagtinabangay, ug labing kaayo nga mga gawi sa mga team ug mga himan.
Ang MLOps naghatag sa mga developer, data scientist, ug operations teams og balangkas para sa pagtinabangay ug, isip resulta, paghimo sa labing gamhanang mga modelo sa ML.
Nganong Gamiton ang MLOps Tools?
Ang mga galamiton sa MLOps makahimo sa usa ka halapad nga mga katungdanan alang sa usa ka ML team, bisan pa, sila kanunay gibahin sa duha ka grupo: ang pagdumala sa plataporma ug pagdumala sa indibidwal nga sangkap.
Samtang ang ubang mga produkto sa MLOps nagpunting lamang sa usa ka core function, sama sa pagdumala sa datos o metadata, ang ubang mga galamiton nagsagop sa usa ka labaw nga naglangkob sa tanan nga estratehiya ug naghatag ug usa ka plataporma sa MLOps aron makontrol ang daghang aspeto sa ML lifecycle.
Pangitaa ang mga solusyon sa MLOps nga nagtabang sa imong team sa pagdumala niining mga lugar sa pagpalambo sa ML, nangita ka man ug espesyalista o mas lapad nga himan:
- Pagdumala sa datos
- Disenyo ug pagmodelo
- Pagdumala sa mga proyekto ug trabahoan
- Pag-deploy sa modelo sa ML ug padayon nga pag-atiman
- Pagdumala sa lifecycle gikan sa sinugdanan hangtod sa katapusan, nga kasagarang gitanyag sa mga full-service nga platform sa MLOps.
MLOps Tools
1. MLFlow
Ang lifecycle sa pagkat-on sa makina kontrolado sa open-source nga plataporma nga MLflow ug naglakip sa sentral nga pagrehistro sa modelo, pag-deploy, ug eksperimento.
Ang MLflow mahimong magamit sa bisan unsang gidak-on nga grupo, sa tagsa-tagsa ug sa kolektibo. Ang mga librarya walay kalabotan sa himan.
Ang bisan unsang programming language ug machine learning library makagamit niini.
Aron mahimo nga mas simple ang pagbansay, pag-deploy, ug pagdumala sa mga aplikasyon sa pagkat-on sa makina, ang MLFlow nakig-uban sa daghang mga balangkas sa pagkat-on sa makina, lakip ang TensorFlow ug Pytorch.
Dugang pa, naghatag ang MLflow og dali gamiton nga mga API nga mahimong iapil sa bisan unsang naa na nga mga programa sa pagkat-on sa makina o librarya.
Ang MLflow adunay upat ka mahinungdanong bahin nga nagpadali sa pagsubay ug pagplano sa mga eksperimento:
- Pagsubay sa MLflow – usa ka API ug UI alang sa pag-log sa machine learning code parameters, bersyon, metrics, ug artifacts ingon man alang sa sunod nga pagpakita ug pagtandi sa mga resulta.
- Mga Proyekto sa MLflow - code sa pagkat-on sa makina sa pagputos sa usa ka magamit pag-usab, mabag-o nga format alang sa pagbalhin sa produksiyon o pagpaambit sa ubang mga siyentipiko sa datos
- Mga Modelo sa MLflow - pagpadayon ug pag-deploy sa mga modelo sa lainlaing mga modelo sa pagserbisyo ug mga sistema sa inference gikan sa lainlaing mga librarya sa ML
- MLflow Model Registry – usa ka sentro nga tindahan sa modelo nga makahimo sa pagdumala sa kooperatiba sa tibuok kinabuhi sa modelo sa MLflow, lakip ang pag-bersyon sa modelo, mga transisyon sa entablado, ug mga anotasyon.
2. KubeFlow
Ang ML toolbox para sa Kubernetes gitawag nga Kubeflow. Pagputos ug pagdumala sa mga sudlanan sa Docker, mga tabang sa pagmentinar sa sistema sa pagkat-on sa makina.
Pinaagi sa pagpasimple sa run orchestration ug pag-deploy sa mga workflow sa pagkat-on sa makina, gipasiugda niini ang pagkadako sa mga modelo sa pagkat-on sa makina.
Kini usa ka open-source nga proyekto nga naglakip sa usa ka maampingong gipili nga grupo sa mga komplementaryong himan ug mga framework nga gipahaum sa lain-laing mga panginahanglan sa ML.
Ang taas nga mga buluhaton sa pagbansay sa ML, manual nga pag-eksperimento, pagsubli, ug mga hagit sa DevOps mahimong madumala sa Kubeflow Pipelines.
Alang sa daghang mga yugto sa pagkat-on sa makina, lakip ang pagbansay, pagpalambo sa pipeline, ug pagmentinar sa Mga notebook sa Jupyter, Nagtanyag ang Kubeflow og mga espesyal nga serbisyo ug panagsama.
Gipasayon niini ang pagdumala ug pagsubay sa tibuok kinabuhi sa imong mga workload sa AI ingon man ang pag-deploy sa mga modelo sa pagkat-on sa makina (ML) ug mga linya sa data ngadto sa mga cluster sa Kubernetes.
Naghatag kini:
- Mga notebook alang sa paggamit sa SDK aron makig-uban sa sistema
- usa ka user interface (UI) alang sa pagkontrol ug pagmonitor sa mga dagan, trabaho, ug mga eksperimento
- Sa paspas nga pagdesinyo sa end-to-end nga mga solusyon nga dili kinahanglan nga magtukod pag-usab sa matag higayon, ug gamiton pag-usab ang mga sangkap ug mga linya sa tubo.
- Ingon usa ka hinungdanon nga sangkap sa Kubeflow o ingon usa ka standalone nga pag-install, gitanyag ang Kubeflow Pipelines.
3. Pagkontrol sa Bersyon sa Data
Ang usa ka bukas nga gigikanan nga solusyon sa pagkontrol sa bersyon alang sa mga proyekto sa pagkat-on sa makina gitawag nga DVC, o Pagkontrol sa Bersyon sa Data.
Bisan unsa nga lengguwahe ang imong pilion, kini usa ka eksperimento nga himan nga makatabang sa kahulugan sa pipeline.
Gigamit sa DVC ang code, data versioning, ug reproducibility aron matabangan ka nga makadaginot sa oras kung makadiskubre ka og isyu sa mas sayo nga bersyon sa imong ML model.
Dugang pa, mahimo nimong gamiton ang mga pipeline sa DVC aron mabansay ang imong modelo ug ipanghatag kini sa mga miyembro sa imong team. Ang dako nga organisasyon sa datos ug pag-bersyon mahimong madumala sa DVC, ug ang datos mahimong tipigan sa dali nga ma-access nga paagi.
Bisan kung kini naglakip sa pipila (limitado) nga mga bahin sa pagsubay sa eksperimento, kasagaran kini nagpunting sa datos ug pag-bersiyon ug pagdumala sa pipeline.
Naghatag kini:
- Kini usa ka agnostic sa pagtipig, busa posible nga magamit ang lainlaing mga tipo sa pagtipig.
- Naghatag usab kini og mga istatistika sa pagsubay.
- usa ka pre-built nga paagi sa pag-apil sa mga yugto sa ML ngadto sa usa ka DAG ug pagpadagan sa tibuok pipeline gikan sa sinugdanan hangtud sa katapusan
- Ang tibuuk nga pag-uswag sa matag modelo sa ML mahimong masundan gamit ang tibuuk nga code ug gigikanan sa datos.
- Reproducibility pinaagi sa matinud-anong pagpreserbar sa inisyal nga configuration, input data, ug program code alang sa usa ka eksperimento.
4. Pachyderm
Ang Pachyderm usa ka version-control program alang sa machine learning ug data science, susama sa DVC.
Dugang pa, tungod kay kini gibuhat gamit Docker ug Kubernetes, mahimo kining ipatuman ug i-deploy ang mga aplikasyon sa Machine Learning sa bisan unsang cloud platform.
Ang Pachyderm naggarantiya nga ang matag piraso sa datos nga gigamit sa usa ka modelo sa pagkat-on sa makina mahimong masubay balik ug ma-bersyon.
Gigamit kini sa paghimo, pag-apod-apod, pagdumala, ug pagbantay sa mga modelo sa pagkat-on sa makina. Usa ka modelo nga rehistro, usa ka sistema sa pagdumala sa modelo, ug usa ka CLI toolbox ang tanan gilakip.
Mahimong awtomatiko ug mapalapad sa mga developer ang ilang lifecycle sa pagkat-on sa makina gamit ang pundasyon sa datos sa Pachyderm, nga nagsiguro usab nga masubli.
Gisuportahan niini ang higpit nga mga sumbanan sa pagdumala sa datos, gipaubos ang mga gasto sa pagproseso ug pagtipig sa datos, ug gitabangan ang mga negosyo sa pagdala sa ilang mga inisyatibo sa siyensya sa datos sa merkado nga mas paspas.
5. Polyaxon
Gamit ang plataporma sa Polyaxon, ang mga proyekto sa pagkat-on sa makina ug mga aplikasyon sa lawom nga pagkat-on mahimong makopya ug madumala sa ilang tibuuk nga siklo sa kinabuhi.
Ang Polyaxon makahimo sa pag-host ug pagdumala sa himan, ug kini mahimong ibutang sa bisan unsang data center o cloud provider. Sama sa Torch, Tensorflow, ug MXNet, nga nagsuporta sa tanan nga labing inila nga lawom nga mga balangkas sa pagkat-on.
Pag-abut sa orkestrasyon, ang Polyaxon makapahimo kanimo nga mapahimuslan ang imong cluster pinaagi sa pag-iskedyul sa mga buluhaton ug mga pagsulay pinaagi sa ilang CLI, dashboard, SDK, o REST API.
Naghatag kini:
- Mahimo nimong gamiton ang open-source nga bersyon karon, apan naglakip usab kini sa mga pagpili alang sa korporasyon.
- Bisan kung gisakup niini ang kompleto nga siklo sa kinabuhi, lakip ang orkestra sa pagdagan, kini makahimo sa labi pa.
- Uban sa teknikal nga mga dokumento sa pakisayran, mga giya sa pagsugod, mga materyales sa pagkat-on, mga manwal, mga tutorial, changelogs, ug uban pa, kini usa ka maayo kaayo nga dokumentado nga plataporma.
- Uban sa dashboard sa mga insight sa eksperimento, posible nga mabantayan, masubay, ug masusi ang matag eksperimento sa pag-optimize.
6. kometa
Ang kometa usa ka plataporma alang sa pagkat-on sa makina sa meta nga nagsubay, nagkontra, nagpatin-aw, ug nagpauswag sa mga eksperimento ug modelo.
Ang tanan nimong mga eksperimento makita ug itandi sa usa ka lokasyon.
Naglihok kini alang sa bisan unsang buluhaton sa pagkat-on sa makina, bisan diin gihimo ang imong code, ug sa bisan unsang librarya sa pagkat-on sa makina.
Ang kometa angay alang sa mga grupo, indibidwal, institusyong pang-akademiko, negosyo, ug bisan kinsa nga gusto nga dali nga mahanduraw ang mga eksperimento, mapahapsay ang trabaho, ug magpahigayon mga eksperimento.
Ang mga data scientist ug mga team makasubay, makapatin-aw, makapauswag, ug makakomparar sa mga eksperimento ug modelo gamit ang self-host ug cloud-based nga meta-machine learning platform nga Comet.
Naghatag kini:
- Adunay daghang mga kapabilidad alang sa mga miyembro sa team nga magpaambit sa mga buluhaton.
- Kini adunay ubay-ubay nga mga integrasyon nga nagpasayon sa pagsumpay niini ngadto sa ubang mga teknolohiya
- Naglihok nga maayo sa karon nga mga librarya sa ML
- Nag-atiman sa pagdumala sa tiggamit
- Gipaandar ang pagtandi sa mga eksperimento, lakip ang pagtandi sa code, hyperparameters, metrics, predictions, dependencies, ug system metrics.
- Naghatag ug lahi nga mga module para sa panan-awon, audio, teksto, ug tabular nga datos nga magtugot kanimo nga mahanduraw ang mga sampol.
7. Optuna
Ang Optuna usa ka sistema alang sa autonomous hyperparameter optimization nga mahimong magamit sa pagkat-on sa makina ug lawom nga pagkat-on ingon man sa ubang mga natad.
Naglangkob kini og lain-laing mga cutting-edge nga mga algorithm diin mahimo nimong pilion (o i-link), gihimo nga yano kaayo ang pag-apod-apod sa pagbansay sa daghang mga kompyuter, ug nagtanyag madanihon nga pagtan-aw sa mga resulta.
Ang mga sikat nga librarya sa pagkat-on sa makina sama sa PyTorch, TensorFlow, Keras, FastAI, sci-kit-learn, LightGBM, ug XGBoost tanan gisagol niini.
Naghatag kini og mga cutting-edge nga algorithm nga makapahimo sa mga kustomer nga makakuha og mga resulta nga mas paspas pinaagi sa paspas nga pagkunhod sa mga sample nga dili maayo nga tan-awon.
Gamit ang mga algorithm nga nakabase sa Python, awtomatiko kini nga pangitaon ang sulundon nga mga hyperparameter. Giawhag ni Optuna ang parallelized hyperparameter nga pagpangita sa daghang mga thread nga wala giusab ang orihinal nga code.
Naghatag kini:
- Gisuportahan niini ang gipang-apod-apod nga pagbansay sa usa ka cluster ingon man usa ka kompyuter (multi-process) (multi-node)
- Gisuportahan niini ang daghang mga pamaagi sa pagpamutol aron mapadali ang panagsama (ug dili kaayo magamit ang pag-compute)
- Kini adunay lainlain nga kusog nga pagtan-aw, sama sa slice plot, contour plot, ug parallel coordinates.
8. Si Kedro
Ang Kedro usa ka libre nga Python framework alang sa pagsulat sa code nga mahimong ma-update ug mamentinar alang sa mga proyekto sa data science.
Nagdala kini mga ideya gikan sa labing kaayo nga mga gawi sa software engineering hangtod sa code sa pagkat-on sa makina. Ang Python mao ang pundasyon niini nga himan sa pag-orkestra sa workflow.
Aron mahimo ang imong mga proseso sa ML nga mas simple ug mas tukma, mahimo kang makahimo og mga reproducible, maintainable, ug modular nga mga workflow.
Gilakip sa Kedro ang mga prinsipyo sa software engineering sama sa modularity, pagbulag sa mga responsibilidad, ug pag-bersyon sa usa ka palibot sa pagkat-on sa makina.
Pinasukad sa Cookiecutter Data Science, naghatag kini usa ka sagad, mapahiangay nga balangkas sa proyekto.
Ubay-ubay nga yano nga data connectors nga gigamit sa pagtipig ug pagkarga sa datos sa daghang file system ug file format, gidumala sa data catalog. Gihimo niini nga mas epektibo ang mga proyekto sa pagkat-on sa makina ug gipasayon ang paghimo og pipeline sa datos.
Naghatag kini:
- Gitugotan sa Kedro ang pag-apod-apod o nag-inusara nga pag-deploy sa makina.
- Mahimo nimong i-automate ang mga dependency tali sa Python code ug workflow visualization gamit ang pipeline abstraction.
- Pinaagi sa paggamit sa modular, magamit pag-usab nga code, kini nga teknolohiya nagpadali sa pagtinabangay sa team sa lainlaing lebel ug nagpauswag sa pagka-produktibo sa palibot sa coding.
- Ang nag-unang tumong mao ang pagbuntog sa mga disbentaha sa Jupyter notebooks, one-off scripts, ug glue-code pinaagi sa pagsulat sa maintainable data science programming.
9. BentoML
Ang paghimo sa mga endpoint sa API sa pagkat-on sa makina gipasayon sa BentoML.
Naghatag kini usa ka kasagaran apan gipamubu nga imprastraktura aron mabalhin ang nakat-unan nga mga modelo sa pagkat-on sa makina ngadto sa produksiyon.
Makapahimo kini kanimo sa pag-package sa nakat-unan nga mga modelo para magamit sa usa ka setting sa produksiyon, paghubad niini gamit ang bisan unsang ML framework. Parehong offline nga batch nga pagserbisyo ug online nga pagserbisyo sa API gisuportahan.
Ang usa ka high-performance model server ug usa ka flexible workflow kay mga feature sa BentoML.
Dugang pa, ang server nagtanyag adaptive micro-batching. Usa ka hiniusa nga pamaagi alang sa pag-organisar sa mga modelo ug pagsubay sa mga pamaagi sa pag-deploy gihatag sa dashboard sa UI.
Walay server downtime tungod kay ang operating mekanismo mao ang modular ug ang configuration magamit pag-usab. Kini usa ka flexible nga plataporma alang sa paghatag, pag-organisar, ug pag-deploy sa mga modelo sa ML.
Naghatag kini:
- Kini adunay modular nga disenyo nga mapasibo.
- Gitugotan niini ang pag-deploy sa daghang mga platform.
- Dili kini awtomatik nga makadumala sa horizontal scaling.
- Gitugotan niini ang usa ka format sa modelo, pagdumala sa modelo, pagputos sa modelo, ug pagserbisyo sa modelo nga adunay taas nga performance.
10. Seldon
Ang mga data scientist makahimo, maka-deploy, ug makadumala sa mga modelo sa pagkat-on sa makina ug mga eksperimento sa sukod sa Kubernetes gamit ang open-source nga Seldon Core nga balangkas.
Ang TensorFlow, sci-kit-learn, Spark, R, Java, ug H2O pipila lang sa mga toolkit nga gisuportahan niini.
Nag-interface usab kini sa Kubeflow ug RedHat's OpenShift. Ang Seldon core nag-usab sa mga modelo sa pagkat-on sa makina (mga modelo sa ML) o mga wrapper sa pinulongan (mga pinulongan sama sa Python, Java, ug uban pa) ngadto sa produksyon nga REST/GRPC microservices.
Usa sa labing kaayo nga himan sa MLOps alang sa pagpaayo sa mga proseso sa pagkat-on sa makina mao kini.
Yano ang pag-container sa mga modelo sa ML ug pagsulay alang sa usability ug seguridad gamit ang Seldon Core.
Naghatag kini:
- Ang pag-deploy sa modelo mahimong mas simple sa daghang mga alternatibo, sama sa pag-deploy sa canary.
- Aron masabtan kon nganong gihimo ang espesipikong mga panagna, gamita ang mga tigpasabot sa modelo.
- Kung adunay mga isyu, bantayi ang mga modelo sa produksiyon gamit ang sistema sa pag-alerto.
Panapos
Makatabang ang mga MLOp aron mahimong mas maayo ang mga operasyon sa pagkat-on sa makina. Ang mga MLOp makapadali sa pag-deploy, makahimo sa pagkolekta sa datos ug pag-debug nga mas simple, ug pagpalambo sa kolaborasyon tali sa mga inhenyero ug data scientist.
Aron mapili nimo ang himan sa MLOps nga labing angay sa imong mga panginahanglan, gisusi sa kini nga post ang 10 ka sikat nga solusyon sa MLOps, kadaghanan niini bukas nga gigikanan.
Leave sa usa ka Reply