វិស័យសកលលោកជាច្រើនកំពុងចាប់ផ្តើមវិនិយោគកាន់តែច្រើននៅក្នុងការសិក្សាអំពីម៉ាស៊ីន (ML)។
គំរូ ML អាចត្រូវបានដាក់ឱ្យដំណើរការដំបូង និងដំណើរការដោយក្រុមអ្នកឯកទេស ប៉ុន្តែឧបសគ្គដ៏ធំបំផុតមួយគឺការផ្ទេរចំណេះដឹងដែលទទួលបានទៅម៉ូដែលបន្ទាប់ ដូច្នេះដំណើរការអាចត្រូវបានពង្រីក។
ដើម្បីកែលម្អ និងធ្វើស្តង់ដារដំណើរការដែលពាក់ព័ន្ធនឹងការគ្រប់គ្រងវដ្តជីវិតគំរូ បច្ចេកទេស MLOps ត្រូវបានប្រើប្រាស់កាន់តែខ្លាំងឡើងដោយក្រុមដែលបង្កើតគំរូសិក្សាម៉ាស៊ីន។
បន្តអានដើម្បីស្វែងយល់បន្ថែមអំពីឧបករណ៍ និងវេទិកា MLOps ដ៏ល្អបំផុតមួយចំនួនដែលមានថ្ងៃនេះ និងរបៀបដែលពួកគេអាចធ្វើឱ្យការរៀនម៉ាស៊ីនកាន់តែងាយស្រួលពីឧបករណ៍ អ្នកអភិវឌ្ឍន៍ និងទស្សនៈនៃនីតិវិធី។
តើ MLOps ជាអ្វី?
បច្ចេកទេសសម្រាប់បង្កើតគោលនយោបាយ បទដ្ឋាន និងការអនុវត្តល្អបំផុតសម្រាប់ម៉ូដែលរៀនម៉ាស៊ីនត្រូវបានគេស្គាល់ថាជា "ប្រតិបត្តិការសិក្សាម៉ាស៊ីន" ឬ "MLOps" ។
MLOps មានគោលបំណងធានានូវវដ្តជីវិតទាំងមូលនៃការអភិវឌ្ឍន៍ ML - ពីគំនិតរហូតដល់ការដាក់ពង្រាយ - ត្រូវបានចងក្រងជាឯកសារយ៉ាងល្អិតល្អន់ និងគ្រប់គ្រងដើម្បីទទួលបានលទ្ធផលល្អបំផុត ជាជាងការវិនិយោគពេលវេលា និងធនធានជាច្រើននៅក្នុងវាដោយគ្មានយុទ្ធសាស្រ្ត។
គោលដៅរបស់ MLOps គឺដើម្បីសរសេរកូដការអនុវត្តល្អបំផុតនៅក្នុងវិធីមួយដែលធ្វើឱ្យការអភិវឌ្ឍន៍ការរៀនម៉ាស៊ីនអាចធ្វើមាត្រដ្ឋានកាន់តែច្រើនសម្រាប់ប្រតិបត្តិករ ML និងអ្នកអភិវឌ្ឍន៍ ក៏ដូចជាដើម្បីបង្កើនគុណភាព និងសុវត្ថិភាពនៃម៉ូដែល ML ។
អ្នកខ្លះសំដៅលើ MLOps ថាជា "DevOps សម្រាប់ការរៀនម៉ាស៊ីន" ចាប់តាំងពីវាអនុវត្តដោយជោគជ័យនូវគោលការណ៍ DevOps ទៅកាន់វិស័យឯកទេសបន្ថែមទៀតនៃការអភិវឌ្ឍន៍បច្ចេកវិទ្យា។
នេះគឺជាវិធីដ៏មានប្រយោជន៍ក្នុងការគិតអំពី MLOps ព្រោះដូចជា DevOps វាសង្កត់ធ្ងន់លើការចែករំលែកចំណេះដឹង ការសហការ និងការអនុវត្តល្អបំផុតក្នុងចំណោមក្រុម និងឧបករណ៍។
MLOps ផ្តល់ឱ្យអ្នកអភិវឌ្ឍន៍ អ្នកវិទ្យាសាស្ត្រទិន្នន័យ និងក្រុមប្រតិបត្តិការជាមួយនឹងក្របខ័ណ្ឌសម្រាប់កិច្ចសហប្រតិបត្តិការ ហើយជាលទ្ធផល ការផលិតគំរូ ML ដែលមានឥទ្ធិពលបំផុត។
ហេតុអ្វីត្រូវប្រើឧបករណ៍ MLOps?
ឧបករណ៍ MLOps អាចបំពេញភារកិច្ចជាច្រើនសម្រាប់ក្រុម ML ទោះបីជាយ៉ាងណាក៏ដោយ ពួកគេត្រូវបានបែងចែកជាពីរក្រុម៖ ការគ្រប់គ្រងវេទិកា និងការគ្រប់គ្រងសមាសភាគបុគ្គល។
ខណៈពេលដែលផលិតផល MLOps មួយចំនួនផ្តោតតែលើមុខងារស្នូលតែមួយប៉ុណ្ណោះ ដូចជាការគ្រប់គ្រងទិន្នន័យ ឬទិន្នន័យមេតា ឧបករណ៍ផ្សេងទៀតបានអនុម័តយុទ្ធសាស្ត្រដែលមានលក្ខណៈទូលំទូលាយជាងមុន និងផ្តល់នូវវេទិកា MLOps ដើម្បីគ្រប់គ្រងទិដ្ឋភាពជាច្រើននៃវដ្តជីវិតរបស់ ML ។
រកមើលដំណោះស្រាយ MLOps ដែលជួយក្រុមរបស់អ្នកក្នុងការគ្រប់គ្រងតំបន់អភិវឌ្ឍន៍ ML ទាំងនេះ មិនថាអ្នកកំពុងស្វែងរកអ្នកឯកទេស ឬឧបករណ៍ទូលំទូលាយជាងនេះទេ៖
- ការគ្រប់គ្រងទិន្នន័យ
- ការរចនានិងគំរូ
- ការគ្រប់គ្រងគម្រោង និងកន្លែងធ្វើការ
- ការដាក់ពង្រាយគំរូ ML និងការថែទាំជាបន្តបន្ទាប់
- ការគ្រប់គ្រងវដ្តជីវិតពីដើមដល់ចប់ ដែលជាធម្មតាត្រូវបានផ្តល់ជូនដោយវេទិកា MLOps សេវាកម្មពេញលេញ។
ឧបករណ៍ MLOps
1. មីលហ្វាល
វដ្តជីវិតនៃការរៀនរបស់ម៉ាស៊ីនត្រូវបានគ្រប់គ្រងដោយវេទិកាប្រភពបើកចំហ MLflow និងរួមបញ្ចូលការចុះឈ្មោះគំរូកណ្តាល ការដាក់ឱ្យប្រើប្រាស់ និងការពិសោធន៍។
MLflow អាចត្រូវបានប្រើដោយក្រុមទំហំណាមួយ ទាំងបុគ្គល និងជាសមូហភាព។ បណ្ណាល័យមិនមានផលប៉ះពាល់លើឧបករណ៍ទេ។
ភាសាសរសេរកម្មវិធីណាមួយ និងបណ្ណាល័យរៀនម៉ាស៊ីនអាចប្រើប្រាស់វាបាន។
ដើម្បីធ្វើឱ្យវាកាន់តែងាយស្រួលក្នុងការបណ្តុះបណ្តាល ប្រើប្រាស់ និងគ្រប់គ្រងកម្មវិធីរៀនម៉ាស៊ីន MLFlow ធ្វើអន្តរកម្មជាមួយនឹងក្របខ័ណ្ឌសិក្សាម៉ាស៊ីនមួយចំនួន រួមទាំង TensorFlow និង Pytorg ។
លើសពីនេះទៀត MLflow ផ្តល់នូវ APIs ងាយស្រួលប្រើ ដែលអាចត្រូវបានរួមបញ្ចូលនៅក្នុងកម្មវិធីសិក្សាម៉ាស៊ីន ឬបណ្ណាល័យណាមួយដែលមានស្រាប់។
MLflow មានលក្ខណៈពិសេសសំខាន់ៗចំនួនបួនដែលជួយសម្រួលដល់ការតាមដាន និងការធ្វើផែនការពិសោធន៍៖
- ការតាមដាន MLflow – API និង UI សម្រាប់កត់ត្រាប៉ារ៉ាម៉ែត្រកូដការរៀនរបស់ម៉ាស៊ីន កំណែ រង្វាស់ និងវត្ថុបុរាណ ក៏ដូចជាសម្រាប់ការបង្ហាញជាបន្តបន្ទាប់ និងការប្រៀបធៀបលទ្ធផល
- គម្រោង MLflow - លេខកូដរៀនម៉ាស៊ីនវេចខ្ចប់ក្នុងទម្រង់ដែលអាចប្រើឡើងវិញបាន និងអាចផលិតឡើងវិញបានសម្រាប់ផ្ទេរទៅផលិតកម្ម ឬចែករំលែកជាមួយអ្នកវិទ្យាសាស្ត្រទិន្នន័យផ្សេងទៀត
- ម៉ូដែល MLflow - ការថែរក្សា និងដាក់ពង្រាយម៉ូដែលទៅជួរនៃការបម្រើគំរូ និងប្រព័ន្ធការសន្និដ្ឋានពីបណ្ណាល័យ ML ផ្សេងៗ
- MLflow Model Registry – ហាងលក់គំរូកណ្តាលដែលអនុញ្ញាតឱ្យមានការគ្រប់គ្រងសហករណ៍នៃអាយុកាលទាំងមូលរបស់ម៉ូដែល MLflow រួមទាំងកំណែគំរូ ការផ្លាស់ប្តូរដំណាក់កាល និងចំណារពន្យល់។
2. KubeFlow
ប្រអប់ឧបករណ៍ ML សម្រាប់ Kubernetes ត្រូវបានគេហៅថា Kubeflow ។ ការវេចខ្ចប់ និងការគ្រប់គ្រងធុង Docker ជំនួយក្នុងការថែរក្សា ប្រព័ន្ធរៀនម៉ាស៊ីន.
តាមរយៈការសម្រួលដល់ការរត់ការ orchestration និងការដាក់ឱ្យប្រើប្រាស់នូវលំហូរការងារនៃការរៀនម៉ាស៊ីន វាជួយលើកកម្ពស់លទ្ធភាពនៃការធ្វើមាត្រដ្ឋាននៃគំរូសិក្សាម៉ាស៊ីន។
វាគឺជាគម្រោងប្រភពបើកចំហដែលរួមបញ្ចូលក្រុមដែលបានជ្រើសរើសយ៉ាងប្រុងប្រយ័ត្ននៃឧបករណ៍បំពេញបន្ថែម និងក្របខ័ណ្ឌដែលស្របតាមតម្រូវការ ML ផ្សេងៗគ្នា។
កិច្ចការបណ្ដុះបណ្ដាល ML រយៈពេលវែង ការពិសោធន៍ដោយដៃ លទ្ធភាពធ្វើម្តងទៀត និងបញ្ហាប្រឈមរបស់ DevOps អាចត្រូវបានដោះស្រាយជាមួយ Kubeflow Pipelines ។
សម្រាប់ដំណាក់កាលជាច្រើននៃការរៀនម៉ាស៊ីន រួមទាំងការបណ្តុះបណ្តាល ការអភិវឌ្ឍន៍បំពង់ និងការថែទាំ សៀវភៅកត់ត្រាជឺភីត, Kubeflow ផ្តល់សេវាកម្មឯកទេស និងការរួមបញ្ចូល។
វាធ្វើឱ្យវាសាមញ្ញក្នុងការគ្រប់គ្រង និងតាមដានអាយុកាលនៃបន្ទុកការងារ AI របស់អ្នក ក៏ដូចជាការដាក់ឱ្យប្រើប្រាស់នូវគំរូនៃការរៀនម៉ាស៊ីន (ML) និងបំពង់បញ្ជូនទិន្នន័យទៅកាន់ក្រុម Kubernetes ។
វាផ្តល់ជូន:
- សៀវភៅកត់ត្រាសម្រាប់ប្រើប្រាស់ SDK ដើម្បីធ្វើអន្តរកម្មជាមួយប្រព័ន្ធ
- ចំណុចប្រទាក់អ្នកប្រើប្រាស់ (UI) សម្រាប់គ្រប់គ្រង និងត្រួតពិនិត្យការរត់ ការងារ និងការពិសោធន៍
- ដើម្បីរចនាដំណោះស្រាយពីចុងដល់ចុងយ៉ាងរហ័សដោយមិនចាំបាច់ត្រូវសាងសង់ឡើងវិញរាល់ពេល ហើយប្រើសមាសធាតុនិងបំពង់បង្ហូរប្រេងឡើងវិញ។
- ក្នុងនាមជាធាតុផ្សំសំខាន់នៃ Kubeflow ឬជាការដំឡើងតែឯង បំពង់ Kubeflow ត្រូវបានផ្តល់ជូន។
3. ការគ្រប់គ្រងកំណែទិន្នន័យ
ដំណោះស្រាយការគ្រប់គ្រងកំណែប្រភពបើកចំហសម្រាប់គម្រោងសិក្សាម៉ាស៊ីនត្រូវបានគេហៅថា DVC ឬការគ្រប់គ្រងកំណែទិន្នន័យ។
មិនថាអ្នកជ្រើសរើសភាសាណាក៏ដោយ វាជាឧបករណ៍ពិសោធន៍ដែលជួយកំណត់និយមន័យបំពង់។
DVC ប្រើប្រាស់កូដ កំណែទិន្នន័យ និងការផលិតឡើងវិញ ដើម្បីជួយអ្នកសន្សំពេលវេលានៅពេលអ្នករកឃើញបញ្ហាជាមួយកំណែមុននៃគំរូ ML របស់អ្នក។
លើសពីនេះទៀត អ្នកអាចប្រើបំពង់ DVC ដើម្បីបណ្តុះបណ្តាលគំរូរបស់អ្នក និងចែកចាយវាដល់សមាជិកក្រុមរបស់អ្នក។ ការរៀបចំ និងកំណែទិន្នន័យធំអាចត្រូវបានគ្រប់គ្រងដោយ DVC ហើយទិន្នន័យអាចត្រូវបានរក្សាទុកក្នុងលក្ខណៈដែលអាចចូលដំណើរការបានយ៉ាងងាយស្រួល។
ទោះបីជាវារួមបញ្ចូលមុខងារតាមដានការពិសោធន៍មួយចំនួន (មានកំណត់) ក៏ដោយ វាភាគច្រើនផ្តោតលើទិន្នន័យ និងកំណែទម្រង់ និងការគ្រប់គ្រងបំពង់។
វាផ្តល់ជូន:
- វាជាការផ្ទុកមិនប្រក្រតី ដូច្នេះវាអាចប្រើបានច្រើនប្រភេទនៃទំហំផ្ទុក។
- វាផ្តល់នូវស្ថិតិតាមដានផងដែរ។
- មធ្យោបាយដែលបានសាងសង់ជាមុនសម្រាប់ការចូលរួមដំណាក់កាល ML ទៅក្នុង DAG និងដំណើរការបំពង់បង្ហូរប្រេងទាំងមូលពីដើមដល់ចប់
- ការអភិវឌ្ឍន៍ទាំងមូលរបស់ម៉ូដែល ML នីមួយៗអាចត្រូវបានអនុវត្តតាមដោយប្រើកូដទាំងមូល និងការបង្ហាញទិន្នន័យរបស់វា។
- ការផលិតឡើងវិញដោយរក្សាដោយស្មោះត្រង់នូវការកំណត់រចនាសម្ព័ន្ធដំបូង បញ្ចូលទិន្នន័យ និងកូដកម្មវិធីសម្រាប់ការពិសោធន៍មួយ។
4. ផៃដិម
Pachyderm គឺជាកម្មវិធីត្រួតពិនិត្យកំណែសម្រាប់ការរៀនម៉ាស៊ីន និងវិទ្យាសាស្ត្រទិន្នន័យ ដែលស្រដៀងទៅនឹង DVC ។
លើសពីនេះទៀតដោយសារតែវាត្រូវបានបង្កើតឡើងដោយប្រើ Docker និង Kubernetesវាអាចប្រតិបត្តិ និងដាក់ឱ្យប្រើប្រាស់កម្មវិធី Machine Learning នៅលើវេទិកាពពកណាមួយ។
Pachyderm ធានាថាទិន្នន័យនីមួយៗដែលត្រូវបានប្រើក្នុងគំរូរៀនរបស់ម៉ាស៊ីនអាចត្រូវបានតាមដានត្រឡប់មកវិញនិងកំណែ។
វាត្រូវបានប្រើដើម្បីបង្កើត ចែកចាយ គ្រប់គ្រង និងរក្សាភ្នែកលើម៉ូដែលរៀនម៉ាស៊ីន។ បញ្ជីឈ្មោះគំរូ ប្រព័ន្ធគ្រប់គ្រងគំរូ និងប្រអប់ឧបករណ៍ CLI ត្រូវបានរួមបញ្ចូលទាំងអស់។
អ្នកអភិវឌ្ឍន៍អាចធ្វើស្វ័យប្រវត្តិកម្ម និងពង្រីកវដ្តជីវិតនៃការរៀនម៉ាស៊ីនរបស់ពួកគេ ដោយប្រើមូលដ្ឋានគ្រឹះទិន្នន័យរបស់ Pachyderm ដែលធានានូវលទ្ធភាពធ្វើម្តងទៀតផងដែរ។
វាគាំទ្រស្តង់ដារអភិបាលកិច្ចទិន្នន័យដ៏តឹងរ៉ឹង កាត់បន្ថយការចំណាយលើដំណើរការទិន្នន័យ និងការផ្ទុក និងជួយអាជីវកម្មក្នុងការនាំយកគំនិតផ្តួចផ្តើមវិទ្យាសាស្ត្រទិន្នន័យរបស់ពួកគេទៅកាន់ទីផ្សារកាន់តែលឿន។
5. ប៉ូលីកាតុន
ដោយប្រើវេទិកា Polyaxon គម្រោងសិក្សាម៉ាស៊ីន និងកម្មវិធីសិក្សាជ្រៅអាចចម្លង និងគ្រប់គ្រងលើវដ្តជីវិតទាំងមូលរបស់ពួកគេ។
Polyaxon អាចធ្វើជាម្ចាស់ផ្ទះ និងគ្រប់គ្រងឧបករណ៍ ហើយវាអាចត្រូវបានដាក់ចូលទៅក្នុងមជ្ឈមណ្ឌលទិន្នន័យ ឬអ្នកផ្តល់សេវាពពកណាមួយ។ ដូចជា Torch, Tensorflow, និង MXNet ដែលគាំទ្ររាល់ក្របខ័ណ្ឌសិក្សាជ្រៅជ្រះដែលពេញនិយមបំផុត។
នៅពេលនិយាយអំពីការរៀបចំវង់ភ្លេង Polyaxon អនុញ្ញាតឱ្យអ្នកប្រើប្រាស់ច្រើនបំផុតនៃចង្កោមរបស់អ្នកដោយកំណត់ពេលភារកិច្ច និងការធ្វើតេស្តតាមរយៈ CLI, dashboard, SDKs ឬ REST API របស់ពួកគេ។
វាផ្តល់ជូន:
- អ្នកអាចប្រើកំណែប្រភពបើកចំហឥឡូវនេះ ប៉ុន្តែវាក៏រួមបញ្ចូលជម្រើសសម្រាប់សាជីវកម្មផងដែរ។
- ទោះបីជាវាគ្របដណ្តប់វដ្តជីវិតពេញលេញ រួមទាំងការរត់វង់តន្រ្តីក៏ដោយ វាមានលទ្ធភាពច្រើនទៀត។
- ជាមួយនឹងឯកសារយោងបច្ចេកទេស ការណែនាំអំពីការចាប់ផ្តើម សម្ភារៈសិក្សា សៀវភៅណែនាំ ការបង្រៀន កំណត់ហេតុផ្លាស់ប្តូរ និងច្រើនទៀត វាគឺជាវេទិកាដែលមានឯកសារយ៉ាងល្អ។
- ជាមួយនឹងផ្ទាំងគ្រប់គ្រងការយល់ដឹងពីការពិសោធន៍ វាអាចធ្វើទៅបានដើម្បីតាមដាន តាមដាន និងវាយតម្លៃការពិសោធន៍បង្កើនប្រសិទ្ធភាពនីមួយៗ។
6. ផ្កាយដុះកន្ទុយ
Comet គឺជាវេទិកាសម្រាប់ការរៀនមេតាម៉ាស៊ីនដែលតាមដាន ភាពផ្ទុយគ្នា ពន្យល់ និងកែលម្អការពិសោធន៍ និងគំរូ។
ការពិសោធន៍របស់អ្នកទាំងអស់អាចត្រូវបានគេមើលឃើញ និងប្រៀបធៀបនៅក្នុងទីតាំងមួយ។
វាដំណើរការសម្រាប់កិច្ចការរៀនម៉ាស៊ីនណាមួយ គ្រប់ទីកន្លែងដែលកូដរបស់អ្នកត្រូវបានអនុវត្ត និងជាមួយបណ្ណាល័យរៀនម៉ាស៊ីនណាមួយ។
ផ្កាយដុះកន្ទុយគឺសមរម្យសម្រាប់ក្រុម បុគ្គល ស្ថាប័នសិក្សា អាជីវកម្ម និងនរណាម្នាក់ផ្សេងទៀតដែលចង់ស្រមៃឃើញការពិសោធន៍យ៉ាងឆាប់រហ័ស សម្រួលការងារ និងធ្វើការពិសោធន៍។
អ្នកវិទ្យាសាស្ត្រ និងក្រុមទិន្នន័យអាចតាមដាន បញ្ជាក់ កែលម្អ និងប្រៀបធៀបការពិសោធន៍ និងគំរូដោយប្រើវេទិការៀនមេតាម៉ាស៊ីនដែលមានមូលដ្ឋានលើពពក និងកម្មវិធី Comet ។
វាផ្តល់ជូន:
- សមត្ថភាពជាច្រើនមានសម្រាប់សមាជិកក្រុមក្នុងការចែករំលែកកិច្ចការ។
- វាមានការរួមបញ្ចូលជាច្រើនដែលធ្វើឱ្យវាសាមញ្ញក្នុងការភ្ជាប់វាទៅនឹងបច្ចេកវិទ្យាផ្សេងទៀត។
- ដំណើរការបានល្អជាមួយបណ្ណាល័យ ML បច្ចុប្បន្ន
- យកចិត្តទុកដាក់លើការគ្រប់គ្រងអ្នកប្រើប្រាស់
- ការប្រៀបធៀបនៃការពិសោធន៍ត្រូវបានបើក រួមទាំងការប្រៀបធៀបនៃកូដ ប៉ារ៉ាម៉ែត្រខ្ពស់ រង្វាស់ម៉ែត្រ ការព្យាករណ៍ ភាពអាស្រ័យ និងរង្វាស់ប្រព័ន្ធ។
- ផ្តល់ម៉ូឌុលដាច់ដោយឡែកសម្រាប់ចក្ខុវិស័យ សំឡេង អត្ថបទ និងទិន្នន័យតារាង ដែលអនុញ្ញាតឱ្យអ្នកមើលឃើញគំរូ។
7. អុបធូណា
Optuna គឺជាប្រព័ន្ធសម្រាប់ការបង្កើនប្រសិទ្ធភាពខ្ពស់ដោយស្វយ័ត ដែលអាចត្រូវបានអនុវត្តទាំងការរៀនម៉ាស៊ីន និងការរៀនស៊ីជម្រៅ ក៏ដូចជាវិស័យផ្សេងៗទៀត។
វាមានភាពខុសគ្នានៃក្បួនដោះស្រាយទំនើបដែលអ្នកអាចជ្រើសរើស (ឬភ្ជាប់) ធ្វើឱ្យវាសាមញ្ញណាស់ក្នុងការចែកចាយការបណ្តុះបណ្តាលលើកុំព្យូទ័រជាច្រើន និងផ្តល់នូវការមើលឃើញលទ្ធផលដ៏គួរឱ្យទាក់ទាញ។
បណ្ណាល័យសិក្សាតាមម៉ាស៊ីនដ៏ពេញនិយមដូចជា PyTorch, TensorFlow, Keras, FastAI, sci-kit-learn, LightGBM, និង XGBoost ត្រូវបានរួមបញ្ចូលជាមួយវា។
វាផ្តល់នូវក្បួនដោះស្រាយដ៏ទំនើបដែលអាចឱ្យអតិថិជនទទួលបានលទ្ធផលកាន់តែលឿនដោយកាត់បន្ថយយ៉ាងឆាប់រហ័សនូវគំរូដែលមើលទៅមិនគួរឱ្យជឿ។
ដោយប្រើក្បួនដោះស្រាយដែលមានមូលដ្ឋានលើ Python វាស្វែងរកដោយស្វ័យប្រវត្តិសម្រាប់ hyperparameters ដ៏ល្អ។ Optuna លើកទឹកចិត្តឱ្យមានការស្វែងរកអ៊ីពែរប៉ារ៉ាម៉ែតស្របគ្នានៅទូទាំងខ្សែស្រឡាយជាច្រើនដោយមិនផ្លាស់ប្តូរកូដដើម។
វាផ្តល់ជូន:
- វាគាំទ្រការបណ្តុះបណ្តាលចែកចាយនៅលើចង្កោមក៏ដូចជាកុំព្យូទ័រតែមួយ (ដំណើរការច្រើន) (ពហុថ្នាំង)
- វាគាំទ្របច្ចេកទេសកាត់តម្រឹមជាច្រើនដើម្បីបង្កើនល្បឿនការបញ្ចូលគ្នា (និងប្រើការគណនាតិច)
- វាមានភាពខុសគ្នានៃការមើលឃើញដ៏មានឥទ្ធិពល ដូចជាគ្រោងចំណិត គ្រោងវណ្ឌវង្ក និងកូអរដោនេប៉ារ៉ាឡែល។
8. ខេដ្រូ
Kedro គឺជាក្របខ័ណ្ឌ Python ឥតគិតថ្លៃសម្រាប់ការសរសេរកូដដែលអាចធ្វើបច្ចុប្បន្នភាព និងថែទាំសម្រាប់គម្រោងវិទ្យាសាស្ត្រទិន្នន័យ។
វានាំមកនូវគំនិតពីការអនុវត្តល្អបំផុតក្នុងវិស្វកម្មផ្នែកទន់ ដល់ការរៀនកូដម៉ាស៊ីន។ Python គឺជាមូលដ្ឋានគ្រឹះនៃឧបករណ៍ orchestration លំហូរការងារនេះ។
ដើម្បីធ្វើឱ្យដំណើរការ ML របស់អ្នកកាន់តែសាមញ្ញ និងច្បាស់លាស់ជាងមុន អ្នកអាចបង្កើតលំហូរការងារដែលអាចផលិតឡើងវិញ រក្សាបាន និងជាម៉ូឌុល។
Kedro រួមបញ្ចូលគោលការណ៍វិស្វកម្មផ្នែកទន់ ដូចជាម៉ូឌុល ការបំបែកការទទួលខុសត្រូវ និងកំណែទៅក្នុងបរិយាកាសរៀនម៉ាស៊ីន។
នៅលើមូលដ្ឋាននៃ Cookiecutter Data Science វាផ្តល់នូវគ្រោងការណ៍គម្រោងទូទៅដែលអាចសម្របខ្លួនបាន។
ឧបករណ៍ភ្ជាប់ទិន្នន័យសាមញ្ញមួយចំនួនដែលប្រើសម្រាប់រក្សាទុក និងផ្ទុកទិន្នន័យនៅទូទាំងប្រព័ន្ធឯកសារ និងទម្រង់ឯកសារជាច្រើនត្រូវបានគ្រប់គ្រងដោយកាតាឡុកទិន្នន័យ។ វាធ្វើឱ្យគម្រោងសិក្សារបស់ម៉ាស៊ីនមានប្រសិទ្ធភាព និងធ្វើឱ្យវាកាន់តែងាយស្រួលក្នុងការសាងសង់បំពង់ទិន្នន័យ។
វាផ្តល់ជូន:
- Kedro អនុញ្ញាតឱ្យដាក់ពង្រាយម៉ាស៊ីនដែលបែកខ្ចាត់ខ្ចាយ ឬតែម្នាក់ឯង។
- អ្នកអាចធ្វើស្វ័យប្រវត្តិកម្មភាពអាស្រ័យរវាងកូដ Python និងការមើលឃើញលំហូរការងារដោយប្រើអរូបីបំពង់។
- តាមរយៈការប្រើប្រាស់កូដម៉ូឌុលដែលអាចប្រើឡើងវិញបាន បច្ចេកវិទ្យានេះជួយសម្រួលដល់ការសហការជាក្រុមលើកម្រិតផ្សេងៗគ្នា និងបង្កើនផលិតភាពនៅក្នុងបរិយាកាសសរសេរកូដ។
- គោលដៅចម្បងគឺដើម្បីយកឈ្នះលើគុណវិបត្តិនៃសៀវភៅកត់ត្រា Jupyter, ស្គ្រីបបិទមួយ និងកូដកាវដោយការសរសេរកម្មវិធីវិទ្យាសាស្ត្រទិន្នន័យដែលអាចរក្សាបាន។
9. BentoML
ការកសាងចំណុចបញ្ចប់ API ការរៀនម៉ាស៊ីនត្រូវបានធ្វើឱ្យកាន់តែងាយស្រួលជាមួយ BentoML ។
វាផ្តល់នូវហេដ្ឋារចនាសម្ព័ន្ធដែលមានលក្ខណៈសាមញ្ញនៅឡើយ ដើម្បីផ្លាស់ទីគំរូនៃការរៀនម៉ាស៊ីនដែលបានសិក្សាទៅក្នុងផលិតកម្ម។
វាអនុញ្ញាតឱ្យអ្នកខ្ចប់គំរូដែលបានរៀនសម្រាប់ប្រើក្នុងការកំណត់ផលិតកម្ម បកស្រាយពួកវាដោយប្រើក្របខ័ណ្ឌ ML ណាមួយ។ ទាំងការបម្រើជាបាច់ក្រៅបណ្តាញ និងការបម្រើ API តាមអ៊ីនធឺណិតត្រូវបានគាំទ្រ។
ម៉ាស៊ីនមេគំរូដែលមានប្រសិទ្ធភាពខ្ពស់ និងលំហូរការងារដែលអាចបត់បែនបានគឺជាលក្ខណៈពិសេសរបស់ BentoML ។
លើសពីនេះ ម៉ាស៊ីនមេផ្តល់នូវការសម្របសម្រួលខ្នាតតូច។ វិធីសាស្រ្តបង្រួបបង្រួមសម្រាប់ការរៀបចំគំរូ និងការតាមដាននីតិវិធីនៃការដាក់ពង្រាយត្រូវបានផ្តល់ដោយផ្ទាំងគ្រប់គ្រង UI ។
វានឹងមិនមានការផ្អាកម៉ាស៊ីនមេទេ ដោយសារយន្តការប្រតិបត្តិការមានលក្ខណៈម៉ូឌុល ហើយការកំណត់អាចប្រើឡើងវិញបាន។ វាគឺជាវេទិកាដែលអាចបត់បែនបានសម្រាប់ការផ្តល់ រៀបចំ និងដាក់ពង្រាយគំរូ ML ។
វាផ្តល់ជូន:
- វាមានការរចនាម៉ូឌុលដែលអាចប្រែប្រួលបាន។
- វាអនុញ្ញាតឱ្យដាក់ពង្រាយនៅលើវេទិកាជាច្រើន។
- វាមិនអាចគ្រប់គ្រងការធ្វើមាត្រដ្ឋានផ្ដេកដោយស្វ័យប្រវត្តិបានទេ។
- វាបើកដំណើរការទម្រង់គំរូតែមួយ ការគ្រប់គ្រងគំរូ ការវេចខ្ចប់គំរូ និងការបម្រើគំរូដែលមានប្រសិទ្ធភាពខ្ពស់។
10. សេនដុន
អ្នកវិទ្យាសាស្ត្រទិន្នន័យអាចបង្កើត ប្រើប្រាស់ និងគ្រប់គ្រងគំរូរៀនម៉ាស៊ីន និងការពិសោធន៍តាមខ្នាតនៅលើ Kubernetes ដោយប្រើប្រភពបើកចំហរ Seldon Core framework ។
TensorFlow, sci-kit-learn, Spark, R, Java, និង H2O គ្រាន់តែជាប្រអប់ឧបករណ៍មួយចំនួនដែលត្រូវបានគាំទ្រដោយវា។
វាក៏មានចំណុចប្រទាក់ជាមួយ Kubeflow និង OpenShift របស់ RedHat ផងដែរ។ ស្នូល Seldon បំប្លែងគំរូការរៀនម៉ាស៊ីន (ម៉ូដែល ML) ឬឧបករណ៍រុំភាសា (ភាសាដូចជា Python, Java ជាដើម) ទៅជាសេវាកម្មមីក្រូផលិតកម្ម REST/GRPC ។
ឧបករណ៍ MLOps ដ៏ល្អបំផុតមួយសម្រាប់ការកែលម្អដំណើរការរៀនរបស់ម៉ាស៊ីនគឺឧបករណ៍នេះ។
វាមានលក្ខណៈសាមញ្ញក្នុងការផ្ទុកម៉ូដែល ML និងសាកល្បងសម្រាប់ការប្រើប្រាស់ និងសុវត្ថិភាពដោយប្រើ Seldon Core។
វាផ្តល់ជូន:
- ការដាក់ពង្រាយគំរូអាចត្រូវបានធ្វើឱ្យសាមញ្ញជាងមុនជាមួយនឹងជម្រើសជាច្រើន ដូចជាការដាក់ពង្រាយ Canary ។
- ដើម្បីយល់ពីមូលហេតុដែលការព្យាករណ៍ជាក់លាក់ត្រូវបានធ្វើឡើង សូមប្រើអ្នកពន្យល់គំរូ។
- នៅពេលមានបញ្ហាកើតឡើង សូមចាំមើលគំរូផលិតកម្មដោយប្រើប្រព័ន្ធដាស់តឿន។
សន្និដ្ឋាន
MLOps អាចជួយធ្វើឱ្យប្រតិបត្តិការសិក្សារបស់ម៉ាស៊ីនកាន់តែប្រសើរឡើង។ MLOps អាចបង្កើនល្បឿននៃការដាក់ពង្រាយ ធ្វើឱ្យការប្រមូលទិន្នន័យ និងការបំបាត់កំហុសកាន់តែងាយស្រួល និងធ្វើឱ្យប្រសើរឡើងនូវកិច្ចសហការរវាងវិស្វករ និងអ្នកវិទ្យាសាស្ត្រទិន្នន័យ។
ដើម្បីឱ្យអ្នកជ្រើសរើសឧបករណ៍ MLOps ដែលសាកសមបំផុតនឹងតម្រូវការរបស់អ្នក ប្រកាសនេះបានពិនិត្យមើលដំណោះស្រាយ MLOps ពេញនិយមចំនួន 10 ដែលភាគច្រើនជាប្រភពបើកចំហ។
សូមផ្ដល់យោបល់