មាតិកា[លាក់][បង្ហាញ]
- 1 ។ កប៉ាល់ទីតានិច
- 2. ចំណាត់ថ្នាក់ផ្កាអៀរឡង់
- 3. ការព្យាករណ៍តម្លៃផ្ទះនៅបូស្តុន
- 4. ការធ្វើតេស្តគុណភាពស្រា
- 5. ការព្យាករណ៍ទីផ្សារភាគហ៊ុន
- 6. ការណែនាំអំពីភាពយន្ត
- 7. ផ្ទុកការទស្សន៍ទាយសិទ្ធិទទួលបាន
- 8. ការវិភាគមនោសញ្ចេតនាដោយប្រើទិន្នន័យ Twitter
- 9. ការទស្សន៍ទាយការលក់នាពេលអនាគត
- 10. ការរកឃើញព័ត៌មានក្លែងក្លាយ
- 11. ការទស្សន៍ទាយការទិញគូប៉ុង
- 12. ការទស្សន៍ទាយអតិថិជនកូរ
- 13. ការព្យាករណ៍ការលក់ Wallmart
- 14. ការវិភាគទិន្នន័យ Uber
- 15. ការវិភាគ Covid-19
- សន្និដ្ឋាន
ការរៀនម៉ាស៊ីនគឺជាការសិក្សាសាមញ្ញមួយអំពីរបៀបអប់រំកម្មវិធីកុំព្យូទ័រ ឬក្បួនដោះស្រាយដើម្បីកែលម្អបន្តិចម្តងៗលើការងារជាក់លាក់ដែលបង្ហាញនៅកម្រិតខ្ពស់។ ការកំណត់អត្តសញ្ញាណរូបភាព ការរកឃើញការក្លែងបន្លំ ប្រព័ន្ធណែនាំ និងកម្មវិធីរៀនម៉ាស៊ីនផ្សេងទៀត បានបង្ហាញឱ្យឃើញថាមានប្រជាប្រិយភាពរួចហើយ។
ការងារ ML ធ្វើឱ្យការងាររបស់មនុស្សសាមញ្ញ និងមានប្រសិទ្ធភាព សន្សំសំចៃពេលវេលា និងធានាបាននូវលទ្ធផលគុណភាពខ្ពស់។ សូម្បីតែ Google ដែលជាម៉ាស៊ីនស្វែងរកដ៏ពេញនិយមបំផុតរបស់ពិភពលោកក៏ប្រើដែរ។ ការរៀនម៉ាស៊ីន.
ពីការវិភាគសំណួររបស់អ្នកប្រើ និងការផ្លាស់ប្តូរលទ្ធផលដោយផ្អែកលើលទ្ធផលទៅការបង្ហាញប្រធានបទ និងការផ្សាយពាណិជ្ជកម្មដែលពេញនិយមទាក់ទងនឹងសំណួរនោះ មានជម្រើសជាច្រើនដែលអាចរកបាន។
បច្ចេកវិទ្យាដែលមានទាំងការយល់ឃើញ និងការកែតម្រូវដោយខ្លួនឯងគឺមិនឆ្ងាយទេនាពេលអនាគត។
មធ្យោបាយដ៏អស្ចារ្យបំផុតមួយដើម្បីចាប់ផ្តើមគឺការចាប់ដៃ និងរចនាគម្រោង។ ដូច្នេះហើយ យើងបានចងក្រងបញ្ជីនៃគម្រោងសិក្សាម៉ាស៊ីនកំពូលទាំង 15 សម្រាប់អ្នកចាប់ផ្តើមដំបូង ដើម្បីឲ្យអ្នកចាប់ផ្តើម។
1. កប៉ាល់ទីតានិច
នេះច្រើនតែត្រូវបានចាត់ទុកថាជាកិច្ចការដ៏អស្ចារ្យ និងរីករាយបំផុតសម្រាប់អ្នកដែលចាប់អារម្មណ៍ក្នុងការស្វែងយល់បន្ថែមអំពីការរៀនម៉ាស៊ីន។ ការប្រកួតប្រជែងទីតានិក គឺជាគម្រោងសិក្សាម៉ាស៊ីនដ៏ពេញនិយម ដែលដើរតួជាមធ្យោបាយដ៏ល្អមួយ ដើម្បីស្គាល់វេទិកាវិទ្យាសាស្ត្រទិន្នន័យ Kaggle ។ សំណុំទិន្នន័យ Titanic ត្រូវបានបង្កើតឡើងដោយទិន្នន័យពិតប្រាកដពីការលិចនៃកប៉ាល់ដែលគ្មានវាសនា។
វារួមបញ្ចូលព័ត៌មានលម្អិតដូចជាអាយុរបស់មនុស្ស ស្ថានភាពសេដ្ឋកិច្ចសង្គម ភេទ លេខកាប៊ីន ច្រកចេញដំណើរ និងសំខាន់បំផុតថាតើពួកគេបានរួចជីវិតឬអត់!
បច្ចេកទេស K-Nearest Neighbor និងអ្នកចាត់ថ្នាក់មែកធាងការសម្រេចចិត្តត្រូវបានកំណត់ថានឹងបង្កើតលទ្ធផលល្អបំផុតសម្រាប់គម្រោងនេះ។ ប្រសិនបើអ្នកកំពុងស្វែងរកការប្រកួតប្រជែងចុងសប្តាហ៍ដ៏លឿន ដើម្បីកែលម្អរបស់អ្នក។ សមត្ថភាពរៀនម៉ាស៊ីនមួយនេះនៅលើ Kaggle គឺសម្រាប់អ្នក។
2. ចំណាត់ថ្នាក់ផ្កាអៀរឡង់
អ្នកចាប់ផ្តើមដំបូងចូលចិត្តគម្រោងការចាត់ថ្នាក់ផ្កា iris ហើយវាជាកន្លែងដ៏ល្អមួយដើម្បីចាប់ផ្តើម ប្រសិនបើអ្នកទើបតែរៀនម៉ាស៊ីន។ ប្រវែងនៃ sepals និង petals បែងចែក iris blooms ពីប្រភេទផ្សេងទៀត។ គោលបំណងនៃគម្រោងនេះគឺដើម្បីបំបែកផ្កាជាបីប្រភេទគឺ Virginia, setosa និង Versicolor ។
សម្រាប់លំហាត់ក្នុងចំណាត់ថ្នាក់ គម្រោងនេះប្រើប្រាស់សំណុំទិន្នន័យផ្កា Iris ដែលជួយអ្នកសិក្សាក្នុងការស្វែងយល់ពីមូលដ្ឋានគ្រឹះនៃការដោះស្រាយជាមួយនឹងតម្លៃជាលេខ និងទិន្នន័យ។ សំណុំទិន្នន័យផ្កា iris គឺជាកញ្ចប់តូចមួយដែលអាចរក្សាទុកក្នុងអង្គចងចាំដោយមិនចាំបាច់ធ្វើមាត្រដ្ឋាន។
3. ការព្យាករណ៍តម្លៃផ្ទះនៅបូស្តុន
ល្បីមួយទៀត សំណុំទិន្នន័យសម្រាប់អ្នកទើបចាប់ផ្តើមថ្មីក្នុងការរៀនម៉ាស៊ីន គឺជាទិន្នន័យលំនៅដ្ឋានបូស្តុន។ គោលដៅរបស់វាគឺដើម្បីព្យាករណ៍តម្លៃផ្ទះនៅក្នុងសង្កាត់ផ្សេងៗនៃទីក្រុងបូស្តុន។ វារួមបញ្ចូលស្ថិតិសំខាន់ៗដូចជាអាយុ អត្រាពន្ធលើអចលនទ្រព្យ អត្រាឧក្រិដ្ឋកម្ម និងសូម្បីតែភាពជិតស្និទ្ធនឹងមជ្ឈមណ្ឌលការងារ ដែលទាំងអស់នេះអាចប៉ះពាល់ដល់តម្លៃលំនៅដ្ឋាន។
សំណុំទិន្នន័យគឺសាមញ្ញ និងតូច ដែលធ្វើឱ្យវាសាមញ្ញក្នុងការពិសោធន៍សម្រាប់អ្នកទើបចាប់ផ្តើម។ ដើម្បីស្វែងយល់ថាតើកត្តាអ្វីខ្លះដែលមានឥទ្ធិពលលើតម្លៃអចលនទ្រព្យនៅបូស្តុន បច្ចេកទេសនៃការតំរែតំរង់ត្រូវបានប្រើប្រាស់យ៉ាងខ្លាំងលើប៉ារ៉ាម៉ែត្រផ្សេងៗ។ វាជាកន្លែងដ៏ល្អមួយដើម្បីអនុវត្តបច្ចេកទេសតំរែតំរង់ និងវាយតម្លៃថាតើពួកវាដំណើរការបានល្អប៉ុណ្ណា។
4. ការធ្វើតេស្តគុណភាពស្រា
ស្រាគឺជាភេសជ្ជៈមានជាតិអាល់កុលមិនធម្មតាដែលត្រូវការជាតិ fermenting ច្រើនឆ្នាំ។ ជាលទ្ធផល ស្រាដបបុរាណគឺជាស្រាដែលមានតម្លៃថ្លៃ និងមានគុណភាពខ្ពស់។ ការជ្រើសរើសដបស្រាដ៏ល្អ ទាមទារចំនេះដឹងរសជាតិស្រាជាច្រើនឆ្នាំ ហើយវាអាចជាដំណើរការដែលប៉ះពាល់ ឬខកខាន។
គម្រោងធ្វើតេស្តគុណភាពស្រាវាយតម្លៃស្រាដោយប្រើតេស្តរូបវិទ្យា ដូចជាកម្រិតជាតិអាល់កុល អាស៊ីតថេរ ដង់ស៊ីតេ pH និងកត្តាផ្សេងៗទៀត។ គម្រោងនេះក៏កំណត់លក្ខណៈវិនិច្ឆ័យគុណភាព និងបរិមាណរបស់ស្រាផងដែរ។ ជាលទ្ធផល ការទិញស្រាក្លាយជាខ្យល់។
5. ការព្យាករណ៍ទីផ្សារភាគហ៊ុន
គំនិតផ្តួចផ្តើមនេះគួរឱ្យចាប់អារម្មណ៍ថាតើអ្នកធ្វើការក្នុងវិស័យហិរញ្ញវត្ថុឬអត់។ ទិន្នន័យទីផ្សារភាគហ៊ុនត្រូវបានសិក្សាយ៉ាងទូលំទូលាយដោយអ្នកសិក្សា អាជីវកម្ម និងសូម្បីតែជាប្រភពនៃប្រាក់ចំណូលបន្ទាប់បន្សំ។ សមត្ថភាពរបស់អ្នកវិទ្យាសាស្ត្រទិន្នន័យក្នុងការសិក្សា និងរុករកទិន្នន័យស៊េរីពេលវេលាក៏សំខាន់ផងដែរ។ ទិន្នន័យពីទីផ្សារភាគហ៊ុនគឺជាកន្លែងដ៏ល្អមួយដើម្បីចាប់ផ្តើម។
ខ្លឹមសារនៃកិច្ចខិតខំប្រឹងប្រែងគឺដើម្បីព្យាករណ៍តម្លៃអនាគតនៃភាគហ៊ុន។ នេះគឺផ្អែកលើការអនុវត្តទីផ្សារបច្ចុប្បន្ន ក៏ដូចជាស្ថិតិពីឆ្នាំមុនៗ។ Kaggle បាននឹងកំពុងប្រមូលទិន្នន័យនៅលើសន្ទស្សន៍ NIFTY-50 តាំងពីឆ្នាំ 2000 ហើយបច្ចុប្បន្នវាត្រូវបានធ្វើបច្ចុប្បន្នភាពរៀងរាល់សប្តាហ៍។ ចាប់តាំងពីថ្ងៃទី 1 ខែមករា ឆ្នាំ 2000 វាមានតម្លៃភាគហ៊ុនសម្រាប់អង្គការជាង 50 ។
6. ការណែនាំភាពយន្ត
ខ្ញុំប្រាកដថាអ្នកមានអារម្មណ៍បែបនោះបន្ទាប់ពីបានមើលរឿងល្អមួយ។ តើអ្នកធ្លាប់មានអារម្មណ៍រំភើបក្នុងការរំងាប់អារម្មណ៍របស់អ្នកដោយការមើលភាពយន្តស្រដៀងគ្នានេះច្រើនដែរឬទេ?
យើងដឹងថាសេវាកម្ម OTT ដូចជា Netflix បានកែលម្អប្រព័ន្ធណែនាំរបស់ពួកគេយ៉ាងខ្លាំង។ ក្នុងនាមជាសិស្សរៀនម៉ាស៊ីន អ្នកនឹងត្រូវយល់ពីរបៀបដែលក្បួនដោះស្រាយបែបនេះកំណត់អតិថិជនដោយផ្អែកលើចំណូលចិត្ត និងការវាយតម្លៃរបស់ពួកគេ។
ទិន្នន័យ IMDB ដែលបានកំណត់នៅលើ Kaggle ទំនងជាពេញលេញបំផុតមួយដែលអនុញ្ញាតឱ្យគំរូការណែនាំត្រូវបានសន្និដ្ឋានដោយផ្អែកលើចំណងជើងភាពយន្ត ការវាយតម្លៃអតិថិជន ប្រភេទ និងកត្តាផ្សេងទៀត។ វាក៏ជាវិធីសាស្រ្តដ៏ល្អមួយផងដែរក្នុងការស្វែងយល់អំពី Content-Based Filtering និង Feature Engineering។
7. ផ្ទុកការទស្សន៍ទាយសិទ្ធិទទួលបាន
ពិភពលោកវិលជុំវិញប្រាក់កម្ចី។ ប្រភពប្រាក់ចំណេញសំខាន់របស់ធនាគារបានមកពីការប្រាក់លើប្រាក់កម្ចី។ ដូច្នេះ ពួកគេគឺជាអាជីវកម្មមូលដ្ឋានរបស់ពួកគេ។
បុគ្គល ឬក្រុមបុគ្គលអាចពង្រីកសេដ្ឋកិច្ចបានតែដោយការវិនិយោគប្រាក់នៅក្នុងក្រុមហ៊ុនមួយក្នុងក្តីសង្ឃឹមថានឹងឃើញវាកើនឡើងនៅក្នុងតម្លៃនាពេលអនាគត។ ជួនកាលវាមានសារៈសំខាន់ណាស់ក្នុងការស្វែងរកប្រាក់កម្ចីដើម្បីអាចទទួលយកហានិភ័យនៃធម្មជាតិនេះ ហើយថែមទាំងចូលរួមក្នុងការសប្បាយមួយចំនួនរបស់ពិភពលោកផងដែរ។
មុនពេលប្រាក់កម្ចីអាចត្រូវបានទទួលយក ធនាគារជាធម្មតាមានដំណើរការដ៏តឹងរ៉ឹងមួយដែលត្រូវអនុវត្តតាម។ ដោយសារប្រាក់កម្ចីគឺជាទិដ្ឋភាពដ៏សំខាន់នៃជីវិតរបស់មនុស្សជាច្រើន ការទស្សន៍ទាយអំពីសិទ្ធិទទួលបានប្រាក់កម្ចីដែលនរណាម្នាក់ស្នើសុំនឹងមានប្រយោជន៍ខ្លាំងណាស់ ដែលអនុញ្ញាតឱ្យមានការរៀបចំផែនការល្អប្រសើរលើសពីប្រាក់កម្ចីដែលត្រូវបានទទួលយក ឬបដិសេធ។
8. ការវិភាគអារម្មណ៍ដោយប្រើទិន្នន័យ Twitter
អរគុណចំពោះ បណ្តាញព័ត៌មានសង្គម ដូចជា Twitter, Facebook និង Reddit ការបន្ថែមមតិ និងនិន្នាការទទួលបានភាពងាយស្រួលគួរឱ្យកត់សម្គាល់។ ព័ត៌មាននេះត្រូវបានប្រើដើម្បីលុបបំបាត់មតិលើព្រឹត្តិការណ៍ មនុស្ស កីឡា និងប្រធានបទផ្សេងទៀត។ គំនិតផ្តួចផ្តើមការរៀនម៉ាស៊ីនទាក់ទងនឹងការជីកយករ៉ែតាមមតិកំពុងត្រូវបានអនុវត្តនៅក្នុងការកំណត់ផ្សេងៗគ្នា រួមទាំងយុទ្ធនាការនយោបាយ និងការវាយតម្លៃផលិតផល Amazon ។
គម្រោងនេះនឹងមើលទៅអស្ចារ្យនៅក្នុងផលប័ត្ររបស់អ្នក! សម្រាប់ការរកឃើញអារម្មណ៍ និងការវិភាគផ្អែកលើទិដ្ឋភាព បច្ចេកទេសដូចជាម៉ាស៊ីនវ៉ិចទ័រគាំទ្រ ការតំរែតំរង់ និងក្បួនដោះស្រាយចំណាត់ថ្នាក់អាចត្រូវបានប្រើយ៉ាងទូលំទូលាយ (ស្វែងរកការពិត និងមតិ)។
9. ការព្យាករណ៍ការលក់នាពេលអនាគត
អាជីវកម្ម និងពាណិជ្ជករ B2C ធំៗចង់ដឹងថាតើផលិតផលនីមួយៗនៅក្នុងស្តុករបស់ពួកគេនឹងលក់បានប៉ុន្មាន។ ការព្យាករណ៍ការលក់ជួយម្ចាស់អាជីវកម្មក្នុងការកំណត់ថាតើទំនិញណាដែលមានតម្រូវការខ្ពស់។ ការព្យាករណ៍ការលក់ត្រឹមត្រូវនឹងកាត់បន្ថយការខ្ជះខ្ជាយយ៉ាងខ្លាំង ខណៈពេលដែលកំណត់ពីផលប៉ះពាល់បន្ថែមលើថវិកានាពេលអនាគតផងដែរ។
អ្នកលក់រាយដូចជា Walmart, IKEA, Big Basket និង Big Bazaar ប្រើការព្យាករណ៍ការលក់ដើម្បីប៉ាន់ប្រមាណតម្រូវការផលិតផល។ អ្នកត្រូវតែស៊ាំជាមួយបច្ចេកទេសផ្សេងៗនៃការសម្អាតទិន្នន័យឆៅ ដើម្បីសាងសង់គម្រោង ML បែបនេះ។ ដូចគ្នានេះផងដែរ ការយល់ច្បាស់នៃការវិភាគតំរែតំរង់ ជាពិសេសតំរែតំរង់លីនេអ៊ែរសាមញ្ញគឺត្រូវបានទាមទារ។
សម្រាប់ការងារប្រភេទនេះ អ្នកនឹងត្រូវជួលបណ្ណាល័យដូចជា Dora, Scrubadub, Pandas, NumPy និងផ្សេងៗទៀត។
10. ការរកឃើញព័ត៌មានក្លែងក្លាយ
វាជាការខិតខំប្រឹងប្រែងរៀនសូត្រដោយម៉ាស៊ីនដ៏ទំនើបមួយទៀតដែលមានគោលបំណងដល់សិស្សសាលា។ ព័ត៌មានក្លែងក្លាយកំពុងរីករាលដាលដូចភ្លើងឆេះព្រៃ ដូចដែលយើងដឹងស្រាប់ហើយ។ អ្វីគ្រប់យ៉ាងគឺអាចរកបាននៅលើប្រព័ន្ធផ្សព្វផ្សាយសង្គមចាប់ពីការភ្ជាប់បុគ្គលទៅនឹងការអានព័ត៌មានប្រចាំថ្ងៃ។
ជាលទ្ធផល ការរកឃើញព័ត៌មានមិនពិតមានការលំបាកកាន់តែខ្លាំងឡើងក្នុងប៉ុន្មានថ្ងៃនេះ។ បណ្តាញប្រព័ន្ធផ្សព្វផ្សាយសង្គមធំៗជាច្រើនដូចជា Facebook និង Twitter មានក្បួនដោះស្រាយរួចហើយដើម្បីស្វែងរកព័ត៌មានក្លែងក្លាយនៅក្នុងការបង្ហោះ និងព័ត៌មាន។
ដើម្បីកំណត់អត្តសញ្ញាណព័ត៌មានមិនពិត គម្រោង ML ប្រភេទនេះត្រូវការការយល់ដឹងហ្មត់ចត់អំពីវិធីសាស្រ្ត NLP ជាច្រើន និងក្បួនដោះស្រាយការចាត់ថ្នាក់ (PassiveAggressiveClassifier ឬ Naive Bayes classifier) ។
11. ការទស្សន៍ទាយការទិញគូប៉ុង
អតិថិជនកំពុងគិតអំពីការទិញតាមអ៊ីនធឺណិតកាន់តែខ្លាំងឡើង នៅពេលដែលមេរោគឆ្លងបានវាយប្រហារលើភពផែនដីក្នុងឆ្នាំ 2020។ ជាលទ្ធផល គ្រឹះស្ថានទិញទំនិញត្រូវបានបង្ខំឱ្យផ្លាស់ប្តូរអាជីវកម្មរបស់ពួកគេតាមអ៊ីនធឺណិត។
ម៉្យាងវិញទៀត អតិថិជននៅតែស្វែងរកការផ្តល់ជូនដ៏អស្ចារ្យ ដូចជាពួកគេនៅក្នុងហាង ហើយកំពុងស្វែងរកគូប៉ុងសន្សំប្រាក់កាន់តែច្រើន។ មានសូម្បីតែគេហទំព័រដែលឧទ្ទិសដល់ការបង្កើតប័ណ្ណសម្រាប់អតិថិជនបែបនេះ។ អ្នកអាចស្វែងយល់អំពីការជីកយករ៉ែទិន្នន័យនៅក្នុងការរៀនម៉ាស៊ីន ការផលិតក្រាហ្វរបារ គំនូសតាងរង្វង់ និងអ៊ីស្តូក្រាម ដើម្បីមើលឃើញទិន្នន័យ និងលក្ខណៈវិស្វកម្មជាមួយគម្រោងនេះ។
ដើម្បីបង្កើតការទស្សន៍ទាយ អ្នកក៏អាចរកមើលវិធីសាស្រ្ត imputation ទិន្នន័យសម្រាប់ការគ្រប់គ្រងតម្លៃ NA និងភាពស្រដៀងគ្នានៃ cosine នៃអថេរ។
12. ការទស្សន៍ទាយរបស់អតិថិជន
អ្នកប្រើប្រាស់គឺជាទ្រព្យសម្បត្តិដ៏សំខាន់បំផុតរបស់ក្រុមហ៊ុន ហើយការរក្សាវាមានសារៈសំខាន់សម្រាប់អាជីវកម្មណាមួយដែលមានគោលបំណងបង្កើនប្រាក់ចំណូល និងបង្កើតទំនាក់ទំនងដ៏មានអត្ថន័យរយៈពេលវែងជាមួយពួកគេ។
លើសពីនេះ តម្លៃនៃការទទួលបានអតិថិជនថ្មីគឺខ្ពស់ជាង XNUMX ដងនៃការចំណាយលើការទ្រទ្រង់អតិថិជនដែលមានស្រាប់។ ការកូរ/ការទាក់ទាញអតិថិជន គឺជាបញ្ហាអាជីវកម្មដែលគេស្គាល់យ៉ាងច្បាស់ ដែលអតិថិជន ឬអតិថិជនឈប់ធ្វើអាជីវកម្មជាមួយសេវាកម្ម ឬក្រុមហ៊ុន។
តាមឧត្ដមគតិ ពួកគេនឹងលែងជាអតិថិជនបង់ប្រាក់ទៀតហើយ។ អតិថិជនត្រូវបានគេចាត់ទុកថាត្រូវបានបញ្ឆេះ ប្រសិនបើវាមានរយៈពេលជាក់លាក់មួយចាប់តាំងពីអតិថិជនបានធ្វើអន្តរកម្មជាមួយក្រុមហ៊ុនចុងក្រោយ។ ការកំណត់ថាតើអតិថិជននឹងកូរ ក៏ដូចជាការផ្តល់ព័ត៌មានដែលពាក់ព័ន្ធយ៉ាងឆាប់រហ័សក្នុងគោលបំណងរក្សាអតិថិជន គឺជាកត្តាសំខាន់ក្នុងការកាត់បន្ថយភាពច្របូកច្របល់។
ខួរក្បាលរបស់យើងមិនអាចរំពឹងថានឹងមានការផ្លាស់ប្តូរអតិថិជនសម្រាប់អតិថិជនរាប់លាននាក់។ នេះគឺជាកន្លែងដែល machine learning អាចជួយបាន។
13. ការព្យាករណ៍ការលក់ Wallmart
កម្មវិធីមួយក្នុងចំណោមកម្មវិធីដែលលេចធ្លោបំផុតនៃការរៀនម៉ាស៊ីនគឺការព្យាករណ៍ការលក់ ដែលពាក់ព័ន្ធនឹងការរកឃើញលក្ខណៈដែលមានឥទ្ធិពលលើការលក់ផលិតផល និងការប្រមើលមើលបរិមាណលក់នាពេលអនាគត។
សំណុំទិន្នន័យ Walmart ដែលមានទិន្នន័យលក់ពី 45 ទីតាំង ត្រូវបានប្រើនៅក្នុងការសិក្សាអំពីម៉ាស៊ីននេះ។ ការលក់ក្នុងមួយហាង តាមប្រភេទ លើមូលដ្ឋានប្រចាំសប្តាហ៍ត្រូវបានរួមបញ្ចូលក្នុងសំណុំទិន្នន័យ។ គោលបំណងនៃគម្រោងសិក្សាម៉ាស៊ីននេះគឺដើម្បីគិតទុកជាមុនអំពីការលក់សម្រាប់នាយកដ្ឋាននីមួយៗនៅក្នុងហាងនីមួយៗ ដើម្បីឱ្យពួកគេអាចធ្វើការធ្វើឱ្យប្រសើរនូវឆានែលដែលជំរុញដោយទិន្នន័យ និងការសម្រេចចិត្តធ្វើផែនការសារពើភ័ណ្ឌកាន់តែប្រសើរឡើង។
ការធ្វើការជាមួយសំណុំទិន្នន័យ Walmart គឺពិបាកព្រោះវាមានព្រឹត្តិការណ៍ markdown ដែលបានជ្រើសរើសដែលមានឥទ្ធិពលលើការលក់ ហើយគួរតែត្រូវបានពិចារណា។
14. ការវិភាគទិន្នន័យ Uber
នៅពេលនិយាយអំពីការអនុវត្ត និងការរួមបញ្ចូលការរៀនម៉ាស៊ីន និងការរៀនស៊ីជម្រៅនៅក្នុងកម្មវិធីរបស់ពួកគេ សេវាកម្មចែករំលែកការជិះដ៏ពេញនិយមគឺនៅមិនឆ្ងាយប៉ុន្មានទេ។ ជារៀងរាល់ឆ្នាំ វាដំណើរការការធ្វើដំណើររាប់ពាន់លាន ដែលអនុញ្ញាតឱ្យអ្នកធ្វើដំណើរអាចធ្វើដំណើរបានគ្រប់ពេលនៃថ្ងៃ ឬយប់។
ដោយសារតែវាមានមូលដ្ឋានអតិថិជនធំបែបនេះ វាត្រូវការសេវាកម្មអតិថិជនពិសេសដើម្បីដោះស្រាយការតវ៉ារបស់អ្នកប្រើប្រាស់ឱ្យបានលឿនតាមដែលអាចធ្វើទៅបាន។
Uber មានសំណុំទិន្នន័យនៃការទៅយករាប់លាន ដែលវាអាចប្រើដើម្បីវិភាគ និងបង្ហាញការធ្វើដំណើររបស់អតិថិជន ដើម្បីស្វែងយល់ពីការយល់ដឹង និងកែលម្អបទពិសោធន៍របស់អតិថិជន។
15. ការវិភាគ Covid-19
កូវីដ-១៩ បានសាយភាយពេញពិភពលោកសព្វថ្ងៃនេះ ហើយមិនមែនគ្រាន់តែក្នុងន័យនៃជំងឺរាតត្បាតប៉ុណ្ណោះទេ។ ខណៈពេលដែលអ្នកជំនាញផ្នែកវេជ្ជសាស្រ្ដកំពុងផ្តោតលើការបង្កើតវ៉ាក់សាំងដ៏មានប្រសិទ្ធភាព និងការចាក់វ៉ាក់សាំងពិភពលោក។ អ្នកវិទ្យាសាស្ត្រទិន្នន័យ។ មិនឆ្ងាយប៉ុន្មានទេ។
ករណីថ្មី ការរាប់ចំនួនសកម្មប្រចាំថ្ងៃ ការស្លាប់ និងស្ថិតិនៃការធ្វើតេស្តត្រូវបានផ្សព្វផ្សាយជាសាធារណៈ។ ការព្យាករណ៍ត្រូវបានធ្វើឡើងជារៀងរាល់ថ្ងៃដោយផ្អែកលើការផ្ទុះឡើងនៃជំងឺ SARS នៃសតវត្សមុន។ សម្រាប់ការនេះ អ្នកអាចប្រើការវិភាគតំរែតំរង់ និងគាំទ្រគំរូព្យាករណ៍ផ្អែកលើម៉ាស៊ីនវ៉ិចទ័រ។
សន្និដ្ឋាន
ដើម្បីសង្ខេប យើងបានពិភាក្សាអំពីគម្រោង ML កំពូលមួយចំនួនដែលនឹងជួយអ្នកក្នុងការសាកល្បងកម្មវិធីសិក្សាម៉ាស៊ីន ក៏ដូចជាការយល់ឃើញពីគំនិត និងការអនុវត្តរបស់វា។ ការដឹងពីរបៀបរួមបញ្ចូល Machine Learning អាចជួយអ្នកឱ្យឈានទៅមុខក្នុងអាជីពរបស់អ្នក នៅពេលដែលបច្ចេកវិទ្យាចូលកាន់កាប់នៅក្នុងគ្រប់ឧស្សាហកម្មទាំងអស់។
ពេលកំពុងរៀន Machine Learning យើងសូមណែនាំឱ្យអ្នកអនុវត្តគោលគំនិតរបស់អ្នក ហើយសរសេរក្បួនដោះស្រាយទាំងអស់របស់អ្នក។ ការសរសេរក្បួនដោះស្រាយពេលកំពុងរៀនគឺសំខាន់ជាងការអនុវត្តន៍គម្រោងមួយ ហើយវាក៏ផ្តល់ឱ្យអ្នកនូវអត្ថប្រយោជន៍មួយក្នុងការស្វែងយល់អំពីប្រធានបទឱ្យបានត្រឹមត្រូវផងដែរ។
សូមផ្ដល់យោបល់