ສາລະບານ[ເຊື່ອງ][ສະແດງ]
- 1 Titanic
- 2. ການຈັດປະເພດດອກໄມ້ໄອແລນ
- 3. ການຄາດເດົາລາຄາເຮືອນ Boston
- 4. ການທົດສອບຄຸນນະພາບເຫຼົ້າແວງ
- 5. ການຄາດເດົາຕະຫຼາດຫຼັກຊັບ
- 6. ແນະນຳໜັງ
- 7. Load ການຄາດເດົາການມີສິດໄດ້ຮັບ
- 8. ການວິເຄາະຄວາມຮູ້ສຶກໂດຍໃຊ້ຂໍ້ມູນ Twitter
- 9. ການຄາດເດົາການຂາຍໃນອະນາຄົດ
- 10. ການກວດຫາຂ່າວປອມ
- 11. ການຄາດເດົາການຊື້ຄູປອງ
- 12. ການຄາດເດົາຂອງລູກຄ້າ
- 13. ການພະຍາກອນການຂາຍ Wallmart
- 14. ການວິເຄາະຂໍ້ມູນ Uber
- 15. ການວິເຄາະ Covid-19
- ສະຫຼຸບ
ການຮຽນຮູ້ຂອງເຄື່ອງຈັກແມ່ນການສຶກສາແບບງ່າຍໆກ່ຽວກັບວິທີການສຶກສາໂຄງການຄອມພິວເຕີຫຼືລະບົບວິທີການເພື່ອຄ່ອຍໆປັບປຸງໃນຫນ້າວຽກສະເພາະທີ່ນໍາສະເຫນີໃນລະດັບສູງ. ການກໍານົດຮູບພາບ, ການກວດສອບການສໍ້ໂກງ, ລະບົບການແນະນໍາ, ແລະຄໍາຮ້ອງສະຫມັກການຮຽນຮູ້ເຄື່ອງຈັກອື່ນໆໄດ້ພິສູດແລ້ວວ່າເປັນທີ່ນິຍົມ.
ວຽກ ML ເຮັດໃຫ້ການເຮັດວຽກຂອງມະນຸດງ່າຍດາຍແລະມີປະສິດທິພາບ, ປະຫຍັດເວລາແລະຮັບປະກັນຜົນໄດ້ຮັບທີ່ມີຄຸນນະພາບສູງ. ເຖິງແມ່ນວ່າ Google, ເຄື່ອງຈັກຊອກຫາທີ່ນິຍົມທີ່ສຸດໃນໂລກ, ໃຊ້ ການຮຽນຮູ້ເຄື່ອງຈັກ.
ຈາກການວິເຄາະການສອບຖາມຂອງຜູ້ໃຊ້ແລະການປ່ຽນແປງຜົນໄດ້ຮັບໂດຍອີງໃສ່ຜົນໄດ້ຮັບເພື່ອສະແດງຫົວຂໍ້ທີ່ມີທ່າອ່ຽງແລະການໂຄສະນາທີ່ກ່ຽວຂ້ອງກັບການສອບຖາມ, ມີຫຼາຍທາງເລືອກທີ່ມີຢູ່.
ເຕັກໂນໂລຊີທີ່ມີທັງການຮັບຮູ້ແລະການແກ້ໄຂດ້ວຍຕົນເອງແມ່ນບໍ່ໄກໃນອະນາຄົດ.
ຫນຶ່ງໃນວິທີທີ່ຍິ່ງໃຫຍ່ທີ່ສຸດທີ່ຈະເລີ່ມຕົ້ນແມ່ນການຈັບມືແລະອອກແບບໂຄງການ. ດັ່ງນັ້ນ, ພວກເຮົາໄດ້ລວບລວມບັນຊີລາຍຊື່ຂອງ 15 ໂຄງການການຮຽນຮູ້ເຄື່ອງຈັກຊັ້ນນໍາສໍາລັບຜູ້ເລີ່ມຕົ້ນເພື່ອໃຫ້ທ່ານເລີ່ມຕົ້ນ.
1. Titanic
ນີ້ມັກຈະຖືວ່າເປັນວຽກງານທີ່ຍິ່ງໃຫຍ່ທີ່ສຸດແລະມີຄວາມສຸກທີ່ສຸດສໍາລັບທຸກຄົນທີ່ສົນໃຈໃນການຮຽນຮູ້ເພີ່ມເຕີມກ່ຽວກັບການຮຽນຮູ້ເຄື່ອງຈັກ. ສິ່ງທ້າທາຍຂອງ Titanic ເປັນໂຄງການການຮຽນຮູ້ເຄື່ອງຈັກທີ່ເປັນທີ່ນິຍົມເຊິ່ງຍັງເປັນວິທີທີ່ດີທີ່ຈະຮູ້ຈັກກັບເວທີວິທະຍາສາດຂໍ້ມູນ Kaggle. ຊຸດຂໍ້ມູນ Titanic ແມ່ນປະກອບດ້ວຍຂໍ້ມູນທີ່ແທ້ຈິງຈາກການຈົມຂອງກໍາປັ່ນທີ່ໂຊກຮ້າຍ.
ມັນປະກອບມີລາຍລະອຽດເຊັ່ນ: ອາຍຸຂອງບຸກຄົນ, ສະຖານະພາບເສດຖະກິດສັງຄົມ, ເພດ, ຈໍານວນ cabin, ທ່າເຮືອຂາອອກ, ແລະ, ສໍາຄັນທີ່ສຸດ, ບໍ່ວ່າຈະຢູ່ລອດ!
ເຕັກນິກ K-Nearest Neighbor ແລະຕົວຈັດປະເພດຕົ້ນໄມ້ການຕັດສິນໃຈໄດ້ຖືກກໍານົດໃຫ້ຜົນໄດ້ຮັບທີ່ດີທີ່ສຸດສໍາລັບໂຄງການນີ້. ຖ້າທ່ານກໍາລັງຊອກຫາສິ່ງທ້າທາຍໄວທ້າຍອາທິດເພື່ອປັບປຸງຂອງທ່ານ ຄວາມສາມາດໃນການຮຽນຮູ້ເຄື່ອງຈັກ, ຫນຶ່ງໃນ Kaggle ນີ້ແມ່ນສໍາລັບທ່ານ.
2. ການຈັດປະເພດດອກໄອແລນ
ຜູ້ເລີ່ມຕົ້ນມັກໂຄງການຈັດປະເພດດອກ iris, ແລະມັນເປັນບ່ອນທີ່ດີທີ່ຈະເລີ່ມຕົ້ນຖ້າທ່ານໃຫມ່ໃນການຮຽນຮູ້ເຄື່ອງຈັກ. ຄວາມຍາວຂອງກາບດອກ ແລະ ກີບດອກຈຳແນກການອອກດອກຂອງໄອຣິສຈາກຊະນິດອື່ນ. ຈຸດປະສົງຂອງໂຄງການນີ້ແມ່ນເພື່ອແຍກດອກໄມ້ອອກເປັນສາມຊະນິດ: Virginia, setosa, ແລະ Versicolor.
ສໍາລັບການອອກກໍາລັງກາຍການຈັດປະເພດ, ໂຄງການໃຊ້ຊຸດຂໍ້ມູນດອກໄມ້ Iris, ເຊິ່ງຊ່ວຍໃຫ້ນັກຮຽນຮຽນຮູ້ພື້ນຖານຂອງການຈັດການກັບມູນຄ່າແລະຂໍ້ມູນຕົວເລກ. ຊຸດຂໍ້ມູນດອກໄມ້ iris ເປັນຊຸດນ້ອຍໆທີ່ສາມາດເກັບຮັກສາໄວ້ໃນຄວາມຊົງຈໍາໄດ້ໂດຍບໍ່ຈໍາເປັນຕ້ອງມີຂະຫນາດ.
3. ການຄາດເດົາລາຄາເຮືອນ Boston
ອີກອັນໜຶ່ງທີ່ຮູ້ຈັກກັນດີ ຊຸດຂໍ້ມູນສຳລັບຈົວໃໝ່ໃນການຮຽນຮູ້ເຄື່ອງຈັກ ແມ່ນຂໍ້ມູນທີ່ຢູ່ອາໄສ Boston. ເປົ້າໝາຍຂອງມັນແມ່ນການຄາດຄະເນມູນຄ່າເຮືອນຢູ່ໃນຄຸ້ມບ້ານ Boston ຕ່າງໆ. ມັນປະກອບມີສະຖິຕິທີ່ສໍາຄັນເຊັ່ນ: ອາຍຸ, ອັດຕາພາສີຊັບສິນ, ອັດຕາການອາດຊະຍາກໍາ, ແລະແມ້ກະທັ້ງຄວາມໃກ້ຊິດກັບສູນວຽກ, ເຊິ່ງທັງຫມົດນີ້ອາດຈະສົ່ງຜົນກະທົບຕໍ່ລາຄາທີ່ຢູ່ອາໄສ.
ຊຸດຂໍ້ມູນແມ່ນງ່າຍດາຍແລະຂະຫນາດນ້ອຍ, ເຮັດໃຫ້ມັນງ່າຍດາຍທີ່ຈະທົດລອງກັບຈົວ. ເພື່ອຄິດໄລ່ວ່າປັດໃຈໃດທີ່ມີອິດທິພົນຕໍ່ລາຄາຊັບສິນໃນ Boston, ເຕັກນິກການຖົດຖອຍແມ່ນໃຊ້ຫຼາຍໃນຕົວກໍານົດການຕ່າງໆ. ມັນເປັນບ່ອນທີ່ດີທີ່ຈະປະຕິບັດເຕັກນິກການຖົດຖອຍແລະປະເມີນວ່າພວກມັນເຮັດວຽກໄດ້ດີເທົ່າໃດ.
4. ການທົດສອບຄຸນນະພາບເຫຼົ້າແວງ
ເຫຼົ້າແວງເປັນເຄື່ອງດື່ມທີ່ມີແອນກໍຮໍທີ່ຜິດປົກກະຕິທີ່ຕ້ອງການການຫມັກຫຼາຍປີ. ດ້ວຍເຫດນັ້ນ, ເຫຼົ້າໄຫບູຮານຈຶ່ງເປັນເຫຼົ້າແວງທີ່ມີລາຄາສູງ ແລະ ມີຄຸນນະພາບສູງ. ການເລືອກຂວດເຫຼົ້າແວງທີ່ເໝາະສົມຕ້ອງການຄວາມຮູ້ດ້ານລົດຊາດເຫຼົ້າແວງຫຼາຍປີ, ແລະມັນສາມາດເປັນຂະບວນການທີ່ຫຼົງໄຫຼ.
ໂຄງການທົດສອບຄຸນນະພາບເຫລົ້າທີ່ເຮັດໄດ້ປະເມີນຜົນຂອງເຫຼົ້າແວງໂດຍນໍາໃຊ້ການທົດສອບ physicochemical ເຊັ່ນ: ລະດັບເຫຼົ້າ, ອາຊິດຄົງທີ່, ຄວາມຫນາແຫນ້ນ, pH, ແລະປັດໄຈອື່ນໆ. ໂຄງການດັ່ງກ່າວຍັງກໍານົດເງື່ອນໄຂແລະປະລິມານຂອງເຫຼົ້າແວງ. ດັ່ງນັ້ນ, ການຊື້ເຫຼົ້າແວງກາຍເປັນລົມ.
5. ການຄາດເດົາຕະຫຼາດຫຼັກຊັບ
ການລິເລີ່ມນີ້ເປັນສິ່ງທີ່ຫນ້າສົນໃຈບໍ່ວ່າທ່ານຈະເຮັດວຽກຢູ່ໃນຂະແຫນງການເງິນ. ຂໍ້ມູນຕະຫຼາດຫຼັກຊັບໄດ້ຖືກສຶກສາຢ່າງກວ້າງຂວາງໂດຍນັກວິຊາການ, ທຸລະກິດ, ແລະເຖິງແມ່ນວ່າເປັນແຫຼ່ງລາຍຮັບຮອງ. ຄວາມສາມາດຂອງນັກວິທະຍາສາດຂໍ້ມູນໃນການສຶກສາ ແລະສຳຫຼວດຂໍ້ມູນຊຸດເວລາແມ່ນມີຄວາມສຳຄັນເຊັ່ນກັນ. ຂໍ້ມູນຈາກຕະຫຼາດຫຼັກຊັບແມ່ນສະຖານທີ່ທີ່ດີທີ່ຈະເລີ່ມຕົ້ນ.
ໂດຍເນື້ອແທ້ແລ້ວຂອງຄວາມພະຍາຍາມແມ່ນເພື່ອຄາດຄະເນມູນຄ່າໃນອະນາຄົດຂອງຫຼັກຊັບ. ນີ້ແມ່ນອີງໃສ່ການປະຕິບັດຂອງຕະຫຼາດໃນປະຈຸບັນເຊັ່ນດຽວກັນກັບສະຖິຕິຈາກປີທີ່ຜ່ານມາ. Kaggle ໄດ້ເກັບກໍາຂໍ້ມູນຢູ່ໃນດັດຊະນີ NIFTY-50 ຕັ້ງແຕ່ປີ 2000, ແລະປະຈຸບັນມັນຖືກປັບປຸງທຸກອາທິດ. ນັບຕັ້ງແຕ່ວັນທີ 1 ມັງກອນ 2000, ມັນໄດ້ບັນຈຸລາຄາຫຼັກຊັບສໍາລັບຫຼາຍກວ່າ 50 ອົງການຈັດຕັ້ງ.
6. ແນະນຳໜັງ
ຂ້ອຍແນ່ໃຈວ່າເຈົ້າເຄີຍມີຄວາມຮູ້ສຶກນັ້ນຫຼັງຈາກໄດ້ເບິ່ງຮູບເງົາທີ່ດີ. ເຈົ້າເຄີຍຮູ້ສຶກວ່າມີແຮງກະຕຸ້ນທີ່ຈະກະຕຸ້ນຄວາມຮູ້ສຶກຂອງເຈົ້າໂດຍການເບິ່ງຮູບເງົາທີ່ຄ້າຍຄືກັນແບບເມົາເຫຼົ້າບໍ?
ພວກເຮົາຮູ້ວ່າການບໍລິການ OTT ເຊັ່ນ Netflix ໄດ້ປັບປຸງລະບົບການແນະນໍາຂອງພວກເຂົາຢ່າງຫຼວງຫຼາຍ. ໃນຖານະເປັນນັກສຶກສາການຮຽນຮູ້ເຄື່ອງຈັກ, ທ່ານຈະຕ້ອງເຂົ້າໃຈວິທີການດັ່ງກ່າວເປົ້າຫມາຍລູກຄ້າໂດຍອີງໃສ່ຄວາມມັກແລະການທົບທວນຄືນຂອງເຂົາເຈົ້າ.
ຂໍ້ມູນ IMDB ທີ່ຕັ້ງໄວ້ໃນ Kaggle ເບິ່ງຄືວ່າເປັນອັນໜຶ່ງທີ່ສົມບູນທີ່ສຸດ, ອະນຸຍາດໃຫ້ຕົວແບບການແນະນຳສາມາດສະຫຼຸບໄດ້ໂດຍອີງໃສ່ຫົວຂໍ້ຮູບເງົາ, ການໃຫ້ຄະແນນຂອງລູກຄ້າ, ປະເພດ ແລະປັດໃຈອື່ນໆ. ມັນຍັງເປັນວິທີທີ່ດີເລີດທີ່ຈະຮຽນຮູ້ກ່ຽວກັບການກັ່ນຕອງເນື້ອຫາ ແລະວິສະວະກໍາຄຸນສົມບັດ.
7. ໂຫຼດການຄາດເດົາການມີສິດໄດ້ຮັບ
ໂລກຫມຸນຮອບເງິນກູ້. ແຫຼ່ງກຳໄລຫຼັກຂອງທະນາຄານແມ່ນມາຈາກດອກເບ້ຍເງິນກູ້. ເພາະສະນັ້ນ, ພວກເຂົາເປັນທຸລະກິດພື້ນຖານຂອງພວກເຂົາ.
ບຸກຄົນຫຼືກຸ່ມຂອງບຸກຄົນພຽງແຕ່ສາມາດຂະຫຍາຍເສດຖະກິດໂດຍການລົງທຶນເງິນໃນບໍລິສັດໃນຄວາມຫວັງທີ່ຈະເຫັນມັນມີມູນຄ່າເພີ່ມຂຶ້ນໃນອະນາຄົດ. ບາງຄັ້ງມັນເປັນສິ່ງສໍາຄັນທີ່ຈະສະແຫວງຫາເງິນກູ້ເພື່ອໃຫ້ສາມາດມີຄວາມສ່ຽງຕໍ່ລັກສະນະນີ້ແລະແມ້ກະທັ້ງສ່ວນຫນຶ່ງໃນຄວາມສຸກຂອງໂລກບາງຢ່າງ.
ກ່ອນທີ່ເງິນກູ້ອາດຈະໄດ້ຮັບການຍອມຮັບ, ທະນາຄານປົກກະຕິມີຂະບວນການທີ່ເຄັ່ງຄັດພໍສົມຄວນທີ່ຈະປະຕິບັດຕາມ. ເນື່ອງຈາກວ່າເງິນກູ້ແມ່ນລັກສະນະທີ່ສໍາຄັນຂອງຊີວິດຂອງຫຼາຍໆຄົນ, ການຄາດເດົາການມີສິດໄດ້ຮັບເງິນກູ້ທີ່ຜູ້ໃດຜູ້ນຶ່ງຍື່ນຂໍຈະເປັນປະໂຫຍດທີ່ສຸດ, ຊ່ວຍໃຫ້ມີການວາງແຜນທີ່ດີກວ່ານອກເຫນືອຈາກການກູ້ຢືມທີ່ຖືກຍອມຮັບຫຼືປະຕິເສດ.
8. ການວິເຄາະຄວາມຮູ້ສຶກໂດຍໃຊ້ຂໍ້ມູນ Twitter
ຂໍຂອບໃຈກັບ ເຄືອຂ່າຍສື່ສັງຄົມ ເຊັ່ນ: Twitter, Facebook, ແລະ Reddit, extrapolating ຄວາມຄິດເຫັນແລະແນວໂນ້ມໄດ້ຮັບງ່າຍຫຼາຍ. ຂໍ້ມູນນີ້ຖືກນໍາໃຊ້ເພື່ອລົບລ້າງຄວາມຄິດເຫັນກ່ຽວກັບເຫດການ, ຄົນ, ກິລາ, ແລະຫົວຂໍ້ອື່ນໆ. ການລິເລີ່ມການຮຽນຮູ້ເຄື່ອງຈັກທີ່ກ່ຽວຂ້ອງກັບການຂຸດຄົ້ນຄວາມຄິດເຫັນແມ່ນຖືກນໍາໃຊ້ໃນຫຼາຍໆການຕັ້ງຄ່າ, ລວມທັງການໂຄສະນາທາງດ້ານການເມືອງແລະການປະເມີນຜະລິດຕະພັນ Amazon.
ໂຄງການນີ້ຈະເບິ່ງ fantastic ໃນຫຼັກຊັບຂອງທ່ານ! ສໍາລັບການກວດສອບຄວາມຮູ້ສຶກແລະການວິເຄາະລັກສະນະ, ເຕັກນິກເຊັ່ນ: ເຄື່ອງ vector ສະຫນັບສະຫນູນ, regression, ແລະ algorithms ການຈັດປະເພດສາມາດນໍາໃຊ້ຢ່າງກວ້າງຂວາງ (ຊອກຫາຂໍ້ເທັດຈິງແລະຄວາມຄິດເຫັນ).
9. ການຄາດເດົາການຂາຍໃນອະນາຄົດ
ທຸລະກິດ B2C ໃຫຍ່ແລະຜູ້ຄ້າຕ້ອງການຮູ້ວ່າແຕ່ລະຜະລິດຕະພັນໃນສິນຄ້າຄົງຄັງຂອງພວກເຂົາຈະຂາຍຫຼາຍປານໃດ. ການຄາດຄະເນການຂາຍຊ່ວຍເຈົ້າຂອງທຸລະກິດໃນການກໍານົດລາຍການທີ່ມີຄວາມຕ້ອງການສູງ. ການຄາດຄະເນການຂາຍທີ່ຖືກຕ້ອງຈະຫຼຸດລົງຢ່າງຫຼວງຫຼາຍຂອງການສູນເສຍໃນຂະນະທີ່ຍັງກໍານົດຜົນກະທົບທີ່ເພີ່ມຂຶ້ນຕໍ່ງົບປະມານໃນອະນາຄົດ.
ຮ້ານຄ້າປີກເຊັ່ນ Walmart, IKEA, Big Basket, ແລະ Big Bazaar ໃຊ້ການຄາດຄະເນການຂາຍເພື່ອຄາດຄະເນຄວາມຕ້ອງການຂອງຜະລິດຕະພັນ. ທ່ານຕ້ອງຄຸ້ນເຄີຍກັບເຕັກນິກຕ່າງໆໃນການເຮັດຄວາມສະອາດຂໍ້ມູນດິບເພື່ອສ້າງໂຄງການ ML ດັ່ງກ່າວ. ນອກຈາກນີ້, ການວິເຄາະການຖົດຖອຍທີ່ດີ, ໂດຍສະເພາະການຖົດຖອຍແບບເສັ້ນງ່າຍດາຍ, ແມ່ນຕ້ອງການ.
ສໍາລັບວຽກງານປະເພດເຫຼົ່ານີ້, ທ່ານຈະຕ້ອງຈ້າງຫ້ອງສະຫມຸດເຊັ່ນ Dora, Scrubadub, Pandas, NumPy, ແລະອື່ນໆ.
10. ການກວດຫາຂ່າວປອມ
ມັນເປັນຄວາມພະຍາຍາມໃນການຮຽນຮູ້ເຄື່ອງຈັກທີ່ທັນສະໄຫມອີກປະການຫນຶ່ງເພື່ອແນໃສ່ເດັກນ້ອຍໂຮງຮຽນ. ຂ່າວປອມແຜ່ລາມໄປຄືໄຟປ່າ, ດັ່ງທີ່ພວກເຮົາທຸກຄົນຮູ້. ທຸກສິ່ງທຸກຢ່າງແມ່ນມີຢູ່ໃນສື່ມວນຊົນສັງຄົມ, ຈາກການເຊື່ອມຕໍ່ບຸກຄົນກັບການອ່ານຂ່າວປະຈໍາວັນ.
ດ້ວຍເຫດນັ້ນ, ການຊອກຄົ້ນຫາຂ່າວບໍ່ເປັນຈິງຈຶ່ງມີຄວາມຫຍຸ້ງຍາກເພີ່ມຂຶ້ນໃນທຸກມື້ນີ້. ເຄືອຂ່າຍສື່ສັງຄົມໃຫຍ່ໆຈໍານວນຫຼາຍ, ເຊັ່ນເຟສບຸກແລະ Twitter, ມີລະບົບວິທີການເພື່ອກວດຫາຂ່າວປອມໃນການໂພດແລະຟີດ.
ເພື່ອກໍານົດຂ່າວທີ່ບໍ່ຖືກຕ້ອງ, ປະເພດຂອງໂຄງການ ML ນີ້ຕ້ອງການຄວາມເຂົ້າໃຈຢ່າງລະອຽດກ່ຽວກັບວິທີການ NLP ຫຼາຍແລະລະບົບການຈັດປະເພດ (PassiveAggressiveClassifier ຫຼື Naive Bayes classifier).
11. ການຄາດເດົາການຊື້ຄູປອງ
ລູກຄ້າກໍາລັງຄິດກ່ຽວກັບການຊື້ອອນໄລນ໌ຫຼາຍຂຶ້ນເມື່ອໂຣກ coronavirus ໂຈມຕີໂລກໃນປີ 2020. ດັ່ງນັ້ນ, ສະຖານທີ່ຊື້ເຄື່ອງໄດ້ຖືກບັງຄັບໃຫ້ປ່ຽນທຸລະກິດອອນໄລນ໌.
ໃນທາງກົງກັນຂ້າມ, ລູກຄ້າຍັງຊອກຫາຂໍ້ສະ ເໜີ ທີ່ດີ, ຄືກັນກັບພວກເຂົາຢູ່ໃນຮ້ານ, ແລະ ກຳ ລັງຊອກຫາຄູປອງທີ່ປະຫຍັດເງິນຫຼາຍຂື້ນ. ມີແມ້ກະທັ້ງເວັບໄຊທ໌ທີ່ອຸທິດຕົນເພື່ອສ້າງຄູປອງສໍາລັບລູກຄ້າດັ່ງກ່າວ. ທ່ານສາມາດຮຽນຮູ້ກ່ຽວກັບການຂຸດຄົ້ນຂໍ້ມູນໃນການຮຽນຮູ້ເຄື່ອງຈັກ, ການຜະລິດເສັ້ນສະແດງແຖບ, ແຜນວາດວົງຈອນ, ແລະ histograms ເພື່ອສະແດງໃຫ້ເຫັນຂໍ້ມູນ, ແລະຄຸນສົມບັດວິສະວະກໍາກັບໂຄງການນີ້.
ເພື່ອສ້າງການຄາດຄະເນ, ທ່ານຍັງສາມາດເບິ່ງວິທີການ imputation ຂໍ້ມູນສໍາລັບການຄຸ້ມຄອງຄ່າ NA ແລະຄວາມຄ້າຍຄືກັນຂອງ cosine ຂອງຕົວແປ.
12. ການຄາດເດົາຂອງລູກຄ້າ
ຜູ້ບໍລິໂພກແມ່ນຊັບສິນທີ່ສໍາຄັນທີ່ສຸດຂອງບໍລິສັດ, ແລະການຮັກສາພວກມັນແມ່ນສໍາຄັນສໍາລັບທຸລະກິດໃດຫນຶ່ງທີ່ມີຈຸດປະສົງເພື່ອເພີ່ມລາຍຮັບແລະສ້າງຄວາມສໍາພັນທີ່ມີຄວາມຫມາຍໃນໄລຍະຍາວກັບພວກເຂົາ.
ນອກຈາກນັ້ນ, ຄ່າໃຊ້ຈ່າຍຂອງການຊື້ລູກຄ້າໃຫມ່ແມ່ນສູງກວ່າ XNUMX ເທົ່າຂອງຄ່າໃຊ້ຈ່າຍໃນການຍືນຍົງທີ່ມີຢູ່ແລ້ວ. ການປັ່ນປ່ວນ/ການຕົກແຕ່ງຂອງລູກຄ້າແມ່ນບັນຫາທາງທຸລະກິດທີ່ຮູ້ຈັກກັນດີທີ່ລູກຄ້າ ຫຼືຜູ້ຈອງຢຸດເຮັດທຸລະກິດກັບບໍລິການ ຫຼືບໍລິສັດ.
ໂດຍຫລັກການແລ້ວເຂົາເຈົ້າຈະບໍ່ເປັນລູກຄ້າທີ່ຈ່າຍເງິນອີກຕໍ່ໄປ. ລູກຄ້າຈະຖືວ່າເປັນການປັ່ນປ່ວນຖ້າມັນເປັນເວລາໃດນຶ່ງນັບຕັ້ງແຕ່ລູກຄ້າໄດ້ພົວພັນກັບບໍລິສັດຄັ້ງສຸດທ້າຍ. ການກໍານົດວ່າລູກຄ້າຈະປັ່ນປ່ວນ, ເຊັ່ນດຽວກັນກັບການໃຫ້ຂໍ້ມູນທີ່ກ່ຽວຂ້ອງຢ່າງໄວວາເພື່ອແນໃສ່ການຮັກສາລູກຄ້າ, ແມ່ນສໍາຄັນຕໍ່ການຫຼຸດຜ່ອນຄວາມປັ່ນປ່ວນ.
ສະຫມອງຂອງພວກເຮົາແມ່ນບໍ່ສາມາດທີ່ຈະຄາດການລາຍຮັບຂອງລູກຄ້າສໍາລັບລ້ານຂອງລູກຄ້າ; ນີ້ແມ່ນບ່ອນທີ່ການຮຽນຮູ້ເຄື່ອງຈັກສາມາດຊ່ວຍໄດ້.
13. ການພະຍາກອນການຂາຍ Wallmart
ຫນຶ່ງໃນຄໍາຮ້ອງສະຫມັກທີ່ໂດດເດັ່ນທີ່ສຸດຂອງການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນການພະຍາກອນການຂາຍ, ເຊິ່ງກ່ຽວຂ້ອງກັບການກວດສອບລັກສະນະທີ່ມີອິດທິພົນຕໍ່ການຂາຍຜະລິດຕະພັນແລະການຄາດການປະລິມານການຂາຍໃນອະນາຄົດ.
ຊຸດຂໍ້ມູນ Walmart, ເຊິ່ງປະກອບດ້ວຍຂໍ້ມູນການຂາຍຈາກ 45 ສະຖານທີ່, ຖືກນໍາໃຊ້ໃນການສຶກສາການຮຽນຮູ້ເຄື່ອງຈັກນີ້. ການຂາຍຕໍ່ຮ້ານ, ໂດຍປະເພດ, ໃນແຕ່ລະອາທິດແມ່ນລວມຢູ່ໃນຊຸດຂໍ້ມູນ. ຈຸດປະສົງຂອງໂຄງການການຮຽນຮູ້ເຄື່ອງຈັກນີ້ແມ່ນເພື່ອຄາດຄະເນການຂາຍສໍາລັບແຕ່ລະພະແນກໃນແຕ່ລະຮ້ານເພື່ອໃຫ້ພວກເຂົາສາມາດເຮັດການເພີ່ມປະສິດທິພາບຊ່ອງທາງທີ່ຂັບເຄື່ອນດ້ວຍຂໍ້ມູນແລະການຕັດສິນໃຈການວາງແຜນສິນຄ້າຄົງຄັງ.
ການເຮັດວຽກກັບຊຸດຂໍ້ມູນ Walmart ແມ່ນມີຄວາມຫຍຸ້ງຍາກເນື່ອງຈາກມັນມີເຫດການ markdown ທີ່ເລືອກທີ່ມີຜົນກະທົບຕໍ່ການຂາຍແລະຄວນພິຈາລະນາ.
14. ການວິເຄາະຂໍ້ມູນ Uber
ໃນເວລາທີ່ມັນມາກັບການປະຕິບັດແລະການເຊື່ອມໂຍງການຮຽນຮູ້ເຄື່ອງຈັກແລະການຮຽນຮູ້ເລິກໃນກິດຂອງເຂົາເຈົ້າ, ການບໍລິການແບ່ງປັນການຂັບເຄື່ອນທີ່ນິຍົມແມ່ນບໍ່ໄກ. ໃນແຕ່ລະປີ, ມັນດໍາເນີນການເດີນທາງຫຼາຍຕື້ເທື່ອ, ເຮັດໃຫ້ຜູ້ໂດຍສານສາມາດເດີນທາງໄດ້ທຸກເວລາຂອງວັນຫຼືກາງຄືນ.
ເນື່ອງຈາກວ່າມັນມີຖານລູກຄ້າຂະຫນາດໃຫຍ່, ມັນຕ້ອງການການບໍລິການລູກຄ້າພິເສດເພື່ອແກ້ໄຂຄໍາຮ້ອງທຸກຂອງຜູ້ບໍລິໂພກໄວເທົ່າທີ່ຈະໄວໄດ້.
Uber ມີຊຸດຂໍ້ມູນຫຼາຍລ້ານລາຍການທີ່ມັນສາມາດໃຊ້ເພື່ອວິເຄາະ ແລະສະແດງການເດີນທາງຂອງລູກຄ້າເພື່ອເປີດເຜີຍຄວາມເຂົ້າໃຈ ແລະປັບປຸງປະສົບການຂອງລູກຄ້າ.
15. ການວິເຄາະ Covid-19
COVID-19 ໄດ້ແຜ່ລາມໄປທົ່ວໂລກໃນທຸກມື້ນີ້, ແລະບໍ່ແມ່ນພຽງແຕ່ໃນຄວາມໝາຍຂອງໂລກລະບາດ. ໃນຂະນະທີ່ຜູ້ຊ່ຽວຊານດ້ານການແພດກໍາລັງສຸມໃສ່ການສ້າງວັກຊີນທີ່ມີປະສິດທິພາບແລະພູມຕ້ານທານໂລກ, ນັກວິທະຍາສາດຂໍ້ມູນ ແມ່ນບໍ່ໄກ.
ກໍລະນີໃຫມ່, ຈໍານວນການເຄື່ອນໄຫວປະຈໍາວັນ, ການເສຍຊີວິດ, ແລະສະຖິຕິການທົດສອບແມ່ນທັງຫມົດໄດ້ຖືກເປີດເຜີຍໃຫ້ສາທາລະນະ. ການຄາດຄະເນແມ່ນເຮັດໃນແຕ່ລະວັນໂດຍອີງໃສ່ການລະບາດຂອງ SARS ໃນສະຕະວັດກ່ອນ. ສໍາລັບການນີ້, ທ່ານສາມາດນໍາໃຊ້ການວິເຄາະ regression ແລະສະຫນັບສະຫນູນແບບຈໍາລອງການຄາດເດົາເຄື່ອງ vector.
ສະຫຼຸບ
ເພື່ອສະຫຼຸບ, ພວກເຮົາໄດ້ປຶກສາຫາລືບາງໂຄງການ ML ຊັ້ນນໍາທີ່ຈະຊ່ວຍທ່ານໃນການທົດສອບການຂຽນໂປລແກລມການຮຽນຮູ້ເຄື່ອງຈັກເຊັ່ນດຽວກັນກັບການເຂົ້າໃຈແນວຄວາມຄິດແລະການຈັດຕັ້ງປະຕິບັດຂອງມັນ. ການຮູ້ວິທີການປະສົມປະສານການຮຽນຮູ້ເຄື່ອງຈັກສາມາດຊ່ວຍໃຫ້ທ່ານກ້າວຫນ້າໃນອາຊີບຂອງເຈົ້າຍ້ອນວ່າເຕັກໂນໂລຢີເຂົ້າມາໃນທຸກໆອຸດສາຫະກໍາ.
ໃນຂະນະທີ່ການຮຽນຮູ້ເຄື່ອງຈັກ, ພວກເຮົາແນະນໍາໃຫ້ທ່ານປະຕິບັດແນວຄວາມຄິດຂອງທ່ານແລະຂຽນສູດການຄິດໄລ່ທັງຫມົດຂອງທ່ານ. ການຂຽນ algorithms ໃນຂະນະທີ່ການຮຽນຮູ້ແມ່ນມີຄວາມສໍາຄັນຫຼາຍກ່ວາການປະຕິບັດໂຄງການ, ແລະມັນຍັງໃຫ້ປະໂຫຍດແກ່ເຈົ້າໃນການເຂົ້າໃຈວິຊາຢ່າງຖືກຕ້ອງ.
ອອກຈາກ Reply ເປັນ