ໃນສັງຄົມປັດຈຸບັນ, ວິທະຍາສາດຂໍ້ມູນມີຄວາມສຳຄັນຫຼາຍ!
ຫຼາຍດັ່ງນັ້ນນັກວິທະຍາສາດຂໍ້ມູນໄດ້ຮັບມຸງກຸດເປັນ "ວຽກທີ່ເຊັກຊີ່ທີ່ສຸດໃນສະຕະວັດທີ XNUMX," ເຖິງແມ່ນວ່າບໍ່ມີໃຜຄາດຫວັງວ່າວຽກ geeky ຈະ sexy!
ຢ່າງໃດກໍຕາມ, ເນື່ອງຈາກວ່າຄວາມສໍາຄັນອັນໃຫຍ່ຫຼວງຂອງຂໍ້ມູນ, ວິທະຍາສາດຂໍ້ມູນແມ່ນຂ້ອນຂ້າງເປັນທີ່ນິຍົມໃນປັດຈຸບັນ.
Python, ດ້ວຍການວິເຄາະສະຖິຕິ, ການສ້າງແບບຈໍາລອງຂໍ້ມູນ, ແລະການອ່ານ, ແມ່ນຫນຶ່ງໃນທີ່ດີທີ່ສຸດ ພາສາການຂຽນໂປແກຼມ ສໍາລັບການສະກັດມູນຄ່າຈາກຂໍ້ມູນນີ້.
Python ບໍ່ເຄີຍຢຸດທີ່ຈະປະຫລາດໃຈນັກຂຽນໂປລແກລມຂອງຕົນໃນເວລາທີ່ມັນມາກັບການເອົາຊະນະສິ່ງທ້າທາຍດ້ານວິທະຍາສາດຂໍ້ມູນ. ມັນເປັນພາສາການຂຽນໂປລແກລມທີ່ມີປະສິດຕິພາບສູງ, ນຳໃຊ້ກັນຢ່າງກວ້າງຂວາງ, ຮັດກຸມ, ຮັດກຸມ, ແຫຼ່ງເປີດ, ພ້ອມດ້ວຍຄຸນສົມບັດເພີ່ມເຕີມທີ່ຫຼາກຫຼາຍ.
Python ໄດ້ຖືກອອກແບບດ້ວຍຫ້ອງສະຫມຸດທີ່ໂດດເດັ່ນສໍາລັບວິທະຍາສາດຂໍ້ມູນທີ່ນັກຂຽນໂປລແກລມໃຊ້ທຸກໆມື້ເພື່ອແກ້ໄຂຄວາມຫຍຸ້ງຍາກ.
ນີ້ແມ່ນຫ້ອງສະຫມຸດ Python ທີ່ດີທີ່ສຸດທີ່ຈະພິຈາລະນາ:
1. Pandas
Pandas ແມ່ນຊຸດທີ່ອອກແບບມາເພື່ອຊ່ວຍນັກພັດທະນາໃນການເຮັດວຽກກັບຂໍ້ມູນ "ຕິດສະຫຼາກ" ແລະ "ຄວາມສໍາພັນ" ໃນລັກສະນະທໍາມະຊາດ. ມັນຖືກສ້າງຂຶ້ນໃນສອງໂຄງສ້າງຂໍ້ມູນໃຫຍ່: "Series" (ຫນຶ່ງມິຕິລະດັບ, ຄ້າຍຄືກັນກັບບັນຊີລາຍຊື່ຂອງວັດຖຸ) ແລະ "Data Frames" (ສອງມິຕິລະດັບ, ເຊັ່ນຕາຕະລາງທີ່ມີຖັນຫຼາຍ).
Pandas ສະຫນັບສະຫນູນການປ່ຽນໂຄງສ້າງຂໍ້ມູນເປັນວັດຖຸ DataFrame, ຈັດການກັບຂໍ້ມູນທີ່ຂາດຫາຍໄປ, ເພີ່ມ / ລຶບຖັນຈາກ DataFrame, imputing ໄຟລ໌ທີ່ຂາດຫາຍໄປ, ແລະ ການສະແດງພາບຂໍ້ມູນ ການນໍາໃຊ້ histograms ຫຼືກ່ອງດິນຕອນ.
ມັນຍັງສະຫນອງເຄື່ອງມືຈໍານວນຫນຶ່ງສໍາລັບການອ່ານແລະຂຽນຂໍ້ມູນລະຫວ່າງໂຄງສ້າງຂໍ້ມູນໃນຫນ່ວຍຄວາມຈໍາແລະຫຼາຍຮູບແບບໄຟລ໌.
ໃນສັ້ນ, ມັນແມ່ນເຫມາະສົມສໍາລັບການປະມວນຜົນຂໍ້ມູນຢ່າງໄວວາແລະງ່າຍດາຍ, ການລວບລວມຂໍ້ມູນ, ການອ່ານຂໍ້ມູນແລະການຂຽນຂໍ້ມູນ, ແລະການເບິ່ງເຫັນຂໍ້ມູນ. ເມື່ອສ້າງໂຄງການວິທະຍາສາດຂໍ້ມູນ, ທ່ານສະເຫມີຈະໃຊ້ຫ້ອງສະຫມຸດສັດເດຍລະສານ Pandas ເພື່ອຈັດການແລະວິເຄາະຂໍ້ມູນຂອງທ່ານ.
2. ເລກ
NumPy (Numerical Python) ເປັນເຄື່ອງມືທີ່ຍອດຢ້ຽມສໍາລັບການເຮັດການຄິດໄລ່ວິທະຍາສາດແລະການດໍາເນີນງານຂັ້ນພື້ນຖານແລະຊັບຊ້ອນ.
ຫ້ອງສະຫມຸດສະຫນອງຄຸນນະສົມບັດທີ່ເປັນປະໂຫຍດຈໍານວນຫນຶ່ງສໍາລັບການເຮັດວຽກກັບ n-arrays ແລະ matrices ໃນ Python.
ມັນເຮັດໃຫ້ມັນງ່າຍຂຶ້ນໃນການປະມວນຜົນ arrays ທີ່ມີຄ່າຂອງປະເພດຂໍ້ມູນດຽວກັນ ແລະປະຕິບັດການເລກເລກໃນ arrays (ລວມທັງ vectorization). ໃນຄວາມເປັນຈິງ, ການນໍາໃຊ້ປະເພດ NumPy array ເພື່ອ vectorize ການດໍາເນີນງານທາງຄະນິດສາດປັບປຸງການປະຕິບັດແລະຫຼຸດລົງເວລາປະຕິບັດ.
ການສະຫນັບສະຫນູນສໍາລັບ arrays multidimensional ສໍາລັບການດໍາເນີນງານທາງຄະນິດສາດແລະເຫດຜົນແມ່ນລັກສະນະຫຼັກຂອງຫ້ອງສະຫມຸດ. ຟັງຊັນ NumPy ສາມາດຖືກໃຊ້ເພື່ອດັດສະນີ, ຈັດຮຽງ, ປ່ຽນຮູບ, ແລະສື່ສານພາບ ແລະຄື້ນສຽງເປັນອາເຣຫຼາຍມິຕິຂອງຕົວເລກຕົວຈິງ.
3. matplotlib
ໃນໂລກ Python, Matplotlib ແມ່ນຫນຶ່ງໃນຫ້ອງສະຫມຸດທີ່ໃຊ້ຢ່າງກວ້າງຂວາງທີ່ສຸດ. ມັນຖືກນໍາໃຊ້ເພື່ອສ້າງພາບສະຖິດ, ພາບເຄື່ອນໄຫວ, ແລະການໂຕ້ຕອບຂອງຂໍ້ມູນ. Matplotlib ມີຫຼາຍຕາຕະລາງແລະການປັບແຕ່ງທາງເລືອກ.
ການນໍາໃຊ້ histograms, ນັກຂຽນໂປລແກລມສາມາດກະແຈກກະຈາຍ, ປັບ, ແລະແກ້ໄຂກາຟ. ຫ້ອງສະໝຸດ open-source ໃຫ້ API ຮັດກຸມວັດຖຸສຳລັບການເພີ່ມແຜນຜັງເຂົ້າໃນໂປຣແກຣມ.
ເມື່ອນໍາໃຊ້ຫ້ອງສະຫມຸດນີ້ເພື່ອສ້າງການເບິ່ງເຫັນທີ່ສັບສົນ, ຢ່າງໃດກໍຕາມ, ນັກພັດທະນາຕ້ອງຂຽນລະຫັດຫຼາຍກ່ວາປົກກະຕິ.
ມັນເປັນມູນຄ່າທີ່ສັງເກດວ່າຫ້ອງສະຫມຸດຕາຕະລາງທີ່ນິຍົມຢູ່ຮ່ວມກັນກັບ Matplotlib ໂດຍບໍ່ມີບັນຫາ.
ໃນບັນດາສິ່ງອື່ນໆ, ມັນຖືກນໍາໃຊ້ໃນ Python scripts, Python ແລະ IPython shells, Jupyter notebooks, ແລະ. web application ເຊີຟເວີ
ແຜນຜັງ, ແຜນຜັງແຖບ, ແຜນຜັງວົງມົນ, ຮິສໂຕແກຣມ, ແຜ່ນກະແຈກກະຈາຍ, ຕາຕະລາງຄວາມຜິດພາດ, ເສັ້ນສະແດງພະລັງງານ, ເສັ້ນລວດ, ແລະຕາຕະລາງການສະແດງພາບອື່ນໆທີ່ສາມາດສ້າງໄດ້ກັບມັນ.
4. ທະເລ
ຫໍສະຫມຸດ Seaborn ຖືກສ້າງຂຶ້ນໃນ Matplotlib. Seaborn ສາມາດຖືກນໍາໃຊ້ເພື່ອເຮັດໃຫ້ຮູບພາບສະຖິຕິທີ່ຫນ້າສົນໃຈແລະໃຫ້ຂໍ້ມູນຫຼາຍກ່ວາ Matplotlib.
Seaborn ປະກອບມີ API ທີ່ຕັ້ງຂໍ້ມູນແບບປະສົມປະສານສໍາລັບການສືບສວນການໂຕ້ຕອບລະຫວ່າງຕົວແປຫຼາຍຢ່າງ, ນອກເຫນືອຈາກການສະຫນັບສະຫນູນຢ່າງເຕັມທີ່ສໍາລັບການເບິ່ງເຫັນຂໍ້ມູນ.
Seaborn ສະເຫນີທາງເລືອກໃນການເບິ່ງເຫັນຂໍ້ມູນຈໍານວນຫລາຍ, ລວມທັງການເບິ່ງເຫັນຊຸດເວລາ, ແຜນທີ່ຮ່ວມກັນ, ແຜນວາດໄວໂອລິນ, ແລະອື່ນໆຈໍານວນຫຼາຍ.
ມັນໃຊ້ແຜນທີ່ semantic ແລະການລວບລວມສະຖິຕິເພື່ອສະຫນອງການເບິ່ງເຫັນຂໍ້ມູນທີ່ມີຄວາມເຂົ້າໃຈເລິກເຊິ່ງ. ມັນລວມເອົາຊຸດແຜນຜັງແບບກຳນົດທິດທາງທີ່ເຮັດວຽກກັບກອບຂໍ້ມູນ ແລະອາເຣທີ່ຮວມເອົາຊຸດຂໍ້ມູນທັງໝົດ.
ການສະແດງພາບຂໍ້ມູນຂອງມັນສາມາດປະກອບມີແຜນຜັງແຖບ, ແຜນຜັງວົງມົນ, ຮິສໂຕແກຣມ, ກະແຈກກະຈາຍ, ແຜນວາດຄວາມຜິດພາດ ແລະຮູບພາບອື່ນໆ. ຫໍສະມຸດການເບິ່ງເຫັນຂໍ້ມູນ Python ນີ້ຍັງປະກອບມີເຄື່ອງມືສໍາລັບການເລືອກສີ, ເຊິ່ງຊ່ວຍໃນການເປີດເຜີຍແນວໂນ້ມໃນຊຸດຂໍ້ມູນ.
5. Scikit- ຮຽນຮູ້
Scikit-learn ແມ່ນຫ້ອງສະຫມຸດ Python ທີ່ຍິ່ງໃຫຍ່ທີ່ສຸດສໍາລັບການສ້າງແບບຈໍາລອງຂໍ້ມູນແລະການປະເມີນແບບຈໍາລອງ. ມັນເປັນຫນຶ່ງໃນຫ້ອງສະຫມຸດ Python ທີ່ເປັນປະໂຫຍດທີ່ສຸດ. ມັນມີ plethora ຂອງຄວາມສາມາດອອກແບບ solely ສໍາລັບຈຸດປະສົງຂອງການສ້າງແບບຈໍາລອງ.
ມັນປະກອບມີລະບົບການຮຽນຮູ້ເຄື່ອງຈັກທີ່ມີການເບິ່ງແຍງກວດກາທັງໝົດ ແລະ ບໍ່ມີການເບິ່ງແຍງກວດກາ, ພ້ອມທັງຟັງຊັນການຮຽນຮູ້ຂອງ Ensemble ທີ່ໄດ້ກຳນົດໄວ້ຢ່າງຄົບຖ້ວນ ແລະ ການເພີ່ມຄຸນສົມບັດການຮຽນຮູ້ເຄື່ອງຈັກ.
ມັນຖືກນໍາໃຊ້ໂດຍນັກວິທະຍາສາດຂໍ້ມູນເພື່ອເຮັດເປັນປົກກະຕິ ການຮຽນຮູ້ເຄື່ອງຈັກ ແລະກິດຈະກໍາການຂຸດຄົ້ນຂໍ້ມູນເຊັ່ນ: ກຸ່ມ, regression, ການຄັດເລືອກຕົວແບບ, ການຫຼຸດຜ່ອນມິຕິພາບ, ແລະການຈັດປະເພດ. ມັນຍັງມາພ້ອມກັບເອກະສານທີ່ສົມບູນແບບແລະປະຕິບັດຫນ້າຊົມເຊີຍ.
Scikit-learn ສາມາດໃຊ້ເພື່ອສ້າງແບບຈໍາລອງການຮຽນຮູ້ເຄື່ອງຈັກແບບ Supervised ແລະ Unsupervised ຫຼາກຫຼາຍຊະນິດເຊັ່ນ: ການຈັດປະເພດ, Regression, Support Vector Machines, Random Forests, Nearest Neighbors, Naive Bayes, Decision Trees, Clustering, ແລະອື່ນໆ.
ຫ້ອງສະໝຸດການຮຽນຮູ້ເຄື່ອງ Python ປະກອບມີເຄື່ອງມືທີ່ງ່າຍດາຍແຕ່ມີປະສິດທິພາບຫຼາຍຊະນິດເພື່ອປະຕິບັດການວິເຄາະຂໍ້ມູນ ແລະວຽກງານຂຸດຄົ້ນບໍ່ແຮ່.
ສໍາລັບການອ່ານເພີ່ມເຕີມ, ນີ້ແມ່ນຄໍາແນະນໍາຂອງພວກເຮົາກ່ຽວກັບ Scikit-ຮຽນຮູ້.
6. XGBoost
XGBoost ເປັນຊຸດເຄື່ອງມືຊຸກຍູ້ການເລື່ອນແບບແຈກຢາຍທີ່ອອກແບບມາເພື່ອຄວາມໄວ, ຄວາມຍືດຫຍຸ່ນ, ແລະການເຄື່ອນທີ່. ເພື່ອພັດທະນາ ML algorithms, ມັນໃຊ້ກອບການຊຸກຍູ້ Gradient. XGBoost ແມ່ນເຕັກນິກການເພີ່ມຕົ້ນໄມ້ຂະຫນານໄວແລະຖືກຕ້ອງທີ່ສາມາດແກ້ໄຂບັນຫາວິທະຍາສາດຂໍ້ມູນໄດ້ຢ່າງກວ້າງຂວາງ.
ໂດຍໃຊ້ກອບການເພີ່ມຄວາມສູງ, ຫ້ອງສະໝຸດນີ້ສາມາດຖືກໃຊ້ເພື່ອສ້າງລະບົບການຮຽນຮູ້ເຄື່ອງຈັກ.
ມັນປະກອບມີການຊຸກຍູ້ຕົ້ນໄມ້ຂະຫນານ, ເຊິ່ງຊ່ວຍທີມງານໃນການແກ້ໄຂບັນຫາວິທະຍາສາດຂໍ້ມູນຫຼາຍຢ່າງ. ຜົນປະໂຫຍດອີກຢ່າງຫນຶ່ງແມ່ນວ່ານັກພັດທະນາສາມາດນໍາໃຊ້ລະຫັດດຽວກັນສໍາລັບ Hadoop, SGE, ແລະ MPI.
ມັນຍັງເຊື່ອຖືໄດ້ໃນທັງສອງສະຖານະການທີ່ແຈກຢາຍແລະຄວາມຊົງຈໍາ.
7. ການໄຫຼ tensor
TensorFlow ເປັນແພລດຟອມ AI ແຫຼ່ງເປີດແບບຕົ້ນທາງຈົນຈົບຟຣີ ທີ່ມີເຄື່ອງມື, ຫ້ອງສະໝຸດ ແລະຊັບພະຍາກອນອັນຫຼາກຫຼາຍ. TensorFlow ຕ້ອງຄຸ້ນເຄີຍກັບທຸກຄົນທີ່ເຮັດວຽກ ໂຄງການການຮຽນຮູ້ເຄື່ອງຈັກ ໃນ Python.
ມັນເປັນເຄື່ອງມືທາງຄະນິດສາດທີ່ເປັນສັນຍາລັກເປີດແຫຼ່ງສໍາລັບການຄິດໄລ່ຕົວເລກໂດຍໃຊ້ເສັ້ນສະແດງຂໍ້ມູນການໄຫຼວຽນຂອງຂໍ້ມູນທີ່ຖືກພັດທະນາໂດຍ Google. ເສັ້ນກຣາບສະທ້ອນເຖິງຂະບວນການທາງຄະນິດສາດໃນເສັ້ນສະແດງການໄຫຼເຂົ້າຂອງຂໍ້ມູນ TensorFlow ປົກກະຕິ.
ໃນທາງກົງກັນຂ້າມ, ຂອບກຣາຟແມ່ນອາເຣຂໍ້ມູນຫຼາຍມິຕິ, ເຊິ່ງເອີ້ນກັນວ່າ tensors, ທີ່ໄຫຼລະຫວ່າງໂຫນດເຄືອຂ່າຍ. ມັນຊ່ວຍໃຫ້ນັກຂຽນໂປລແກລມແຈກຢາຍການປະມວນຜົນລະຫວ່າງຫນຶ່ງຫຼືຫຼາຍ CPUs ຫຼື GPUs ໃນ desktop, ອຸປະກອນມືຖື, ຫຼືເຄື່ອງແມ່ຂ່າຍໂດຍບໍ່ມີການປ່ຽນລະຫັດ.
TensorFlow ຖືກພັດທະນາໃນ C ແລະ C ++. ດ້ວຍ TensorFlow, ທ່ານພຽງແຕ່ສາມາດອອກແບບແລະ ຝຶກອົບຮົມການຮຽນຮູ້ເຄື່ອງຈັກ ຮູບແບບທີ່ໃຊ້ APIs ລະດັບສູງເຊັ່ນ Keras.
ມັນຍັງມີຫຼາຍລະດັບຂອງ abstraction, ອະນຸຍາດໃຫ້ທ່ານເລືອກເອົາການແກ້ໄຂທີ່ດີທີ່ສຸດສໍາລັບຕົວແບບຂອງທ່ານ. TensorFlow ຍັງຊ່ວຍໃຫ້ທ່ານສາມາດນຳໃຊ້ຮູບແບບການຮຽນຮູ້ຂອງເຄື່ອງຈັກໃສ່ຄລາວ, ບຣາວເຊີ ຫຼືອຸປະກອນຂອງທ່ານເອງ.
ມັນເປັນເຄື່ອງມືທີ່ມີປະສິດທິພາບທີ່ສຸດສໍາລັບວຽກເຊັ່ນ: ການຮັບຮູ້ວັດຖຸ, ການຮັບຮູ້ສຽງເວົ້າ, ແລະອື່ນໆຈໍານວນຫຼາຍ. ມັນຊ່ວຍໃນການພັດທະນາຂອງປອມ ເຄືອຂ່າຍ neural ທີ່ຕ້ອງຈັດການກັບແຫຼ່ງຂໍ້ມູນຈໍານວນຫລາຍ.
ນີ້ແມ່ນຄໍາແນະນໍາດ່ວນຂອງພວກເຮົາກ່ຽວກັບ TensorFlow ສໍາລັບການອ່ານເພີ່ມເຕີມ.
8. Keras
Keras ເປັນແຫຼ່ງທີ່ບໍ່ເສຍຄ່າແລະເປີດ ເຄືອຂ່າຍ neural ທີ່ອີງໃສ່ Python ຊຸດເຄື່ອງມືສໍາລັບປັນຍາປະດິດ, ການຮຽນຮູ້ເລິກເຊິ່ງ, ແລະກິດຈະກໍາວິທະຍາສາດຂໍ້ມູນ. ເຄືອຂ່າຍ neural ຍັງຖືກນໍາໃຊ້ໃນ Data Science ເພື່ອຕີຄວາມຫມາຍຂໍ້ມູນການສັງເກດ (ຮູບພາບຫຼືສຽງ).
ມັນເປັນການເກັບກໍາຂອງເຄື່ອງມືສໍາລັບການສ້າງຕົວແບບ, ຂໍ້ມູນຮູບພາບ, ແລະການປະເມີນຜົນຂໍ້ມູນ. ມັນຍັງລວມເອົາຊຸດຂໍ້ມູນທີ່ມີປ້າຍກຳກັບໄວ້ລ່ວງໜ້າທີ່ສາມາດນຳເຂົ້າ ແລະໂຫຼດໄດ້ໄວ.
ມັນເປັນການງ່າຍທີ່ຈະນໍາໃຊ້, versatile, ແລະເຫມາະສົມສໍາລັບການຄົ້ນຄວ້າສໍາຫຼວດ. ຍິ່ງໄປກວ່ານັ້ນ, ມັນຊ່ວຍໃຫ້ທ່ານສ້າງການເຊື່ອມຕໍ່ຢ່າງເຕັມສ່ວນ, convolutional, pooling, recurrent, embedding, ແລະຮູບແບບອື່ນໆຂອງ Neural Networks.
ຮູບແບບເຫຼົ່ານີ້ສາມາດຖືກລວມເຂົ້າກັນເພື່ອສ້າງເຄືອຂ່າຍ Neural ທີ່ເຕັມໄປດ້ວຍຄວາມສາມາດສໍາລັບຊຸດຂໍ້ມູນແລະບັນຫາອັນໃຫຍ່ຫຼວງ. ມັນເປັນຫ້ອງສະຫມຸດທີ່ດີເລີດສໍາລັບການສ້າງແບບຈໍາລອງແລະການສ້າງເຄືອຂ່າຍ neural.
ມັນງ່າຍດາຍທີ່ຈະໃຊ້ແລະໃຫ້ນັກພັດທະນາມີຄວາມຍືດຫຍຸ່ນຫຼາຍ. Keras ແມ່ນຊ້າເມື່ອປຽບທຽບກັບຊຸດການຮຽນຮູ້ເຄື່ອງຈັກ Python ອື່ນໆ.
ນີ້ແມ່ນຍ້ອນວ່າມັນທໍາອິດສ້າງຕາຕະລາງການຄິດໄລ່ໂດຍໃຊ້ໂຄງສ້າງພື້ນຖານຂອງ backend ແລະຫຼັງຈາກນັ້ນນໍາໃຊ້ມັນເພື່ອດໍາເນີນການປະຕິບັດງານ. Keras ແມ່ນສະແດງອອກຢ່າງບໍ່ຫນ້າເຊື່ອແລະສາມາດປັບຕົວໄດ້ໃນເວລາທີ່ເຮັດການຄົ້ນຄວ້າໃຫມ່.
9. PyTorch
PyTorch ເປັນຊຸດ Python ທີ່ນິຍົມສໍາລັບ ການຮຽນຮູ້ລຶກລັບ ແລະການຮຽນຮູ້ເຄື່ອງຈັກ. ມັນເປັນຊອບແວຄອມພິວເຕີທາງວິທະຍາສາດທີ່ເປີດຢູ່ Python ສໍາລັບການປະຕິບັດ Deep Learning ແລະ Neural Networks ໃນຊຸດຂໍ້ມູນຂະຫນາດໃຫຍ່.
ເຟສບຸກໃຊ້ຊຸດເຄື່ອງມືນີ້ຢ່າງກວ້າງຂວາງເພື່ອສ້າງເຄືອຂ່າຍ neural ທີ່ຊ່ວຍໃນກິດຈະກໍາຕ່າງໆເຊັ່ນການຮັບຮູ້ໃບຫນ້າແລະການຕິດແທັກອັດຕະໂນມັດ.
PyTorch ເປັນແພລະຕະຟອມສໍາລັບນັກວິທະຍາສາດຂໍ້ມູນທີ່ຕ້ອງການສໍາເລັດວຽກການຮຽນຮູ້ເລິກຢ່າງໄວວາ. ເຄື່ອງມືດັ່ງກ່າວເຮັດໃຫ້ການຄິດໄລ່ tensor ດໍາເນີນການດ້ວຍການເລັ່ງ GPU.
ມັນຍັງຖືກໃຊ້ສໍາລັບສິ່ງອື່ນໆ, ລວມທັງການສ້າງເຄືອຂ່າຍຄອມພິວເຕີ້ແບບເຄື່ອນໄຫວແລະການຄິດໄລ່ gradients ໂດຍອັດຕະໂນມັດ.
ໂຊກດີ, PyTorch ເປັນຊຸດທີ່ຍອດຢ້ຽມທີ່ຊ່ວຍໃຫ້ນັກພັດທະນາສາມາດຫັນປ່ຽນຈາກທິດສະດີແລະການຄົ້ນຄວ້າໄປສູ່ການຝຶກອົບຮົມແລະການພັດທະນາໄດ້ຢ່າງງ່າຍດາຍໃນເວລາທີ່ມັນມາກັບການຮຽນຮູ້ເຄື່ອງຈັກແລະການຄົ້ນຄວ້າການຮຽນຮູ້ເລິກເພື່ອໃຫ້ຄວາມຍືດຫຍຸ່ນແລະຄວາມໄວສູງສຸດ.
10. NLTK
NLTK (Natural Language Toolkit) ເປັນຊຸດ Python ທີ່ນິຍົມສຳລັບນັກວິທະຍາສາດຂໍ້ມູນ. ການຕິດແທັກຂໍ້ຄວາມ, ການໃຊ້ tokenization, ເຫດຜົນທາງ semantic, ແລະວຽກງານອື່ນໆທີ່ກ່ຽວຂ້ອງກັບການປຸງແຕ່ງພາສາທໍາມະຊາດສາມາດເຮັດໄດ້ດ້ວຍ NLTK.
NLTK ຍັງສາມາດຖືກນໍາໃຊ້ເພື່ອເຮັດສໍາເລັດ AI ສະລັບສັບຊ້ອນຫຼາຍ (ປັນຍາປະດິດ) ວຽກເຮັດງານທໍາ. NLTK ໄດ້ຖືກສ້າງຂື້ນໃນເບື້ອງຕົ້ນເພື່ອສະຫນັບສະຫນູນ AI ແລະຮູບແບບການສອນການຮຽນຮູ້ເຄື່ອງຈັກທີ່ແຕກຕ່າງກັນ, ເຊັ່ນ: ຮູບແບບພາສາແລະທິດສະດີມັນສະຫມອງ.
ໃນປັດຈຸບັນມັນກໍາລັງຂັບລົດ AI algorithm ແລະການພັດທະນາຕົວແບບການຮຽນຮູ້ໃນໂລກຕົວຈິງ. ມັນໄດ້ຖືກຍອມຮັບຢ່າງກວ້າງຂວາງສໍາລັບການນໍາໃຊ້ເປັນເຄື່ອງມືການສິດສອນແລະເປັນເຄື່ອງມືການສຶກສາສ່ວນບຸກຄົນ, ນອກເຫນືອໄປຈາກການນໍາໃຊ້ເປັນເວທີສໍາລັບ prototyping ແລະການພັດທະນາລະບົບການຄົ້ນຄວ້າ.
ການຈັດປະເພດ, parsing, semantic ສົມເຫດສົມຜົນ, stemming, tagging, ແລະ tokenization ແມ່ນສະຫນັບສະຫນູນທັງຫມົດ.
ສະຫຼຸບ
ນັ້ນສະຫຼຸບສິບຫ້ອງສະຫມຸດ Python ອັນດັບຕົ້ນສໍາລັບວິທະຍາສາດຂໍ້ມູນ. ຫ້ອງສະຫມຸດວິທະຍາສາດຂໍ້ມູນ Python ໄດ້ຖືກປັບປຸງເປັນປົກກະຕິຍ້ອນວ່າວິທະຍາສາດຂໍ້ມູນແລະການຮຽນຮູ້ເຄື່ອງຈັກກາຍເປັນທີ່ນິຍົມຫລາຍຂຶ້ນ.
ມີຫ້ອງສະຫມຸດ Python ຫຼາຍສໍາລັບວິທະຍາສາດຂໍ້ມູນ, ແລະທາງເລືອກຂອງຜູ້ໃຊ້ສ່ວນໃຫຍ່ແມ່ນຖືກກໍານົດໂດຍປະເພດຂອງໂຄງການທີ່ພວກເຂົາກໍາລັງເຮັດວຽກ.
ອອກຈາກ Reply ເປັນ