N'ime ọha mmadụ taa, sayensị data dị oke mkpa!
Nke ukwuu nke na onye ọkà mmụta sayensị data enwetala okpueze "Ọrụ Sexiest nke narị afọ nke iri abụọ na mbụ," n'agbanyeghị na ọ dịghị onye na-atụ anya ka ọrụ geeky bụrụ sexy!
Agbanyeghị, n'ihi nnukwu mkpa data dị, Sayensị Data na-ewu ewu ugbu a.
Eke Ọgba, ya na nyocha ndekọ ọnụ ọgụgụ ya, nhazi data, na ọgụgụ ya, bụ otu n'ime ihe kacha mma asụsụ mmemme maka iwepụta uru na data a.
Python anaghị akwụsị iju ndị mmemme ya anya ma a bịa n'imeri ihe ịma aka sayensị data. Ọ bụ asụsụ a na-ejikarị eme ihe, dabere n'ihe, ebe mepere emepe, asụsụ mmemme na-arụ ọrụ nke ọma nwere ọtụtụ atụmatụ agbakwunyere.
Emebere Python ya na ọba akwụkwọ dị ịrịba ama maka sayensị data nke ndị mmemme na-eji kwa ụbọchị dozie nsogbu.
Nke a bụ ọba akwụkwọ Python kacha mma ị ga-atụle:
1. Pandas
Pandas bụ ngwungwu emebere iji nyere ndị mmepe aka ịrụ ọrụ na data "akpọrọ" na "mmekọrịta" n'ụzọ okike. A na-ewu ya n'ụdị data bụ isi abụọ: "Series" (otu akụkụ, yiri ndepụta nke ihe) na "Data Frames" (akụkụ abụọ, dị ka tebụl nwere ọtụtụ ogidi).
Pandas na-akwado ịtụgharị usoro data ka ọ bụrụ ihe DataFrame, na-emeso data na-efu efu, ịgbakwunye / ihichapụ ogidi na DataFrame, na-akọwa faịlụ ndị na-efu efu, na na-ahụ anya data iji histogram ma ọ bụ igbe igbe.
Ọ na-enyekwa ọtụtụ ngwaọrụ maka ịgụ na ide data n'etiti nhazi data ebe nchekwa na ọtụtụ ụdị faịlụ.
Na nkenke, ọ dị mma maka nhazi data ngwa ngwa ma dị mfe, nchịkọta data, ịgụ na ide data, na nhụta data. Mgbe ị na-emepụta ọrụ sayensị data, ị ga-eji Pandas ọba akwụkwọ anụ ọhịa na-ejikwa ma nyochaa data gị mgbe niile.
2. Enweghị ntụpọ
NumPy (Numerical Python) bụ ngwá ọrụ dị egwu maka ịme mgbakọ sayensị yana ọrụ nhazi na ọkaibe.
Ọbá akwụkwọ ahụ na-enye ọtụtụ atụmatụ enyemaka maka iji n-arrays na matrices rụọ ọrụ na Python.
Ọ na-eme ka ọ dịrị mfe ịhazi arrays nwere ụkpụrụ nke otu ụdị data yana ịrụ ọrụ mgbakọ na mwepụ n'usoro (gụnyere vectorization). N'ezie, iji ụdị NumPy array iji mebie arụmọrụ mgbakọ na mwepụ na-eme ka arụmọrụ dịkwuo mma ma na-ebelata oge igbu.
Nkwado maka ọtụtụ akụkụ maka ịrụ ọrụ mgbakọ na mwepụ na ezi uche bụ akụkụ bụ isi nke ọbá akwụkwọ ahụ. Enwere ike iji ọrụ NumPy tụnye aha, hazie, mezie ya, ma kwupụta ihe onyonyo na ebili mmiri dị ka ọnụọgụ ọnụọgụgụ n'ezie.
3. matplotlib
N'ime ụwa Python, Matplotlib bụ otu n'ime ọba akwụkwọ ndị a na-ejikarị eme ihe. A na-eji ya ewepụta data static, animated na mmekọrịta. Matplotlib nwere ọtụtụ nhọrọ nhazi na nhazi.
Iji histogram, ndị mmemme nwere ike ịgbasa, tweak, na dezie eserese. Ọbá akwụkwọ mepere emepe na-enye API gbakwasara ihe maka ịgbakwụnye nkata n'ime mmemme.
Mgbe ị na-eji ọbá akwụkwọ a wepụta nhụta dị mgbagwoju anya, agbanyeghị, ndị mmepe ga-ederịrị koodu karịa ka ọ dị.
Ọ dị mma ịmara na ọba akwụkwọ eserese a ma ama na Matplotlib na-ebikọ ọnụ n'enweghị nsogbu.
Tinyere ihe ndị ọzọ, a na-eji ya na script Python, Python na shells IPython, akwụkwọ ndetu Jupyter, na ngwa weebụ sava.
Enwere ike iji ya mepụta atụmatụ, chaatị mmanya, chaatị achịcha, ihe ndekọ akụkọ ihe mere eme, ihe mgbasasịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịpụta)) na ụdị eserese ọ bụla ọzọ a na-ahụ anya.
4. Osimiri mmiri
Ewubere ọbá akwụkwọ Seaborn na Matplotlib. Enwere ike iji Seaborn mee eserese ọnụ ọgụgụ mara mma yana ihe ọmụma karịa Matplotlib.
Seaborn na-agụnye API gbakwasara data agbakwunyere maka nyocha mmekọrịta dị n'etiti ọtụtụ mgbanwe, na mgbakwunye na nkwado zuru oke maka nhụta data.
Seaborn na-enye ọnụọgụ dị egwu nke nhọrọ maka nleba anya data, gụnyere nhụta usoro oge, nkata nkwonkwo, eserese violin, na ọtụtụ ndị ọzọ.
Ọ na-eji eserese semantic na nchịkọta ọnụ ọgụgụ iji nye nhụta ihe ọmụma na nghọta miri emi. Ọ na-agụnye ọtụtụ usoro usoro nhazi dataset na-arụ ọrụ na okpokolo agba data na arrays ndị gụnyere mkpokọta data.
Ọhụụ data ya nwere ike ịgụnye chaatị mmanya, chaatị achịcha, ihe ndekọ akụkọ ihe mere eme, ihe mgbasasịsa, chaatị njehie, na eserese ndị ọzọ. Ọbá akwụkwọ nhụta data Python a tinyekwara ngwá ọrụ maka ịhọrọ palettes agba, nke na-enyere aka n'ikpughe usoro na nhazi data.
5. Scikit-mụta
Scikit-learn bụ ọba akwụkwọ Python kachasị maka nhazi data yana nleba anya ihe atụ. Ọ bụ otu n'ime ọba akwụkwọ Python kacha enye aka. Ọ nwere plethora nke ike emebere naanị maka ebumnuche nke ịme ihe ngosi.
Ọ na-agụnye algọridim mmụta igwe niile a na-ahụ maka ya na nke anaghị elekọta ya, yanakwa nkọwapụta nke ọma gbasara mkpokọta mmụta yana ịkwalite ọrụ mmụta igwe.
Ndị ọkà mmụta sayensị data na-eji ya eme usoro ngwa igwe na ọrụ Ngwuputa data dị ka nchịkọta, nlọghachi azụ, nhọrọ nlereanya, mbelata akụkụ, na nhazi ọkwa. Ọ na-abịa na akwụkwọ zuru oke ma na-arụ ọrụ nke ọma.
Enwere ike iji Scikit-learn mepụta ụdị mmụta igwe dị iche iche na-elekọta yana nke anaghị elekọta ya dị ka nhazi ọkwa, nlọghachi azụ, igwe na-akwado vector, oke ọhịa, ndị agbata obi kacha nso, Naive Bayes, Osisi Mkpebi, nchịkọta, na ihe ndị ọzọ.
Ọbá akwụkwọ mmụta igwe Python gụnyere ụdị dị iche iche dị mfe ma na-arụ ọrụ nke ọma maka ịrụ nyocha data na ọrụ Ngwuputa.
Maka ịgụkwu ihe, ebe a bụ ntuziaka anyị Scikit-mụta.
6. XGBoost
XGBoost bụ ngwa ọrụ nkwalite gradient ekesara emebere maka ọsọ, mgbanwe na mbugharị. Iji wuo algọridim ML, ọ na-eji usoro nkwalite nkwalite gradient. XGBoost bụ usoro nkwalite osisi dị ngwa na nke ziri ezi nke nwere ike dozie ọtụtụ nsogbu sayensị data.
Iji gradient boost framework, enwere ike iji ọbá akwụkwọ a mepụta algọridim mmụta igwe.
Ọ na-agụnye nkwalite osisi yiri ya, nke na-enyere ndị otu aka n'ịkwazi okwu dị iche iche nke sayensị data. Uru ọzọ bụ na ndị mmepe nwere ike iji otu koodu maka Hadoop, SGE na MPI.
Ọ bụkwa ihe a pụrụ ịdabere na ya n'ọnọdụ nkesa na ebe nchekwa na-egbochi.
7. tensor eruba
TensorFlow bụ ikpo okwu AI mepere emepe ngwụcha ruo ngwụcha nke nwere nnukwu ngwaọrụ, ọba akwụkwọ na akụrụngwa. TensorFlow ga-amarịrị onye ọ bụla na-arụ ọrụ ọrụ mmụta igwe na Python.
Ọ bụ ngwa mgbakọ na mwepụ ihe atụ mepere emepe maka mgbako ọnụọgụ na-eji eserese data nke Google mepụtara. Ọnụ eserese ndị a na-egosipụta usoro mgbakọ na mwepụ na eserese data TensorFlow na-ahụkarị.
N'akụkụ eserese, n'aka nke ọzọ, bụ usoro data multidimensional, nke a makwaara dị ka tenors, nke na-asọba n'etiti oghere netwọk. Ọ na-ahapụ ndị mmemme kesaa nhazi n'etiti otu CPU ma ọ bụ karịa GPU na desktọpụ, ngwaọrụ mkpanaka, ma ọ bụ ihe nkesa na-agbanweghị koodu.
Emepụtara TensorFlow na C na C++. Site na TensorFlow, ị nwere ike chepụta na ụgbọ oloko Machine Learning ụdị na-eji API dị elu dị ka Keras.
Ọ nwekwara ọtụtụ ogo nke abstraction, na-enye gị ohere ịhọrọ ngwọta kacha mma maka ihe nlereanya gị. TensorFlow na-enyekwa gị ohere ibuga ụdị mmụta igwe na igwe ojii, ihe nchọgharị, ma ọ bụ ngwaọrụ nke gị.
Ọ bụ ngwá ọrụ kachasị dị irè maka ọrụ dị ka njirimara ihe, njirimara okwu, na ọtụtụ ndị ọzọ. Ọ na-enyere aka na mmepe nke artificial neural netwọk nke ahụ ga-edozi ọtụtụ isi mmalite data.
Nke a bụ ntuziaka anyị ngwa ngwa na TensorFlow maka ịgụkwu ihe.
8. Keras
Keras bụ isi iyi mepere emepe Netwọk akwara sitere na Python Toolkit maka ọgụgụ isi, mmụta miri emi, na ọrụ sayensị data. A na-ejikwa netwọkụ akwara ozi na Science Data iji kọwapụta data nleba anya (foto ma ọ bụ ọdịyo).
Ọ bụ mkpokọta ngwaọrụ maka imepụta ụdị, ịdepụta data, na nyocha data. Ọ gụnyekwara ihe ndekọ data etinyegoro akara nke nwere ike ibubata na ibu ngwa ngwa.
Ọ dị mfe iji, dị mfe ma dịkwa mma maka nyocha nyocha. Ọzọkwa, ọ na-enye gị ohere ịmepụta njikọ zuru oke, mgbanwe, ịgbakọ, na-emegharị ugboro ugboro, ntinye na ụdị netwọkụ Neural ndị ọzọ.
Enwere ike ijikọ ụdị ndị a iji wuo Neural Network zuru oke maka nnukwu data na nsogbu. Ọ bụ ọbá akwụkwọ mara mma maka ịmegharị na imepụta netwọkụ akwara ozi.
Ọ dị mfe iji ma na-enye ndị mmepe ọtụtụ mgbanwe. Keras dị umengwụ ma e jiri ya tụnyere ngwugwu mmụta igwe Python ndị ọzọ.
Nke a bụ n'ihi na ọ na-ebu ụzọ wepụta eserese mgbakọ na-eji akụrụngwa azụ azụ wee jiri ya rụọ ọrụ. Keras na-egosipụta nke ọma ma na-agbanwe agbanwe ma a bịa n'ime nyocha ọhụrụ.
9. PyTorch
PyTorch bụ ngwugwu Python ewu ewu maka mmụta miri emi na mmụta igwe. Ọ bụ ngwanrọ mgbakọ sayensị mepere emepe nke sitere na Python maka mmejuputa mmụta miri emi na netwọkụ akwara ozi na nnukwu datasets.
Facebook na-eji ngwa ngwa a eme ihe nke ukwuu iji mepụta netwọkụ akwara ozi na-enyere aka n'ihe omume dị ka njirimara ihu na mkpado akpaaka.
PyTorch bụ ikpo okwu maka ndị sayensị data chọrọ imecha ọrụ mmụta miri emi ngwa ngwa. Ngwá ọrụ ahụ na-enyere aka ịgbakọ tensor site na iji ngwa ngwa GPU rụọ ọrụ.
A na-ejikwa ya eme ihe ndị ọzọ, gụnyere iwulite netwọkụ mgbakọ na mwepụ na ịgbakọ gradients na-akpaghị aka.
Ọ dabara nke ọma, PyTorch bụ ngwugwu dị egwu nke na-enye ndị mmepe ohere ịgbanwe ngwa ngwa site na tiori na nyocha gaa na ọzụzụ na mmepe ma a bịa n'ịmụ igwe na nyocha mmụta miri emi iji nye oke mgbanwe na ọsọ.
10. NLTK
NLTK (Ngwaọrụ Asụsụ eke) bụ ngwugwu Python ama ama maka ndị sayensị data. Enwere ike iji NLTK rụzuo mkpado ederede, akara ngosi, ntụgharị uche, yana ọrụ ndị ọzọ metụtara nhazi asụsụ eke.
Enwere ike iji NLTK rụọ ọrụ AI dị mgbagwoju anya (Amamịghe echiche) ọrụ. Emebere NLTK iji kwado ụdị nkuzi nkuzi AI na igwe dị iche iche, dị ka ụdị asụsụ na echiche echiche.
Ọ na-anya ugbu a AI algọridim yana mmụta mmepe ụdị n'ụwa n'ezie. A nabatala ya nke ukwuu maka iji ya dị ka ngwa nkuzi yana dị ka ngwa ọmụmụ ihe n'otu n'otu, na mgbakwunye na ejiri ya dị ka ikpo okwu maka prototyping na mmepe usoro nyocha.
A na-akwado nhazi ọkwa, ntule, ntụgharị uche, ntụgharị uche, mkpado, na akara ngosi.
mmechi
Nke ahụ mechiri ọba akwụkwọ Python iri kacha elu maka sayensị data. A na-emelite ọba akwụkwọ sayensị Python data oge niile ka sayensị data na mmụta igwe na-ewu ewu karịa.
Enwere ọba akwụkwọ Python dị iche iche maka sayensị data, na nhọrọ onye ọrụ na-ekpebikarị site n'ụdị ọrụ ha na-arụ.
Nkume a-aza