Tebulu ọdịnaya[Zoo][Gosi]
Ọ bụrụ na ị bụ onye mmemme Python ma ọ bụ ọ bụrụ na ị na-achọ ngwa ngwa dị ike iji webata mmụta igwe n'ime sistemu mmepụta, Scikit-learn bụ ọba akwụkwọ ịchọrọ ịlele.
Scikit-learn bụ nke edekọtara nke ọma ma dị mfe iji, ma ị bụ onye ọhụrụ na mmụta igwe, chọrọ ibili na-agba ọsọ ọsọ, ma ọ bụ chọọ iji ngwa nyocha ML kachasị ọhụrụ.
Ọ na-enye gị ohere ịrụ ụdị data amụma na naanị ahịrị koodu ole na ole wee jiri ihe nlereanya ahụ dabara data gị dị ka ọba akwụkwọ dị elu. Ọ na-agbanwe agbanwe ma na-arụ ọrụ nke ọma na ndị ọzọ Ụlọ akwụkwọ Python dị ka Matplotlib maka eserese, NumPy maka nhazi vectorization, yana pandas maka nhụta data.
N'ime ntuziaka a, ị ga-achọpụta ihe niile ọ bụ, otu ị ga-esi jiri ya, yana uru na ọghọm ya.
Gịnị bụ Scikit-mụta?
Scikit-learn (nke a makwaara dị ka sklearn) na-enye ụdị ọnụọgụgụ na mmụta igwe dị iche iche. N'adịghị ka ọtụtụ modul, sklearn na-emepụta na Python kama C. N'agbanyeghị na a na-emepụta ya na Python, arụmọrụ nke sklearn na-ekwu na iji NumPy mee ihe maka algebra linear dị elu na arụ ọrụ nhazi.
Emepụtara Scikit-Learn dị ka akụkụ nke oru ngo nke Summer of Code Google wee mee ka ndụ ọtụtụ nde ndị sayensị data Python-centric gafee ụwa dị mfe. Akụkụ a nke usoro a na-elekwasị anya n'igosi ụlọ akwụkwọ ahụ na ilekwasị anya na otu ihe - mgbanwe dataset, nke bụ isi na nzọụkwụ dị mkpa ị ga-eme tupu ịmepụta ihe atụ amụma.
Ọbá akwụkwọ ahụ dabere na SciPy (Scientific Python), nke a ga-etinyerịrị tupu ị nwee ike iji scikit-learn. Ngwunye a nwere ihe ndị a:
- NumPy: Ngwungwu array ọkọlọtọ Python
- SciPy: Ọ bụ ngwugwu dị mkpa maka mgbakọ sayensị
- Pandas: Nhazi data na nyocha
- Matplotlib: Ọ bụ ọba akwụkwọ na-akpa nkata 2D/3D dị ike
- Sympy: mgbakọ na mwepụ akara
- IPython: njikwa mmekọrịta emelitere
Ngwa nke ụlọ akwụkwọ mmụta Scikit
Scikit-learn bụ ngwungwu Python mepere emepe nwere nyocha data ọkaibe yana atụmatụ Ngwuputa. Ọ na-abịa na plethora nke algọridim arụnyere n'ime ya iji nyere gị aka nweta ihe kacha mma na ọrụ sayensị data gị. A na-eji ọba akwụkwọ Scikit-amụta n'ụzọ ndị a.
1. Ntughari
Nyocha nlọghachi azụ bụ usoro nchịkọta akụkọ maka nyocha na ịghọta njikọ dị n'etiti mgbanwe abụọ ma ọ bụ karịa. Usoro eji eme nyocha nyocha na-enyere aka ịchọpụta ihe ndị dị mkpa, nke nwere ike ileghara anya, yana otu ha si emekọrịta ihe. Enwere ike iji usoro nlọghachi azụ, dịka ọmụmaatụ, iji ghọta nke ọma omume nke ọnụ ahịa ngwaahịa.
Algọridim ndọghachi azụ gụnyere:
- Nchekwa Linear
- Ridge Regression
- Mgbanwe Lasso
- Mkpebi Tree Regression
- Ohia Random
- Igwe na-akwado Vector (SVM)
2. Nkechi
Usoro nhazi ọkwa bụ usoro mmụta echekwabara nke na-eji data ọzụzụ achọpụta ụdị nlebanya ọhụrụ. Algọridim na nhazi ọkwa na-amụta site na nke enyere ihe omuma ma ọ bụ nleba anya wee kewaa nlebanya ndị ọzọ n'ime otu n'ime ọtụtụ klaasị ma ọ bụ otu. Enwere ike iji ha dịka ọmụmaatụ, kewaa ozi email ka spam ma ọ bụ na ọ bụghị.
Algọridim nhazi ọkwa gụnyere ihe ndị a:
- Ntughari logistic
- K-Ndị agbataobi kacha nso
- Akwado igwe vector
- Mkpebi Osisi
- Ohia Random
3. Nchịkọta
A na-eji ụyọkọ algọridim dị na Scikit-learn iji hazie data nwere ihe ndị yiri ya na nhazi. Ịchịkọta ọnụ bụ usoro ịchịkọta ihe dị iche iche ka ndị nọ n'otu otu na-adịkwa ka nke ndị ọzọ. Dịka ọmụmaatụ, enwere ike ikewa data ndị ahịa dabere na ọnọdụ ha.
Algọridim mkpokọta gụnyere ihe ndị a:
- DB-SCAN
- K- pụtara
- Obere-Batch K-Means
- Nchịkọta Spectral
4. Nhọrọ Nlereanya
Algọridim nhọrọ nlere anya na-enye ụzọ maka atụnyere, ịkwado na ịhọrọ oke na ụdị maka ojiji na atụmatụ sayensị data. Nyere data, nhọrọ ihe nlereanya bụ nsogbu nke ịhọpụta ihe ndekọ ọnụ ọgụgụ site na otu ụdị ndoro-ndoro anya. N'ọnọdụ ndị kachasị mkpa, a na-eburu n'uche nchịkọta data dị adị. Agbanyeghị, ọrụ ahụ nwekwara ike ịgụnye nhazi nke nnwale ka data enwetara dabara nke ọma na nsogbu nhọrọ ụdị.
Modul nhọrọ ụdị nke nwere ike imeziwanye izi ezi site n'ịgbanwe paramita gụnyere:
- Nkwenye gafere
- Ọchụchọ grid
- Mgbochi
5. Mbelata akụkụ
Ntufe nke data site na oghere dị elu gaa na oghere dị ala nke mere na ihe ngosi dị ala na-echekwa ụfọdụ akụkụ dị ịrịba ama nke data mbụ, nke dị nso na akụkụ ya dị n'ime ya, a maara dị ka mbelata nha. A na-ebelata ọnụọgụ nke mgbanwe na-enweghị usoro maka nyocha mgbe a na-ebelata akụkụ. Dị ka ọmụmaatụ, data na-apụ apụ nwere ike ọ gaghị atụle iji kwalite arụmọrụ nke nhụta anya.
Algọridim mbelata oke nha gụnyere ihe ndị a:
- Nhọrọ nhọrọ
- Onye isi nchịkwa nyocha (PCA)
Ịwụnye Scikit-mụta
NumPy, SciPy, Matplotlib, IPython, Sympy, na Pandas ka achọrọ ka etinyere tupu iji Scikit-learn. Ka anyị tinye ha site na iji pipụ si console (na-arụ ọrụ naanị maka Windows).
Ka anyị tinye Scikit-mụta ugbu a na anyị etinyela ọba akwụkwọ achọrọ.
atụmatụ
Scikit-learn, mgbe ụfọdụ a na-akpọ sklearn, bụ ngwa ọrụ Eke Ọgba maka imejuputa ụdị mmụta igwe na nhazi ndekọ ọnụ ọgụgụ. Anyị nwere ike iji ya mepụta ọtụtụ ụdị mmụta igwe maka nlọghachi azụ, nhazi ọkwa na nchịkọta, yana ngwa ndekọ aha maka ịlele ụdị ndị a. Ọ gụnyekwara mbelata akụkụ, nhọrọ njirimara, mwepu njirimara, ụzọ nchikota, yana nrụnye datasets. Anyị ga-enyocha nke ọ bụla n'ime àgwà ndị a otu otu.
1. Ịbubata Datasets
Scikit-amụta na-agụnye ọnụ ọgụgụ nke datasets ewuruburu, dị ka iris dataset, ọnụ ahịa ụlọ, titanic dataset, na ndị ọzọ. Uru ndị bụ isi nke ihe ndekọ data ndị a bụ na ha dị mfe nghọta na enwere ike iji mepụta ụdị ML ozugbo. Ihe ndekọ data ndị a dabara adaba maka ndị novice. N'otu aka ahụ, ị nwere ike iji sklearn bubata datasets ọzọ. N'otu aka ahụ, ị nwere ike iji ya bubata setịpụ data agbakwunyere.
2. Nkewa Dataset maka Ọzụzụ na Nnwale
Sklearn gụnyere ike kewaa ihe ndekọ data ka ọ bụrụ akụkụ ọzụzụ na nnwale. Achọrọ ikewa nkesa data maka ntule enweghị mmasị na arụmọrụ amụma. Anyị nwere ike ịkọwapụta ole n'ime data anyị kwesịrị itinye n'ime ụgbọ oloko ma nwalee datasets. Anyị kewara setịpụ dataset site na iji nnwale ụgbọ oloko nke mere na ọdụ ụgbọ oloko nwere 80% nke data yana setịpụ ule nwere 20%. Enwere ike kewaa ihe ndekọ data dị ka ndị a:
3. Linear nlọghachi azụ
Linear Regression bụ usoro mmụta igwe dabere na mmụta na-elekọta. Ọ na-arụ ọrụ regression. Dabere na mgbanwe ndị nọọrọ onwe ha, nlọghachi azụ na-egosipụta uru amụma ebumnuche. A na-ejikarị ya iji chọpụta njikọ dị n'etiti mgbanwe na ịkọ amụma. Ụdị nlọghachi azụ dị iche iche dị iche iche n'ụdị njikọ ha na-enyocha n'etiti mgbanwe ndị dabere na ndị nọọrọ onwe ha, yana ọnụ ọgụgụ nke mgbanwe ndị nọọrọ onwe ha ejiri. Anyị nwere ike ịmepụta ụdị Regression Linear site na iji sklearn dị ka ndị a:
4. Logistic nlọghachi azụ
Ụzọ categorization a na-ahụkarị bụ nlọghachi azụ. Ọ bụ n'otu ezinụlọ dị ka polynomial na linear regression ma bụrụ nke ezinụlọ classifier linear. Ihe nchoputa nke nlọghachi azụ logistic dị mfe nghọta ma dị ngwa ịgbakọ. N'otu aka ahụ dị ka nkwụghachi azụ linear, mgbagha mgbagha bụ usoro nkwụghachi azụ na-elekọta. Ngbanwe mmepụta bụ categorical, yabụ nke ahụ bụ naanị ihe dị iche. Ọ nwere ike ikpebi ma onye ọrịa nwere ọrịa obi ma ọ bụ na ọ nweghị.
Enwere ike idozi nsogbu nhazi ọkwa dị iche iche, dị ka nchọpụta spam, site na iji mgbagha mgbagha. Ịma amụma ọrịa shuga, ikpebi ma onye na-azụ ahịa ga-azụta otu ngwaahịa ma ọ bụ gbanwee gaa na onye na-asọmpi, na-ekpebi ma onye ọrụ ọ ga-pịa njikọ ahịa ahịa, na ọtụtụ ọnọdụ ndị ọzọ bụ nanị ihe atụ ole na ole.
5. Osisi Mkpebi
Usoro nhazi na amụma kachasị ike na nke a na-ejikarị eme ihe bụ osisi mkpebi. Osisi mkpebi bụ ihe owuwu osisi nke dị ka eserese na-asọpụta, nke nwere ọnụ ọnụ nke ọ bụla n'ime ya na-anọchi anya ule na njirimara, alaka ọ bụla na-anọchite anya nkwubi okwu nke ule ahụ, na ọnụ akwụkwọ ọ bụla (ọnụ ọnụ ọnụ) na-ejide akara klas.
Mgbe mgbanwe ndị na-adabere na ya na-enweghị njikọ dị n'ahịrị na mgbanwe ndị nọọrọ onwe ha, ya bụ mgbe nlọghachi azụ na-emepụtaghị nchoputa ziri ezi, osisi mkpebi na-aba uru. Enwere ike iji ihe DecisionTreeRegression() mee ihe n'otu ụzọ ahụ iji jiri osisi mkpebi maka nlọghachi azụ.
6. Random ọhịa
Ohia a na-emeghi nke a bu a ngwa igwe ụzọ maka idozi nsogbu nlọghachi azụ na nhazi ọkwa. Ọ na-eji mmụta mkpokọta, nke bụ usoro na-ejikọta ọtụtụ klas iji dozie nsogbu ndị gbagwojuru anya. Usoro ọhịa na-enweghị usoro bụ nke nwere ọnụ ọgụgụ dị ukwuu nke osisi mkpebi. Enwere ike iji ya hazie ngwa mbinye ego, chọpụta omume aghụghọ, yana ịtụ anya ntiwapụ ọrịa.
7. Matrix mgbagwoju anya
Matriks mgbagwoju anya bụ tebụl eji akọwa arụmọrụ nlereanya nhazi ọkwa. A na-eji okwu anọ ndị a iji nyochaa matriks mgbagwoju anya:
- Ezi Ezi: Ọ na-egosi na ihe nlereanya a tụrụ anya nsonaazụ dị mma yana ọ ziri ezi.
- Ezi adịghị mma: Ọ na-egosi na ihe nlereanya ahụ tụrụ anya ihe ọjọọ ma ọ bụ eziokwu.
- Ezi Ụgha: Ọ na-egosi na ihe nlereanya ahụ tụrụ anya nsonaazụ dị mma mana ọ bụ nke na-adịghị mma.
- Ajọ Ụgha: Ọ na-egosi na ihe nlereanya ahụ tụrụ anya nsonaazụ na-adịghị mma, ebe nsonaazụ ya dị mma n'ezie.
Mmejuputa matriks mgbagwoju anya:
Uru
- Ọ dị mfe iji.
- Ngwungwu mmụta Scikit na-agbanwe agbanwe ma baa uru, na-eje ozi n'ezie ebumnuche ụwa dị ka amụma omume ndị ahịa, mmepe neuroimage, na ndị ọzọ.
- Ndị ọrụ chọrọ ijikọ algọridim na usoro ha ga-ahụ akwụkwọ API zuru ezu na webụsaịtị Scikit-learn.
- Ọtụtụ ndị ode akwụkwọ, ndị na-emekọ ihe ọnụ, na nnukwu nkwado obodo zuru ụwa ọnụ n'ịntanetị ma mee ka Scikit mụta ihe ọhụrụ.
ọghọm
- Ọ bụghị nhọrọ kacha mma maka ọmụmụ ihe omimi.
mmechi
Scikit-mụta bụ ngwugwu dị oke egwu maka ndị ọkà mmụta sayensị data ọ bụla ka ọ ghọta nke ọma yana ahụmịhe ụfọdụ. Ntuziaka a kwesịrị inyere gị aka na iji sklearn na-emegharị data. Enwere ọtụtụ ikike Scikit-mụta nke ị ga-achọpụta ka ị na-aga n'ihu na njem sayensị data gị. Kekọrịta echiche gị na nkwupụta.
Nkume a-aza