Lisi o Mataupu[Natia][Fa'aali]
Afai o oe o se Python programmer pe afai o loʻo e suʻeina se meafaigaluega mamana e faʻaaoga e faʻafeiloaʻi ai le aʻoaʻoina o masini i totonu o se faiga gaosiga, Scikit-learn o se faletusi e te manaʻomia e siaki.
Scikit-learn e lelei ona fa'amaumauina ma faigofie ona fa'aoga, pe e te fou i le a'oa'oina o masini, mana'o e tu i luga ma tamo'e vave, pe mana'o e fa'aoga le meafaigaluega su'esu'e ML aupito lata mai.
E fa'atagaina oe e fausia se fa'ata'ita'iga fa'amatalaga fa'amatalaga i na'o ni nai laina fa'ailoga ma fa'aoga lea fa'ata'ita'iga e fetaui ma au fa'amaumauga o se faletusi maualuga. E fetu'utu'una'i ma e fetaui lelei ma isi Python faletusi pei o Matplotlib mo le siataina, NumPy mo le faʻasologa o faʻasologa, ma pandas mo faʻamatalaga faʻamatalaga.
I totonu o lenei taʻiala, o le ae mauaina mea uma e uiga i le mea, pe faʻapefea ona e faʻaogaina, faʻatasi ai ma ona lelei ma le leaga.
O le a Scikit-aʻoaʻo?
Scikit-learn (fa'aigoaina o le sklearn) e ofoina atu se seti eseese o fa'ata'ita'iga fa'afuainumera ma masini a'oa'oga. E le pei o le tele o modules, o le sklearn e atiina ae i le Python nai lo le C. E ui lava i le atinaʻeina i le Python, o le lelei o le sklearn e faʻatatau i lona faʻaogaina o le NumPy mo le maualuga o le algebra laina ma le faʻasologa o galuega.
Scikit-Learn na faia o se vaega o le Google's Summer of Code project ma talu mai lena taimi ua faafaigofieina ai olaga o le faitau miliona o le Python-centric data saienitisi i le lalolagi atoa. O lenei vaega o le faasologa o loʻo taulaʻi i le tuʻuina atu o le faletusi ma taulaʻi i se tasi elemene - suiga o faʻamaumauga, o se laʻasaga autu ma taua e fai aʻo leʻi atiaʻe se faʻataʻitaʻiga vavalo.
O le faletusi e faʻavae i luga ole SciPy (Scientific Python), lea e tatau ona faʻapipiʻi ae e te leʻi faʻaogaina le scikit-learn. O lenei faaputuga o loʻo i ai mea nei:
- NumPy: Python's standard n-dimensional array package
- SciPy: O se afifi faʻavae mo faʻamatalaga faasaienisi
- Pandas: Fa'asologa o fa'amaumauga ma au'ili'iliga
- Matplotlib: Ose faletusi 2D/3D mamana
- Fa'ailoga: Matematika fa'atusa
- IPython: Faʻaleleia le fesoʻotaʻiga faʻamafanafanaga
Fa'aoga o le Scikit-Learn Library
Scikit-aʻoaʻo o se pusa faʻapipiʻi punaʻoa Python faʻatasi ai ma suʻesuʻega faʻamatalaga faʻapitoa ma faʻamatalaga maina. E sau ma se plethora o fausia-i totonu algorithms e fesoasoani ia te oe e maua le tele o mea mai au galuega faatino faasaienisi faamatalaga. O le Scikit-Learn library o loʻo faʻaogaina i auala nei.
1. Faʻafitauli
O le su'esu'eina o le toe fa'afouga ose metotia fa'afuainumera mo le su'esu'eina ma le malamalama i le feso'ota'iga i le va o le lua pe sili atu fo'i fesuiaiga. O le metotia na fa'aaogaina e fai ai su'esu'ega toe fa'afo'i e fesoasoani i le fa'amautinoaina po'o fea elemene e talafeagai, atonu e le amana'ia, ma pe fa'afefea ona fegalegaleai. Mo se fa'ata'ita'iga, e mafai ona fa'aoga auala e fa'afo'i ai e malamalama atili ai i amioga o tau o fa'asoa.
Regression algorithms e aofia ai:
- Laina o le Linear
- Toe Fa'afouga o Ridge
- Lasso Faʻafitauli
- Fa'ai'uga La'au Fa'asolo
- Vaomatua fa'afuase'i
- Masini Vector Lagolago (SVM)
2. Faavasegaina
O le fa'avasegaina o auala ole a'oa'oga Fa'atonu e fa'aogaina fa'amaumauga a'oa'oga e fa'ailoa ai le vaega o mata'upu fou. O se algorithm i le Fa'avasegaga e a'oa'o mai se mea ua tu'uina atu talafaamaumau po'o fa'amatalaga ona fa'avasega lea o fa'amatalaga fa'aopoopo i se tasi o le tele o vasega po'o fa'avasegaga. E mafai, mo se faʻataʻitaʻiga, faʻaaogaina e faʻavasega ai fesoʻotaʻiga imeli e pei ole spam pe leai.
Fa'avasegaga algorithms e aofia ai mea nei:
- Polokalame o le Lisi o Igoa
- K-Tuafa lata ane
- Lagolago Vector Machine
- Laau Faʻaiuga
- Vaomatua fa'afuase'i
3. Fa'apotopotoina
Ole fa'aputuga algorithms ile Scikit-a'oa'o e fa'aogaina e otometi ona fa'atulaga fa'amaumauga fa'atasi ma meatotino tutusa i totonu o seti. Clustering o le fa'agasologa lea o le fa'avasegaina o se seti o mea ina ia sili atu ona tutusa i latou o lo'o i totonu o le kulupu tutusa ma isi vaega. Fa'amatalaga a tagata fa'atau, mo se fa'ata'ita'iga, e mafai ona tu'u'ese'ese fa'atatau i lo latou nofoaga.
Clustering algorithms e aofia ai mea nei:
- DB-SCAN
- K-O lona uiga
- Mini-Batch K-Means
- Spectral Clustering
4. Filifiliga Fa'atusa
Fa'ata'ita'iga filifiliga algorithms tu'uina atu metotia mo le fa'atusatusaina, fa'amaonia, ma le filifilia o ta'iala sili ona lelei ma fa'ata'ita'iga mo le fa'aogaina i fa'amatalaga fa'asaienisi fuafuaga. Tuuina atu faʻamatalaga, filifiliga faʻataʻitaʻiga o le faʻafitauli o le pikiina o se faʻataʻitaʻiga fuainumera mai se vaega o faʻataʻitaʻiga sui. I tulaga sili ona taua, o le aoina muamua o faʻamaumauga o loʻo faʻaaogaina. Ae ui i lea, o le galuega e mafai foi ona aofia ai le mamanu o faʻataʻitaʻiga ina ia fetaui lelei faʻamaumauga maua i le faʻafitauli o le filifilia o faʻataʻitaʻiga.
Fa'ata'ita'iga filifiliga modules e mafai ona fa'aleleia le sa'o e ala i le fetu'una'iga o fa'amaufa'ailoga e aofia ai:
- Fa'amaufa'ailoga
- Su'ega Grid
- Metrics
5. Fa'aitiitiga Fa'aitiitiga
O le fa'aliliuina o fa'amaumauga mai se va'aiga maualuga i se va'aiga maualalo ina ia fa'asaoina e le fa'atusa maualalo ni vaega taua o fa'amaumauga muamua, e latalata i lona fua fa'anatura, ua ta'ua o le fa'aititia o le dimensionality. Ole numera o fesuiaiga faʻafuaseʻi mo auʻiliʻiliga e faʻaititia pe a faʻaititia le dimensionality. O faʻamatalaga i fafo, mo se faʻataʻitaʻiga, atonu e le mafai ona manatu e faʻaleleia le lelei o faʻaaliga.
Dimensionality Reduction algorithm e aofia ai mea nei:
- Filifiliga o tagata
- Suʻesuʻega Vaega Autu (PCA)
Fa'apipi'i Scikit-a'oa'o
NumPy, SciPy, Matplotlib, IPython, Sympy, ma Pandas e manaʻomia e faʻapipiʻi aʻo leʻi faʻaogaina Scikit-learn. Sei o tatou faʻapipiʻiina i latou e faʻaaoga ai le pip mai le faʻamafanafanaga (e aoga mo Windows).
Tatou fa'apipi'i Scikit-a'oa'o nei ua uma ona fa'apipi'i faletusi mana'omia.
Features
Scikit-aʻoaʻo, o nisi taimi e taʻua o le sklearn, o se meafaigaluega Python mo le faʻatinoina o faʻataʻitaʻiga aʻoaʻoga masini ma faʻataʻitaʻiga fuainumera. E mafai ona tatou fa'aogaina e fai ai ni fa'ata'ita'iga a'oa'oga masini e tele mo le toe fa'afo'i, fa'avasegaina, ma le fa'aputuina, fa'apea fo'i ma meafaigaluega fa'afuainumera mo le iloiloina o nei fa'ata'ita'iga. E aofia ai fo'i le fa'aitiitiga o le fa'aitiitiga, filifiliga fa'atusa, fa'apipi'iina o ata, auala fa'aopoopo, ma fa'amaumauga tu'ufa'atasi. E tatau ona tatou su'esu'eina ta'itasi nei uiga ta'itasi.
1. Fa'aulufaleina o Fa'amaumauga
Scikit-aʻoaʻo e aofia ai le tele o faʻamaumauga faʻapipiʻi muamua, e pei o le iris dataset, fale faʻatau fale, titanic dataset, ma isi. O fa'amanuiaga autu o nei fa'amaumauga e faigofie ona pu'eina ma e mafai ona fa'aoga e fa'atupu vave ai fa'ata'ita'iga ML. O nei faʻamaumauga e talafeagai mo tagata fou. E fa'apena fo'i, e mafai ona e fa'aogaina le sklearn e fa'aulu mai ai fa'amaumauga fa'aopoopo. E fa'apena fo'i, e mafai ona e fa'aogaina e fa'aulu mai ai fa'amaumauga fa'aopoopo.
2. Vaevaeina o Fa'amaumauga mo A'oa'oga ma Su'ega
Sklearn na aofia ai le mafai ona vaevae faʻamaumauga i vaega o aʻoaʻoga ma suʻega. O le vaevaeina o fa'amaumauga e mana'omia mo se su'esu'ega le fa'aituau o le fa'atinoga o valo'aga. E mafai ona matou faʻamaonia pe fia le tele o a matou faʻamatalaga e tatau ona aofia i totonu o nofoaafi ma suʻega faʻamaumauga. Na matou vaevaeina le faʻamaumauga e faʻaaoga ai le vaeluaga o suʻega nofoaafi e pei o le seti nofoaafi e aofia ai le 80% o faʻamaumauga ma le seti suʻega e 20%. E mafai ona vaevaeina le database e pei ona taua i lalo:
3. Fa'asologa Fa'asologa
Linear Regression ole a'oa'oga fa'avae a'oa'oga masini. E faia se galuega toe fa'afo'i. Fa'avae i luga ole fesuiaiga tuto'atasi, toe fa'ata'ita'iina se tau fa'ailoga sini. E masani ona faʻaaogaina e fuafua ai le fesoʻotaʻiga i le va o fesuiaiga ma le vavalo. E ese'ese fa'ata'ita'iga regression e eseese i tulaga o le ituaiga feso'ota'iga latou te iloiloina i le va o fa'alagolago ma tuto'atasi fesuiaiga, fa'apea fo'i ma le aofa'i o fesuiaiga tuto'atasi fa'aaogaina. E mafai ona tatou fatuina le faʻataʻitaʻiga Linear Regression e faʻaaoga ai le sklearn e faʻapea:
4. Logistic Regression
O se faiga fa'avasega masani o le fa'asologa o fa'amaumauga. O lo'o i totonu o le aiga e tasi e pei o le polynomial ma le linear regression ma o lo'o i totonu o le aiga fa'avasegaina laina. O mea na maua o le logistic regression e faigofie ona malamalama ma e vave ona faʻatusatusa. I le auala lava e tasi e pei o le laina laina, o le logistic regression o se auala e vaavaaia. O le fesuiaiga o mea e fai e fa'avasega, ona pau lea o le eseesega. E mafai ona iloa ai pe maua se ma'i ma'i fatu pe leai.
O mataupu fa'avasegaga eseese, e pei ole su'esu'eina o spam, e mafai ona fo'ia ile fa'aogaina o le logistic regression. Fuafuaga o le ma'isuka, fuafua pe fa'atau e se tagata fa'atau se oloa fa'apitoa pe fesuia'i i se fa'atauva'a, fuafua pe o le a kiliki e le tagata fa'aoga se feso'ota'iga fa'atauga fa'apitoa, ma le tele o isi fa'aaliga o ni nai fa'ata'ita'iga.
5. Laau Filifiliga
O le fa'avasegaga ma le vavalo e sili ona mamana ma fa'aaogaina o le la'au fa'ai'uga. O le la'au fa'ai'uga o se fausaga o la'au e pei o se siata fa'asolo, ma node ta'itasi i totonu e fai ma sui o se su'ega i se uiga, o lala ta'itasi e fai ma sui o le fa'ai'uga o le su'ega, ma lau node ta'itasi (terminal node) o lo'o uuina se igoa o le vasega.
A leai se feso'ota'iga laina fa'atasi ma fua fa'atatau tuto'atasi, o lona uiga pe a le maua e le fa'asologa fa'asolosolo ni mea sa'o, e aoga la'au fa'ai'uga. O le DecisionTreeRegression() mea e mafai ona faʻaogaina i se auala tutusa e faʻaaoga ai se laʻau filifiliga mo le toe faʻafoʻi.
6. Vaomatua Fa'afuase'i
O se vaomatua fa'afuase'i o le a masini suʻesuʻe auala mo le foia o le solomuli ma le faavasegaina o mataupu. E fa'aogaina le a'oa'oga fa'atasi, o se metotia e tu'ufa'atasia ai le tele o fa'avasegaga e fo'ia ai fa'afitauli lavelave. O se auala fa'afuase'i vaomatua e faia i le tele o la'au fa'ai'uga. E mafai ona fa'aoga e fa'avasega ai talosaga nogatupe, iloa ai amioga fa'a'ole'ole, ma fa'atalitali ai fa'ama'i.
7. Fa'alavelave Fa'alavelave
O se fa'ailoga fenumia'i ose laulau e fa'aaoga e fa'amatala ai le fa'avasegaina o fa'ata'ita'iga fa'atinoga. O upu nei e fa o lo'o fa'aogaina e su'esu'e ai le matrix fenumia'i:
- Moni Lelei: E faʻaalia ai o le faʻataʻitaʻiga na faʻaalia se taunuuga lelei ma sa saʻo.
- Moni Leaga: E faʻaalia ai o le faʻataʻitaʻiga na faʻaalia se taunuuga leaga ma e saʻo.
- Sese Lelei: O loʻo faʻaalia ai o le faʻataʻitaʻiga na faʻamoemoeina se taunuuga lelei ae o se mea le lelei.
- Fase Lega: O lona uiga o le faʻataʻitaʻiga na faʻamoemoeina se taunuuga le lelei, ae o le taunuuga na matua lelei.
Fa'atinoga o fa'asologa o fenumia'i:
tulaga e lelei
- E faigofie e faʻaaoga.
- O le Scikit-Learn package e matua'i fetuutuuna'i ma aoga, e fa'atino ai sini moni o le lalolagi e pei o le va'aiga o amioga a tagata fa'atau, neuroimage development, ma isi.
- O tagata fa'aoga e mana'o e fa'afeso'ota'i algorithms ma latou fa'avae o le a maua fa'amatalaga auiliili API ile Scikit-Learn website.
- Le tele o tusitala, tagata galulue faʻatasi, ma le tele o fesoʻotaʻiga lautele i luga ole laiga lagolago ma faʻaauau pea Scikit-aʻoaʻo i le taimi nei.
leaga
- E le o se filifiliga lelei mo suʻesuʻega loloto.
iʻuga
Scikit-a'oa'o ose afifi taua mo tagata su'esu'e fa'amatalaga uma ina ia maua se malamalama malosi ma nisi poto masani i. O lenei ta'iala e tatau ona fesoasoani ia te oe i le fa'aogaina o fa'amatalaga e fa'aaoga ai le sklearn. E tele isi mea e mafai e Scikit-a'oa'o e te mauaina a'o e alualu i luma i lau sailiga fa'asaienisi fa'amatalaga. Fa'asoa atu ou manatu ile fa'amatalaga.
Tuua se tali