Table of Contents[Hūnā][Hōʻike]
Inā he polokalamu Python ʻoe a inā ʻoe e ʻimi nei i kahi hāmeʻa ikaika e hoʻohana ai e hoʻokomo i ke aʻo ʻana i ka mīkini i loko o kahi ʻōnaehana hana, ʻo Scikit-learn kahi waihona e pono ai ʻoe e nānā.
Ua kākau maikaʻi ʻia ʻo Scikit-learn a maʻalahi hoʻi e hoʻohana, inā he mea hou ʻoe i ka aʻo mīkini, makemake e ala a holo wikiwiki, a makemake paha e hoʻohana i ka mea hana noiʻi ML hou loa.
Hāʻawi ia iā ʻoe e kūkulu i kahi ʻikepili wānana i loko o nā laina liʻiliʻi wale nō o ke code a laila hoʻohana i kēlā kumu hoʻohālike e kūpono i kāu ʻikepili ma ke ʻano he waihona kiʻekiʻe. He maʻalahi a hana maikaʻi me nā mea ʻē aʻe Nā hale waihona puke Python e like me Matplotlib no ka paʻi kiʻi ʻana, NumPy no ka vectorization array, a me nā pandas no ka ʻike ʻike.
Ma kēia alakaʻi, e ʻike ʻoe i nā mea a pau e pili ana i ke ʻano o ia mea, pehea ʻoe e hoʻohana ai, me kāna mau pono a me nā pōʻino.
He aha Scikit-aʻo?
Hāʻawi ʻo Scikit-learn (ʻike pū ʻia ʻo sklearn) i nā ʻano hoʻohālike like ʻole a me ke aʻo mīkini. ʻAʻole like me ka hapa nui o nā modules, hoʻomohala ʻia ka sklearn ma Python ma mua o C. ʻOiai ua hoʻomohala ʻia ma Python, ʻike ʻia ka maikaʻi o ka sklearn i kona hoʻohana ʻana iā NumPy no nā hana algebra linear kiʻekiʻe a me nā hana array.
Ua hana ʻia ʻo Scikit-Learn ma ke ʻano o ka papahana Summer of Code a Google a mai ia manawa ua maʻalahi ke ola o nā miliona o nā ʻepekema data Python-centric a puni ka honua. Ke kālele nei kēia ʻāpana o ka moʻo i ka hōʻike ʻana i ka waihona a me ka nānā ʻana i hoʻokahi mea - ka hoʻololi ʻana i ka ʻikepili, kahi kī a koʻikoʻi e hana ai ma mua o ka hoʻomohala ʻana i kahi ʻano wānana.
Hoʻokumu ʻia ka waihona ma SciPy (Scientific Python), pono e hoʻokomo ʻia ma mua o kou hoʻohana ʻana i ka scikit-learn. Aia kēia pūʻulu i kēia mau mea:
- NumPy: ʻO ka pūʻolo n-dimensional maʻamau o Python
- SciPy: He pūʻolo kumu no ka helu ʻepekema
- Pandas: Nā hana ʻikepili a me ka nānā ʻana
- Matplotlib: He hale waihona puke hoʻolālā 2D/3D ikaika
- Sympy: Makemakika hōʻailona
- IPython: Hoʻomaikaʻi ʻia ka ʻoluʻolu pili
Nā noi o ka waihona Scikit-aʻo
ʻO Scikit-Learn he puʻupuʻu Python open-source me ka nānā ʻana i ka ʻikepili koʻikoʻi a me nā hiʻohiʻona mining. Hele mai ia me kahi plethora o nā algorithms i kūkulu ʻia e kōkua iā ʻoe e loaʻa i ka hapa nui o kāu mau papahana ʻepekema data. Hoʻohana ʻia ka waihona aʻo Scikit ma kēia mau ʻano.
1. Hoihoi
ʻO ka loiloi regression he ʻenehana helu no ka nānā ʻana a me ka hoʻomaopopo ʻana i ka pilina ma waena o ʻelua a ʻoi aku paha. ʻO ke ʻano i hoʻohana ʻia e hana i ka loiloi regression kōkua i ka hoʻoholo ʻana i nā mea e pili ana, hiki ke nānā ʻole ʻia, a pehea lākou e launa pū ai. Hiki ke hoʻohana ʻia nā ʻenehana regression, no ka laʻana, no ka hoʻomaopopo maikaʻi ʻana i ke ʻano o nā kumukūʻai kumukūʻai.
Aia nā algorithms regression:
- Ke Kū'ē Linear
- Hoʻihoʻi ʻo Ridge
- ʻO Lasso Regression
- Hoʻoholo i ka lāʻau hoʻoholo
- Nahele Random
- Nā Mīkini Vector Kākoʻo (SVM)
2. Hoʻokaʻina
ʻO ke ʻano o ka Classification kahi ala hoʻonaʻauao i mālama ʻia e hoʻohana ana i ka ʻikepili hoʻomaʻamaʻa e ʻike i ke ʻano o nā nānā hou. ʻIke ʻia kahi algorithm i ka Classification mai kahi hāʻawi kuapo a i ʻole ka nānā ʻana a laila hoʻokaʻawale i nā ʻike hou aʻe i hoʻokahi o nā papa a i ʻole nā hui he nui. Hiki iā lākou, no ka laʻana, hoʻohana ʻia e hoʻokaʻawale i nā kamaʻilio leka uila e like me ka spam a i ʻole.
Hoʻopili ʻia nā algorithms penei:
- ʻO ke kaumaha huhū
- K-Nea Neighbors
- Kākoʻo Vector Machine
- Laau Hoʻoholo
- Nahele Random
3. Huihui
Hoʻohana ʻia nā algorithms clustering ma Scikit-Learn e hoʻonohonoho pono i nā ʻikepili me nā waiwai like i nā pūʻulu. ʻO ka Clustering ke kaʻina o ka hui ʻana i kahi pūʻulu o nā mea i ʻoi aku ka like o ka poʻe i loko o ka hui like me nā hui ʻē aʻe. No ka laʻana, hiki ke hoʻokaʻawale ʻia ka ʻikepili o nā mea kūʻai aku ma muli o ko lākou wahi.
ʻO nā algorithms clustering nā mea penei:
- DB-SCAN
- K-Means
- ʻO Mini-Batch K-Means
- Huipuʻu Spectral
4. Koho Anaana
Hāʻawi nā algorithm koho hiʻohiʻona i nā ala no ka hoʻohālikelike, hōʻoia, a me ke koho ʻana i nā ʻāpana kūpono a me nā hiʻohiʻona no ka hoʻohana ʻana i nā hana ʻepekema data. Hāʻawi ʻia i ka ʻikepili, ʻo ke koho ʻana i ke kumu hoʻohālike ka pilikia o ke koho ʻana i kahi ʻano helu helu mai kahi pūʻulu o nā moho. Ma nā kūlana maʻamau, mālama ʻia kahi hōʻiliʻili o ka ʻikepili mua. Eia nō naʻe, hiki i ka hana ke komo pū i ka hoʻolālā ʻana o nā hoʻokolohua i kūpono ka ʻikepili i loaʻa i ka pilikia koho hoʻohālike.
ʻO nā modula koho hoʻohālike e hiki ke hoʻomaikaʻi i ka pololei ma ka hoʻoponopono ʻana i nā ʻāpana:
- Keʻa-hōʻoia
- Huli Māhele
- Nā Kūkākūkā
5. Ho'ēmi Dimensionality
ʻO ka hoʻoili ʻana o ka ʻikepili mai kahi ākea kiʻekiʻe a i kahi ākea haʻahaʻa i mālama ʻia e ka hōʻike haʻahaʻa i kekahi mau mea koʻikoʻi o ka ʻikepili kumu, kokoke loa i kona ʻano kumu, ua ʻike ʻia ʻo ka dimensionality reduction. Hoʻemi ʻia ka helu o nā mea hoʻololi random no ka nānā ʻana ke hoʻemi ʻia ka dimensionality. ʻO ka ʻikepili waho, no ka laʻana, ʻaʻole hiki ke noʻonoʻo ʻia e hoʻomaikaʻi i ka pono o nā hiʻohiʻona.
Loaʻa i ka algorithm Reduction Dimensionality i kēia mau mea:
- He koho koho
- Ka Ikepili Kaha Nui (PCA)
Ke hoʻokomo nei iā Scikit-Learn
Pono e hoʻokomo ʻia ʻo NumPy, SciPy, Matplotlib, IPython, Sympy, a me Pandas ma mua o ka hoʻohana ʻana iā Scikit-learn. E hoʻokomo iā lākou me ka pip mai ka console (hana wale no Windows).
E hoʻokomo iā Scikit-learn i kēia manawa ua hoʻokomo mākou i nā hale waihona puke i makemake ʻia.
hiʻona
ʻO Scikit-learn, i kapa ʻia ʻo sklearn i kekahi manawa, he mea hana Python no ka hoʻokō ʻana i nā kumu hoʻohālike aʻo mīkini a me ka hoʻohālike helu. Hiki iā mākou ke hoʻohana ia mea no ka hana ʻana i nā kumu hoʻohālike aʻo mīkini he nui no ka regression, classification, a clustering, a me nā mea hana helu no ka loiloi ʻana i kēia mau hiʻohiʻona. Loaʻa pū kekahi i ka hōʻemi dimensionality, ke koho hiʻohiʻona, ka unuhi ʻana i nā hiʻohiʻona, nā hoʻokokoke ensemble, a me nā ʻikepili i kūkulu ʻia. E noiʻi mākou i kēlā me kēia mau ʻano i ka manawa.
1. Ka lawe ʻana i nā ʻikepili
Loaʻa iā Scikit-Learn kekahi mau ʻikepili i kūkulu mua ʻia, e like me ka iris dataset, home price dataset, titanic dataset, a pēlā aku. ʻO nā pōmaikaʻi nui o kēia mau ʻikepili he maʻalahi lākou e hopu a hiki ke hoʻohana ʻia e hoʻomohala koke i nā hiʻohiʻona ML. He kūpono kēia mau papa helu no nā mea hou. Pēlā nō, hiki iā ʻoe ke hoʻohana i ka sklearn e hoʻokomo i nā ʻikepili hou aʻe. Pēlā nō, hiki iā ʻoe ke hoʻohana iā ia no ka hoʻokomo ʻana i nā ʻikepili hou aʻe.
2. Hoʻokaʻawale i ka ʻikepili no ka hoʻomaʻamaʻa a me ka hoʻāʻo
Ua komo ʻo Sklearn i ka hiki ke hoʻokaʻawale i ka ʻikepili i nā ʻāpana hoʻomaʻamaʻa a hoʻāʻo. Pono ka hoʻokaʻawale ʻana i ka ʻikepili no ka loiloi ʻole o ka hana wānana. Hiki iā mākou ke kuhikuhi i ka nui o kā mākou ʻikepili e pono e hoʻokomo ʻia i loko o ke kaʻaahi a me nā hōʻike hōʻike hōʻike. Ua hoʻokaʻawale mākou i ka ʻikepili me ka hoʻohana ʻana i ka hoʻokaʻawale hoʻāʻo kaʻaahi e like me ka hoʻonohonoho kaʻaahi he 80% o ka ʻikepili a ʻo ka hoʻonohonoho hoʻāʻo he 20%. Hiki ke hoʻokaʻawale ʻia ka ʻikepili penei:
3. Linear Regression
ʻO Linear Regression kahi ʻenehana hoʻonaʻauao mīkini e nānā ʻia. Hana ia i kahi hana hoʻihoʻi. Ma muli o nā hoʻololi kūʻokoʻa, hoʻohālike ka regression i kahi waiwai wānana pahuhopu. Hoʻohana nui ʻia e hoʻoholo i ka loulou ma waena o nā ʻano like ʻole a me ka wānana. ʻOkoʻa nā ʻano hoʻohālikelike like ʻole e pili ana i ke ʻano o ka pilina a lākou e loiloi ai ma waena o nā mea hoʻololi hilinaʻi a kūʻokoʻa, a me ka helu o nā mea hoʻololi kūʻokoʻa i hoʻohana ʻia. Hiki iā mākou ke hana i ka hoʻohālike Linear Regression me ka hoʻohana ʻana iā sklearn penei:
4. Hoʻihoʻi Logistic
ʻO kahi ala hoʻokaʻawale maʻamau ka logistic regression. Aia i loko o ka ʻohana like me ka polynomial a me ka regression linear a no ka ʻohana linear classifier. He maʻalahi ka hoʻomaopopo ʻana i nā ʻike o ka logistic regression a wikiwiki hoʻi e helu. Ma ke ʻano like me ka regression linear, ʻo ka logistic regression kahi ʻenehana regression i mālama ʻia. He categorical ka hoʻololi puka, no laila ʻo ia wale nō ka ʻokoʻa. Hiki iā ia ke hoʻoholo inā he maʻi puʻuwai ka mea maʻi.
Hiki ke hoʻoholo ʻia nā pilikia hoʻohālikelike like ʻole, e like me ka ʻike spam, me ka hoʻohana ʻana i ka logistic regression. ʻO ka wānana diabetes, e hoʻoholo ana inā e kūʻai ka mea kūʻai aku i kahi huahana kikoʻī a hoʻololi paha i kahi hoʻokūkū, e hoʻoholo ana inā e kaomi ka mea hoʻohana i kahi loulou kūʻai kikoʻī, a ʻo nā hiʻohiʻona hou aʻe he mau hiʻohiʻona wale nō.
5. Laau Hooholo
ʻO ka ʻenehana hoʻohālikelike a me ka wanana ikaika loa a hoʻohana nui ʻia ʻo ia ka lāʻau hoʻoholo. ʻO ka lāʻau hoʻoholo he ʻano kumu lāʻau e like me ke kahe kahe, me kēlā me kēia node kūloko e hōʻike ana i kahi hōʻike ma kahi ʻano, kēlā me kēia lālā e hōʻike ana i ka hopena o ka hoʻāʻo, a me kēlā me kēia node lau (node terminal) e paʻa ana i kahi lepili papa.
Ke loaʻa ʻole ka pilina pili o nā mea hilinaʻi me nā ʻokoʻa kūʻokoʻa, ʻo ia hoʻi, inā ʻaʻole i loaʻa nā ʻike pololei o ka hoʻihoʻi ʻana, pono nā kumulāʻau hoʻoholo. Hiki ke hoʻohana ʻia ka mea DecisionTreeRegression() ma ke ʻano like e hoʻohana ai i kahi lāʻau hoʻoholo no ka regression.
6. Nahele Random
ʻO ka ululāʻau ululāʻau he a aʻo aʻo ala no ka hoʻoponopono ʻana i nā pilikia regression a me ka hoʻokaʻawale ʻana. Hoʻohana ʻo ia i ka hoʻonaʻauao ensemble, ʻo ia kahi ʻenehana e hoʻohui i nā papa helu lehulehu e hoʻoponopono i nā pilikia paʻakikī. Hana ʻia kahi ʻano ululāʻau maʻamau me ka nui o nā kumulāʻau hoʻoholo. Hiki ke hoʻohana ʻia no ka hoʻokaʻawale ʻana i nā noi hōʻaiʻē, ʻike i ka hana hoʻopunipuni, a me ka manaʻo i nā maʻi maʻi.
7. Huihui Matrix
ʻO kahi matrix huikau he papa i hoʻohana ʻia no ka wehewehe ʻana i ka hana hoʻohālike hoʻohālikelike. Hoʻohana ʻia nā huaʻōlelo ʻehā e nānā i ka matrix huikau:
- Pono ʻOiaʻiʻo: He hōʻailona ia ua kuhi ke kumu hoʻohālike i kahi hopena maikaʻi a pololei.
- ʻOiaʻiʻo ʻino: He hōʻailona ia ua kuhi ke kumu hoʻohālike i kahi hopena maikaʻi ʻole a pololei.
- False Positive: He hōʻailona ia ua manaʻo ke kumu hoʻohālike i kahi hopena maikaʻi akā he hopena maikaʻi ʻole ia.
- False Negative: He hōʻailona ia ua manaʻo ke kumu hoʻohālike i kahi hopena maikaʻi ʻole, ʻoiai ua maikaʻi maoli ka hopena.
Hoʻokō huikau matrix:
Pros
- He maʻalahi ia e hoʻohana.
- Hiki ke hoʻololi a hoʻohana pono ʻia ka pūʻolo Scikit-Learn, e lawelawe ana i nā pahuhopu honua maoli e like me ka wānana ʻana i nā mea kūʻai aku, hoʻomohala neuroimage, a pēlā aku.
- E ʻike nā mea hoʻohana e makemake e hoʻopili i nā algorithms me kā lākou mau paepae i ka palapala API kikoʻī ma ka pūnaewele Scikit-Learn.
- Nui nā mea kākau, nā hoa hana, a me kahi kākoʻo kaiaulu pūnaewele puni honua a mālama iā Scikit-aʻo i kēia lā.
Con
- ʻAʻole ia ke koho kūpono no ka noiʻi hohonu.
Panina
He pūʻolo koʻikoʻi ʻo Scikit-Learn no kēlā me kēia ʻepekema data e ʻike ikaika ai a me kekahi ʻike. Pono kēia alakaʻi e kōkua iā ʻoe me ka hoʻohana ʻana i ka sklearn. Nui aʻe nā mana o Scikit-aʻo āu e ʻike ai i kou holomua ʻana ma kāu huakaʻi ʻepekema data. Kaʻana like i kou manaʻo ma nā manaʻo.
Waiho i ka Reply