Atọka akoonu[Fipamọ][Ifihan]
Ti o ba jẹ oluṣeto Python tabi ti o ba n wa ohun elo irinṣẹ ti o lagbara lati lo lati ṣafihan ikẹkọ ẹrọ sinu eto iṣelọpọ, Scikit-learn jẹ ile-ikawe ti o nilo lati ṣayẹwo.
Scikit-learn jẹ iwe-ipamọ daradara ati rọrun lati lo, boya o jẹ tuntun si ikẹkọ ẹrọ, fẹ lati dide ati ṣiṣe ni iyara, tabi fẹ lati lo ohun elo iwadii ML ti o loye julọ.
O gba ọ laaye lati kọ awoṣe data asọtẹlẹ ni awọn laini koodu diẹ nikan lẹhinna lo awoṣe yẹn lati baamu data rẹ bi ile-ikawe ipele giga. O rọ ati ṣiṣẹ daradara pẹlu miiran Python ikawe bii Matplotlib fun charting, NumPy fun isọdi-ọpọlọpọ, ati pandas fun iworan data.
Ninu itọsọna yii, iwọ yoo wa gbogbo ohun ti o jẹ, bii o ṣe le lo, pẹlu awọn anfani ati alailanfani rẹ.
ohun ti o jẹ Scikit-kọ ẹkọ?
Scikit-learn (ti a tun mọ si sklearn) nfunni ni eto oniruuru ti awọn awoṣe iṣiro ati ẹkọ ẹrọ. Ko dabi ọpọlọpọ awọn modulu, sklearn ti wa ni idagbasoke ni Python kuku ju C. Pelu idagbasoke ni Python, ṣiṣe ti sklearn ni a sọ fun lilo NumPy fun algebra laini iṣẹ ṣiṣe giga ati awọn iṣẹ ṣiṣe.
Scikit-Learn ni a ṣẹda gẹgẹbi apakan ti Google's Summer of Code project ati pe o ti jẹ ki awọn igbesi aye awọn miliọnu ti Python-centric data onimọ-jinlẹ kọja agbaye rọrun. Apakan jara yii dojukọ lori fifihan ile-ikawe naa ati idojukọ si ipin kan - awọn iyipada dataset, eyiti o jẹ bọtini ati igbesẹ pataki lati ṣe ṣaaju idagbasoke awoṣe asọtẹlẹ kan.
Ile-ikawe naa da lori SciPy (Python Scientific), eyiti o gbọdọ fi sii ṣaaju ki o to le lo scikit-learn. Akopọ yii ni awọn nkan wọnyi ninu:
- NumPy: Python ká boṣewa n-onisẹpo orun package
- SciPy: O jẹ package ipilẹ fun iširo imọ-jinlẹ
- Pandas: Awọn ẹya data ati itupalẹ
- Matplotlib: O jẹ ile-ikawe igbero 2D/3D ti o lagbara
- Sympy: Iṣiro aami
- IPython: Imudara ohun ibanisọrọ console
Awọn ohun elo ti ile-ikawe Scikit-ẹkọ
Scikit-learn jẹ package Python-ìmọ-ìmọ pẹlu itupalẹ data fafa ati awọn ẹya iwakusa. O wa pẹlu plethora ti awọn algoridimu ti a ṣe sinu lati ṣe iranlọwọ fun ọ lati ni pupọ julọ ninu awọn iṣẹ akanṣe imọ-jinlẹ data rẹ. Ile-ikawe-ẹkọ Scikit jẹ lilo ni awọn ọna wọnyi.
1. ifaseyin
Itupalẹ ipadasẹhin jẹ ilana iṣiro fun itupalẹ ati oye asopọ laarin awọn oniyipada meji tabi diẹ sii. Ọna ti a lo lati ṣe awọn iranlọwọ itupale ipadasẹhin ni ṣiṣe ipinnu iru awọn eroja ti o wulo, eyiti o le kọju, ati bii wọn ṣe n ṣe ajọṣepọ. Awọn imuposi ipadasẹhin, fun apẹẹrẹ, le ṣee lo lati ni oye daradara ti ihuwasi ti awọn idiyele ọja.
Awọn algoridimu ipadasẹhin pẹlu:
- Atilẹyin ti ila
- Ridge padasẹyin
- Ipadasẹhin Lasso
- Ipinnu Tree padasẹyin
- Igbo ID
- Ṣe atilẹyin Awọn Ẹrọ Vector (SVM)
2. Sọri
Ọna Isọri jẹ ọna Ikẹkọ Abojuto ti o nlo data ikẹkọ lati ṣe idanimọ ẹya ti awọn akiyesi tuntun. Algoridimu kan ni Isọri kọ ẹkọ lati inu fifunni iwe data tabi awọn akiyesi ati lẹhinna pin awọn akiyesi afikun si ọkan ninu ọpọlọpọ awọn kilasi tabi awọn akojọpọ. Wọn le, fun apẹẹrẹ, ṣee lo lati ṣe lẹtọ awọn ibaraẹnisọrọ imeeli bi àwúrúju tabi rara.
Awọn algoridimu ipin pẹlu atẹle naa:
- Ilọsiwaju logistic
- K- Awọn aladugbo to sunmọ
- Ṣe atilẹyin Ẹrọ Vector
- Ipinnu Igi
- Igbo ID
3. Iṣakojọpọ
Awọn algoridimu iṣupọ ni Scikit-learn ni a lo lati ṣeto data laifọwọyi pẹlu awọn ohun-ini ti o jọra sinu awọn eto. Pipọpọ jẹ ilana ti kikojọpọ awọn ohun kan ki awọn ti o wa ninu ẹgbẹ kan naa jọra si awọn ti o wa ni awọn ẹgbẹ miiran. Awọn data onibara, fun apẹẹrẹ, le jẹ iyatọ ti o da lori ipo wọn.
Awọn algoridimu ikojọpọ pẹlu atẹle naa:
- DB-Scan
- K-Awọn ọna
- Mini-Batch K-Means
- Isopọ Spectral
4. Aṣayan awoṣe
Awọn algoridimu yiyan awoṣe pese awọn ọna fun ifiwera, ifẹsẹmulẹ, ati yiyan awọn aye ti aipe ati awọn awoṣe fun lilo ninu awọn ipilẹṣẹ imọ-jinlẹ data. Fifun data, yiyan awoṣe jẹ iṣoro ti yiyan awoṣe iṣiro lati ẹgbẹ kan ti awọn awoṣe oludije. Ni awọn ipo ipilẹ julọ, ikojọpọ data ti tẹlẹ ti wa ni a ṣe akiyesi. Sibẹsibẹ, iṣẹ-ṣiṣe naa le tun pẹlu apẹrẹ awọn adanwo ki data ti o gba ni ibamu daradara si iṣoro yiyan awoṣe.
Awọn awoṣe yiyan awoṣe ti o le mu iṣedede pọ si nipa titunṣe awọn paramita pẹlu:
- Wiwulo agbelebu
- Akoj Search
- metiriki
5. Dimensionality Idinku
Gbigbe data lati aaye iwọn-giga si aaye iwọn-kekere ki aṣoju iwọn-kekere ṣe itọju diẹ ninu awọn abala pataki ti data atilẹba, ti o sunmọ si iwọn atorunwa rẹ, ni a mọ bi idinku iwọn. Awọn nọmba ti ID oniyipada fun onínọmbà ti wa ni dinku nigbati awọn dimensionality dinku. Awọn data ti o jade, fun apẹẹrẹ, le ma ṣe akiyesi lati mu imudara awọn iwoye dara si.
Algorithm Dimensionality Idinku pẹlu atẹle naa:
- Aṣayan ẹya-ara
- Onínọmbà Ipilẹ Ipilẹ (PCA)
Fifi Scikit-kọ ẹkọ
NumPy, SciPy, Matplotlib, IPython, Sympy, ati Pandas nilo lati fi sori ẹrọ ṣaaju lilo Scikit-learn. Jẹ ki a fi wọn sii nipa lilo pip lati console (ṣiṣẹ fun Windows nikan).
Jẹ ki a fi Scikit-kọ ẹkọ ni bayi pe a ti fi awọn ile-ikawe ti o nilo sori ẹrọ.
Awọn ẹya ara ẹrọ
Scikit-learn, nigbakan ti a mọ si sklearn, jẹ ohun elo irinṣẹ Python fun imuse awọn awoṣe ikẹkọ ẹrọ ati awoṣe iṣiro. A le lo lati ṣẹda awọn awoṣe ikẹkọ ẹrọ pupọ fun ipadasẹhin, isọdi, ati iṣupọ, bakanna bi awọn irinṣẹ iṣiro fun iṣiro awọn awoṣe wọnyi. O tun pẹlu idinku iwọn iwọn, yiyan ẹya, isediwon ẹya, awọn isunmọ akojọpọ, ati awọn ipilẹ data ti a ṣe sinu. A óò ṣe ìwádìí ọ̀kọ̀ọ̀kan àwọn ànímọ́ wọ̀nyí lọ́kọ̀ọ̀kan.
1. Gbigbe Datasets
Scikit-eko pẹlu nọmba kan ti awọn ipilẹ data ti a ti kọ tẹlẹ, gẹgẹbi dataset iris, data iye owo ile, dataset titanic, ati bẹbẹ lọ. Awọn anfani bọtini ti awọn ipilẹ data wọnyi ni pe wọn rọrun lati ni oye ati pe o le ṣee lo lati ṣe agbekalẹ awọn awoṣe ML lẹsẹkẹsẹ. Awọn ipilẹ data wọnyi yẹ fun awọn alakobere. Bakanna, o le lo sklearn lati gbe awọn afikun datasets wọle. Bakanna, o le lo lati gbe awọn afikun datasets wọle.
2. Pipin Dataset fun Ikẹkọ ati Idanwo
Sklearn pẹlu agbara lati pin dataset sinu ikẹkọ ati awọn apakan idanwo. Pipin dataset jẹ nilo fun igbelewọn aiṣedeede ti iṣẹ asọtẹlẹ. A le pato iye ti data wa yẹ ki o wa ninu ọkọ oju irin ati awọn iwe data idanwo. A pin data nipa lilo pipin idanwo ọkọ oju irin iru eyiti ṣeto ọkọ oju-irin ni 80% ti data naa ati pe eto idanwo ni 20%. Atokọ data le pin gẹgẹbi atẹle:
3. Iyipada ila
Ipadasẹyin Linear jẹ ilana ikẹkọ ẹrọ ti o da lori ikẹkọ ti iṣakoso. O ṣe iṣẹ ipadasẹhin. Da lori awọn oniyipada ominira, awọn awoṣe ipadasẹhin iye asọtẹlẹ ibi-afẹde kan. O jẹ lilo pupọ julọ lati pinnu ọna asopọ laarin awọn oniyipada ati asọtẹlẹ. Awọn awoṣe ipadasẹhin oriṣiriṣi yatọ ni awọn ofin ti iru asopọ ti wọn ṣe iṣiro laarin awọn ti o gbẹkẹle ati awọn oniyipada ominira, bakanna bi nọmba awọn oniyipada ominira ti a lo. A le jiroro ni ṣẹda awoṣe Ipadasẹyin Linear ni lilo sklearn bi atẹle:
4. Logistic padasẹyin
Ọna ti isori ti o wọpọ jẹ ipadasẹhin logistic. O wa ninu idile kanna bi ilopọ pupọ ati ipadasẹhin laini ati pe o jẹ ti idile ikasi laini. Awọn awari ti ipadasẹhin logistic jẹ rọrun lati loye ati pe o yara lati ṣe iṣiro. Ni ọna kanna bi iṣipopada laini, ipadasẹhin logistic jẹ ilana isọdọtun abojuto. Oniyipada ti o wu jade jẹ isori, nitorinaa iyẹn nikan ni iyatọ. O le pinnu boya tabi kii ṣe alaisan kan ni arun inu ọkan.
Orisirisi awọn oran isọdi, gẹgẹbi wiwa àwúrúju, le jẹ ipinnu nipa lilo ipadasẹhin logistic. Asọtẹlẹ àtọgbẹ, ṣiṣe ipinnu boya alabara kan yoo ra ọja kan pato tabi yipada si orogun, ṣiṣe ipinnu boya olumulo kan yoo tẹ ọna asopọ titaja kan pato, ati ọpọlọpọ awọn oju iṣẹlẹ diẹ sii jẹ apẹẹrẹ diẹ.
5. Ipinnu Igi
Iyatọ ti o lagbara julọ ati lilo pupọ ati ilana asọtẹlẹ ni igi ipinnu. Igi ipinnu jẹ eto igi ti o dabi apẹrẹ ṣiṣan, pẹlu ipade inu kọọkan ti o nsoju idanwo kan lori abuda kan, ẹka kọọkan ti o nsoju ipari idanwo naa, ati ipade ewe kọọkan (oju ipade ebute) ti o ni aami kilasi kan.
Nigbati awọn oniyipada ti o gbẹkẹle ko ni ibatan laini pẹlu awọn oniyipada ominira, ie nigbati ipadasẹhin laini ko ṣe awọn awari ti o pe, awọn igi ipinnu jẹ anfani. Ohun elo DecisionTreeRegression () le ṣee lo ni ọna kanna lati lo igi ipinnu fun ipadasẹhin.
6. Igbo ID
Aileto igbo ni a imudani ẹrọ ona fun lohun regression ati classification oran. O jẹ lilo ikẹkọ akojọpọ, eyiti o jẹ ilana ti o ṣajọpọ awọn ikasi pupọ lati yanju awọn iṣoro idiju. Ọna igbo laileto jẹ ti nọmba nla ti awọn igi ipinnu. O le ṣee lo lati ṣe tito lẹtọ awọn ohun elo awin, ṣawari ihuwasi arekereke, ati nireti awọn ibesile arun.
7. iporuru Matrix
Matrix iporuru jẹ tabili ti a lo lati ṣe apejuwe iṣẹ awoṣe ikasi. Awọn ọrọ mẹrin wọnyi ni a lo lati ṣe ayẹwo matrix idarudapọ:
- Rere Tòótọ: O tọka si pe awoṣe jẹ iṣẹ akanṣe abajade ọjo ati pe o pe.
- Odi otitọ: O tọka si pe awoṣe jẹ iṣẹ akanṣe abajade buburu ati pe o tọ.
- Rere Irọ: O tọka si pe awoṣe nireti abajade ọjo ṣugbọn o jẹ eyi odi gaan.
- Negetifu eke: O tọka si pe awoṣe nireti abajade odi, lakoko ti abajade jẹ rere gaan.
Imuse matrix iporuru:
Pros
- O rọrun lati lo.
- Apo-ẹkọ Scikit jẹ adaṣe pupọ ati iwulo, ṣiṣe awọn ibi-afẹde gidi-aye gẹgẹbi asọtẹlẹ ihuwasi olumulo, idagbasoke neuroimage, ati bẹbẹ lọ.
- Awọn olumulo ti o fẹ lati so awọn algoridimu pọ pẹlu awọn iru ẹrọ wọn yoo wa iwe alaye API lori oju opo wẹẹbu Scikit-Learn.
- Awọn onkọwe lọpọlọpọ, awọn alabaṣiṣẹpọ, ati atilẹyin agbegbe ori ayelujara nla kan ati jẹ ki Scikit kọ ẹkọ ni imudojuiwọn.
konsi
- Kii ṣe aṣayan pipe fun ikẹkọ inu-jinlẹ.
ipari
Scikit-learn jẹ package to ṣe pataki fun gbogbo onimọ-jinlẹ data lati ni oye to lagbara ati iriri diẹ pẹlu. Itọsọna yii yẹ ki o ran ọ lọwọ pẹlu ifọwọyi data nipa lilo sklearn. Ọpọlọpọ awọn agbara diẹ sii ti Scikit-kọ pe iwọ yoo ṣawari bi o ṣe nlọsiwaju nipasẹ ìrìn imọ-jinlẹ data rẹ. Pin ero rẹ ninu awọn asọye.
Fi a Reply