Clár na nÁbhar[Folaigh][Taispeáin]
Más ríomhchláraitheoir Python tú nó má tá tú ag cuardach foireann uirlisí cumhachtach le húsáid chun meaisínfhoghlaim a thabhairt isteach i gcóras táirgthe, is leabharlann é Scikit-learn nach mór duit a sheiceáil.
Tá dea-dhoiciméadú ag Scikit-lean agus tá sé simplí le húsáid, cibé an bhfuil tú nua le foghlaim meaisín, má tá tú ag iarraidh oibriú go tapa, nó ag iarraidh úsáid a bhaint as an uirlis taighde ML is déanaí.
Ligeann sé duit samhail thuarthach sonraí a thógáil i gcúpla líne de chód agus ansin úsáideann sé an tsamhail sin a oireann do do shonraí mar leabharlann ardleibhéil. Tá sé solúbtha agus oibríonn sé go maith le daoine eile Leabharlanna Python cosúil le Matplotlib le haghaidh cairte, NumPy le haghaidh veicteora eagar, agus pandas le haghaidh léirshamhlú sonraí.
Sa treoir seo, gheobhaidh tú amach cad é atá ann, conas is féidir leat é a úsáid, chomh maith leis na buntáistí agus na míbhuntáistí a bhaineann leis.
Cad é Scikit-fhoghlaim?
Tairgeann Scikit-learn (ar a dtugtar sklearn freisin) sraith éagsúil de shamhlacha staidrimh agus de mheaisín-fhoghlaim. Murab ionann agus an chuid is mó de na modúil, forbraítear sklearn i Python seachas C. In ainneoin é a bheith forbartha i Python, cuirtear éifeachtacht sklearn i leith a úsáid NumPy le haghaidh oibríochtaí ailgéabar líneach agus eagair ardfheidhmíochta.
Cruthaíodh Scikit-Learn mar chuid de thionscadal Summer of Code de chuid Google agus ó shin i leith tá saol na milliúin eolaithe sonraí Python-centric ar fud an domhain níos simplí. Díríonn an chuid seo den tsraith ar an leabharlann a chur i láthair agus díriú ar eilimint amháin – claochluithe tacair sonraí, atá ina gcéim ríthábhachtach agus ríthábhachtach le tógáil sula bhforbrófar samhail réamh-mheastacháin.
Tá an leabharlann bunaithe ar SciPy (Scientific Python), a chaithfear a shuiteáil sular féidir leat scikit-learn a úsáid. Tá na míreanna seo a leanas sa stack seo:
- NumPy: Pacáiste caighdeánach eagar n-tríthoiseach Python
- SciPy: Is pacáiste bunúsach é don ríomhaireacht eolaíoch
- Pandas: Struchtúir agus anailís sonraí
- Matplotlib: Is leabharlann plotála chumhachtach 2D/3D í
- Siombail: Matamaitice siombalach
- IPython: Consól idirghníomhach feabhsaithe
Feidhmeanna na leabharlainne Scikit-foghlaim
Is pacáiste foinse oscailte Python é Scikit-lean a bhfuil anailís sonraí agus gnéithe mianadóireachta sofaisticiúla aige. Tagann sé le raidhse halgartaim ionsuite chun cabhrú leat an leas is fearr a bhaint as do thionscadail eolaíochta sonraí. Úsáidtear an leabharlann Scikit-lear ar na bealaí seo a leanas.
1. Cúlchéimniú
Teicníc staitistiúil is ea anailís aischéimnithí chun an nasc idir dhá athróg nó níos mó a anailísiú agus a thuiscint. Cuidíonn an modh a úsáidtear chun anailís chúlchéimnithe a dhéanamh le cinneadh a dhéanamh ar na gnéithe atá ábhartha, ar féidir neamhaird a dhéanamh orthu, agus conas a idirghníomhaíonn siad. Féadfar teicníochtaí aischéimniúcháin, mar shampla, a úsáid chun iompar praghsanna stoic a thuiscint níos fearr.
Áirítear le halgartaim aischéimniúcháin:
- líneach aischéimnithí
- Aischéimniú Iomaire
- Aischéimniú Lasso
- Aischéimniú Crann Cinnidh
- Foraoise Randamach
- Meaisíní Tacaíochta Veicteora (SVM)
2. Aicmiú
Is cur chuige Foghlama Maoirsithe é an modh Aicmithe a úsáideann sonraí oiliúna chun catagóir na mbreathnuithe úra a shainaithint. Foghlaimíonn algartam in Aicmiú ó tugtha tacar sonraí nó breathnuithe agus ansin rangaíonn sé breathnuithe breise i gceann amháin de go leor ranganna nó grúpaí. Is féidir iad a úsáid, mar shampla, chun cumarsáid ríomhphoist a rangú mar thurscar nó nach ea.
Áirítear iad seo a leanas in halgartaim aicmithe:
- Cúlchéimniú Lóistíochta
- K- Comharsana is gaire
- Tacaíocht Meaisín Veicteoir
- Crann Cinnidh
- Foraoise Randamach
3. Cnuasú
Úsáidtear na halgartaim cnuasaithe in Scikit-learn chun sonraí a bhfuil airíonna comhchosúla acu a shocrú go huathoibríoch i dtacair. Is éard is cnuasú ann ná an próiseas chun sraith míreanna a ghrúpáil ionas go mbeidh siad siúd sa ghrúpa céanna níos cosúla leo siúd atá i ngrúpaí eile. D’fhéadfaí sonraí custaiméirí, mar shampla, a dheighilt bunaithe ar a suíomh.
I measc na n-algartam cnuasaithe tá:
- DB-SCAN
- K-Meáin
- Mionbhaisc K-Meáin
- Cnuasú speictreach
4. Roghnú Múnla
Soláthraíonn algartaim roghnúcháin samhlacha modhanna chun na paraiméadair agus na samhlacha is fearr le húsáid i dtionscnaimh eolaíochta sonraí a chur i gcomparáid, a bhailíochtú agus a roghnú. I bhfianaise na sonraí, is í an fhadhb a bhaineann le samhail staitistiúil a roghnú as grúpa samhlacha iarrthóra é roghnú samhlacha. Sna cúinsí is bunúsaí, cuirtear bailiúchán sonraí atá ann cheana san áireamh. Mar sin féin, féadfaidh dearadh na dturgnaimh a bheith san áireamh sa tasc freisin ionas go mbeidh na sonraí a fhaightear in oiriúint go maith don fhadhb roghnúcháin samhla.
I measc na modúil roghnaithe samhlacha ar féidir leo cruinneas a fheabhsú trí pharaiméadair a choigeartú tá:
- Tras-bhailíochtú
- Cuardach Eangaí
- Metrics
5. Laghdú Toise
Tugtar laghdú toise ar aistriú sonraí ó spás ardtoiseach go spás ísealtoiseach ionas go gcaomhnaíonn an léiriú ísealthoiseach gnéithe suntasacha áirithe de na sonraí bunaidh, go hidéalach in aice lena ghné bhunúsach, mar laghdú toise. Laghdaítear líon na n-athróg randamach le haghaidh anailíse nuair a laghdaítear an toise. D’fhéadfadh sé nach mbreathnaítear ar shonraí imeallacha, mar shampla, chun éifeachtúlacht na léirshamhlaithe a fheabhsú.
Áiríonn algartam Laghdú Toise na nithe seo a leanas:
- Roghnú gné
- Anailís ar Phríomh-Chomhpháirt (PCA)
Suiteáil Scikit-learn
Ní mór NumPy, SciPy, Matplotlib, IPython, Sympy, agus Pandas a shuiteáil sula n-úsáideann Scikit-learn. Déanaimis iad a shuiteáil ag baint úsáide as pip ón gconsól (oibreacha do Windows amháin).
Suiteáil Scikit-foghlaim anois go bhfuil na leabharlanna riachtanacha suiteáilte againn.
Gnéithe
Is foireann uirlisí Python é Scikit-lean, ar a dtugtar uaireanta sklearn, chun samhlacha meaisínfhoghlama agus samhaltú staitistiúil a chur i bhfeidhm. D’fhéadfaimis é a úsáid chun ilmhúnlaí meaisínfhoghlama a chruthú d’aischéimniú, d’aicmiú agus do bhraisliú, chomh maith le huirlisí staidrimh chun na samhlacha seo a mheasúnú. Áiríonn sé freisin laghdú toise, roghnú gnéithe, eastóscadh gnéithe, cur chuige ensemble, agus tacair shonraí ionsuite. Déanfaimid imscrúdú ar gach ceann de na tréithe seo ceann i ndiaidh a chéile.
1. Tacaíochtaí Sonraí a Iompórtáil
Áiríonn Scikit-learn roinnt tacar sonraí réamhthógtha, mar shampla an tacar sonraí iris, tacar sonraí praghsanna baile, tacar sonraí titanic, agus mar sin de. Is iad na príomhbhuntáistí a bhaineann leis na tacair shonraí seo ná go bhfuil siad simplí le tuiscint agus gur féidir iad a úsáid láithreach chun samhlacha ML a fhorbairt. Tá na tacair sonraí seo oiriúnach do novices. Mar an gcéanna, is féidir leat sklearn a úsáid chun tacair shonraí breise a iompórtáil. Mar an gcéanna, is féidir leat é a úsáid chun tacair shonraí breise a iompórtáil.
2. Scoilteadh Tacar Sonraí le haghaidh Oiliúna agus Tástála
Áiríodh le Sklearn an cumas an tacar sonraí a roinnt ina chodanna oiliúna agus tástála. Tá gá leis an tacar sonraí a roinnt chun measúnú neamhchlaonta a dhéanamh ar fheidhmíocht tuar. Féadfaimid a shonrú cé mhéad dár sonraí ar cheart a chur san áireamh sna tacair sonraí traenach agus tástála. Roinneamar an tacar sonraí ag baint úsáide as scoilt tástála traenach ionas go gcuimsíonn an tacar traenach 80% de na sonraí agus go bhfuil 20% sa tacar tástála. Is féidir an tacar sonraí a roinnt mar seo a leanas:
3. Aischéimniú Líneach
Teicníc foghlama meaisínbhunaithe maoirsithe is ea Aischéimniú Líneach. Déanann sé post aischéimnithí. Bunaithe ar athróga neamhspleácha, samhlaíonn aischéimniú luach tuartha sprice. Úsáidtear é den chuid is mó chun an nasc idir athróga agus tuar a chinneadh. Tá difríocht idir samhlacha cúlchéimnithe difriúla i dtéarmaí an chineáil naisc a mheasann siad idir athróga spleácha agus neamhspleácha, chomh maith le líon na n-athróg neamhspleácha a úsáidtear. Is féidir linn an tsamhail Aischéimnithe Líneach a chruthú ach úsáid a bhaint as sklearn mar seo a leanas:
4. Aischéimniú Loighistic
Cur chuige coiteann catagóirithe is ea aischéimniú lóistíochta. Tá sé sa teaghlach céanna le aischéimniú iltéarmach agus líneach agus baineann sé leis an teaghlach aicmitheora líneach. Tá torthaí an chúlchéimnithe loighisticice simplí le tuiscint agus is tapa iad a ríomh. Ar an mbealach céanna le cúlchéimniú líneach, is teicníc aischéimniúcháin faoi mhaoirseacht é aischéimniú lóistíochta. Tá an athróg aschuir catagóiriúil, mar sin sin an t-aon difríocht amháin. Féadfaidh sé a chinneadh an bhfuil galar cairdiach ag othar nó nach bhfuil.
Is féidir saincheisteanna aicmithe éagsúla, cosúil le brath turscair, a réiteach trí úsáid a bhaint as aischéimniú lóistíochta. Diaibéiteas a thuar, a chinneadh an gceannóidh tomhaltóir táirge sonrach nó an n-aistreoidh sé go rival, a chinneadh an ndéanfaidh úsáideoir cliceáil ar nasc margaíochta ar leith, agus níl i go leor cásanna eile ach roinnt samplaí.
5. Crann Cinnidh
Is é an crann cinntí an teicníocht aicmithe agus tuar is cumhachtaí agus a úsáidtear go forleathan. Is éard atá i gcrann cinnteoireachta ná struchtúr crann atá cosúil le sreabhchairt, le gach nód inmheánach ag léiriú tástála ar tréith, gach brainse ag léiriú conclúid na tástála, agus lipéad ranga ar gach nód duille (nód críochfoirt).
Nuair nach mbíonn gaol líneach ag na hathróga spleácha leis na hathróga neamhspleácha, ie nuair nach mbíonn torthaí cearta ag baint le cúlchéimniú líneach, bíonn tairbhe ag baint le crainn chinnidh. Féadfar an oibiacht CinneadhTreeRegression() a úsáid ar an mbealach céanna chun crann cinntí a úsáid le haghaidh aischéimnithí.
6. Foraoise Randamach
Is foraoise randamach a foghlaim meaisín cur chuige chun aischéimniú agus saincheisteanna aicmithe a réiteach. Úsáideann sé foghlaim ensemble, ar teicníocht í a chomhcheanglaíonn aicmitheoirí iolracha chun fadhbanna casta a réiteach. Tá modh foraoise randamach comhdhéanta de líon mór de chrainn chinnidh. Féadfar é a úsáid chun iarratais ar iasachtaí a chatagóiriú, iompar calaoiseach a bhrath, agus ráigeanna galair a réamh-mheas.
7. Maitrís Mearbhall
Is tábla é maitrís mearbhaill a úsáidtear chun cur síos a dhéanamh ar fheidhmíocht múnla aicmithe. Úsáidtear na ceithre fhocal seo a leanas chun an maitrís mearbhaill a scrúdú:
- Fíor Dearfach: Léiríonn sé go raibh toradh fabhrach ar an tsamhail agus go raibh sé ceart.
- Fíor Diúltach: Léiríonn sé go raibh drochthoradh réamh-mheasta ar an tsamhail agus go raibh sé ceart.
- Bréagach Dearfach: Léiríonn sé go raibh an tsamhail ag súil le toradh fabhrach ach gur toradh diúltach a bhí ann i ndáiríre.
- Bréagach Diúltach: Léiríonn sé go raibh an tsamhail ag súil le toradh diúltach, cé go raibh an toradh an-dearfach.
Cur i bhfeidhm maitrís mearbhaill:
Son
- Tá sé simplí le húsáid.
- Tá an pacáiste Scikit-lean thar a bheith inoiriúnaithe agus úsáideach, ag freastal ar spriocanna fíor-domhan cosúil le tuar iompar tomhaltóirí, forbairt neuroimage, agus mar sin de.
- Gheobhaidh úsáideoirí ar mian leo na halgartaim a nascadh lena n-ardáin doiciméadú mionsonraithe API ar shuíomh Gréasáin Scikit-learn.
- Tacaíonn go leor údair, comhoibritheoirí, agus pobal mór ar líne domhanda agus coimeádann Scikit-foghlaim cothrom le dáta.
CONS
- Ní hé an rogha iontach é do mhionstaidéar.
Conclúid
Is pacáiste ríthábhachtach é Scikit-lean a bhféadfaidh gach eolaí sonraí tuiscint láidir agus roinnt taithí a bheith aige air. Ba cheart go gcabhródh an treoir seo leat le hionramháil sonraí ag baint úsáide as sklearn. Tá i bhfad níos mó cumas Scikit-learn a gheobhaidh tú amach agus tú ag dul ar aghaidh trí d'eachtra eolaíochta sonraí. Roinn do chuid smaointe sna tuairimí.
Leave a Reply