Clàr-innse[Falaich][Seall]
Ma tha thu nad phrògramadair Python no ma tha thu a’ coimhead airson inneal cumhachdach airson a chleachdadh gus ionnsachadh innealan a thoirt a-steach do shiostam cinneasachaidh, tha Scikit-learn na leabharlann a dh’ fheumas tu sgrùdadh a dhèanamh.
Tha Scikit-learn air a dheagh chlàradh agus furasta a chleachdadh, ge bith a bheil thu ùr ann an ionnsachadh innealan, ag iarraidh a dhol suas agus a ruith gu sgiobalta, no ag iarraidh an inneal rannsachaidh ML as ùire a chleachdadh.
Leigidh e leat modal dàta ro-innseach a thogail ann am beagan loidhnichean de chòd agus an uairsin a’ cleachdadh a’ mhodail sin a fhreagras air an dàta agad mar leabharlann àrd-ìre. Tha e sùbailte agus ag obair gu math le feadhainn eile Python leabharlannan leithid Matplotlib airson clàradh, NumPy airson vectorization array, agus pandathan airson fradharc dàta.
San iùl seo, gheibh thu a-mach dè a th’ ann, mar as urrainn dhut a chleachdadh, còmhla ris na buannachdan agus na h-eas-bhuannachdan aige.
Na th’ann Scikit-ionnsaich?
Tha Scikit-learn (ris an canar cuideachd sklearn) a’ tabhann seata eadar-mheasgte de mhodalan staitistigeil agus ionnsachadh innealan. Eu-coltach ris a 'mhòr-chuid de mhodalan, tha sklearn air a leasachadh ann am Python seach C. A dh'aindeoin a bhith air a leasachadh ann am Python, tha èifeachdas sklearn air a thoirt seachad airson a bhith a' cleachdadh NumPy airson obair ailseabra sreathach agus sreath àrd-choileanadh.
Chaidh Scikit-Learn a chruthachadh mar phàirt de phròiseact Summer of Code aig Google agus bhon uair sin tha e air beatha milleanan de luchd-saidheans dàta Python-centric air feadh an t-saoghail a dhèanamh nas sìmplidhe. Tha an earrann seo den t-sreath a’ cur fòcas air a bhith a’ taisbeanadh an leabharlainn agus a’ cuimseachadh air aon eileamaid – cruth-atharraichean dàta, a tha na cheum cudromach is deatamach ri ghabhail mus tèid modal ro-innse a leasachadh.
Tha an leabharlann stèidhichte air SciPy (Scientific Python), a dh’ fheumar a chuir a-steach mus urrainn dhut scikit-learn a chleachdadh. Tha na nithean a leanas anns a’ chruach seo:
- NumPy: Pasgan n-mheudach àbhaisteach Python
- SciPy: Tha e na phasgan bunaiteach airson coimpiutaireachd saidheansail
- Pandas: Structar dàta agus mion-sgrùdadh
- Matplotlib: Tha e na leabharlann dealbhaidh cumhachdach 2D/3D
- Co-fhaireachdainn: Matamataig samhlachail
- IPython: Console eadar-ghnìomhach leasaichte
Cleachdaidhean leabharlann Scikit-learn
Tha Scikit-learn na phasgan Python stòr fosgailte le mion-sgrùdadh dàta sòlaimte agus feartan mèinnearachd. Tha e a’ tighinn le pailteas de algorithms togte gus do chuideachadh le bhith a’ faighinn a’ chuid as fheàrr às na pròiseactan saidheans dàta agad. Tha an leabharlann Scikit-lean air a chleachdadh anns na dòighean a leanas.
1. Tilleadh
Tha mion-sgrùdadh ais-tharraing na dhòigh staitistigeil airson a bhith a’ sgrùdadh agus a’ tuigsinn a’ cheangail eadar dà chaochladair no barrachd. Tha an dòigh a thathar a’ cleachdadh airson mion-sgrùdadh ais-tharraing a’ cuideachadh ann a bhith a’ dearbhadh dè na h-eileamaidean a tha buntainneach, a dh’ fhaodadh a bhith air an dearmad, agus mar a bhios iad ag eadar-obrachadh. Faodar dòighean ais-tharraing, mar eisimpleir, a chleachdadh gus tuigse nas fheàrr fhaighinn air giùlan prìsean stoc.
Tha algorithms ath-tharraing a’ toirt a-steach:
- Ath-thòiseachadh loidhneach
- Ath-thionndadh druim
- Tilleadh Lasso
- Co-dhùnadh craobh ath-thilleadh
- Coille air thuaiream
- Innealan taic Vector (SVM)
2. Seòrsachadh
Is e dòigh ionnsachaidh fo stiùir a th’ anns an dòigh seòrsachaidh a bhios a’ cleachdadh dàta trèanaidh gus an roinn de bheachdan ùra a chomharrachadh. Bidh algairim ann an Seòrsachadh ag ionnsachadh bho neach a chaidh a thoirt seachad seata dàta no amharc agus an uairsin a’ seòrsachadh bheachdan a bharrachd ann an aon de dh’ iomadh clas no buidheann. Faodaidh iad, mar eisimpleir, a bhith air an cleachdadh gus conaltradh puist-d a sheòrsachadh mar spama no nach eil.
Tha algorithms seòrsachaidh a’ toirt a-steach na leanas:
- Rèiteachadh logistic
- K- Na nàbaidhean as fhaisge
- Taic Vector Machine
- Craobh Co-dhùnaidh
- Coille air thuaiream
3. Cnuasachadh
Bithear a’ cleachdadh na h-algorithms cruinneachadh ann an Scikit-learn gus dàta le feartan coltach ris a chuir air dòigh gu fèin-ghluasadach ann an seataichean. Is e cruinneachadh a th’ ann am pròiseas cruinneachadh sheata de nithean gus am bi an fheadhainn san aon bhuidheann nas coltaiche ris an fheadhainn ann am buidhnean eile. Dh’ fhaodadh dàta teachdaiche, mar eisimpleir, a bhith air a sgaradh a rèir an àite.
Am measg nan algorithms cnuasachaidh tha na leanas:
- DB-SCAN
- K-Means
- Mini-batch K-Means
- Cruinneachadh spectral
4. Taghadh Modail
Bidh algorithms taghadh modail a’ toirt seachad dhòighean airson coimeas, dearbhadh, agus taghadh nam paramadairean agus na modailean as fheàrr airson an cleachdadh ann an iomairtean saidheans dàta. Le dàta, ’s e taghadh mhodail an duilgheadas a bhith a’ taghadh modail staitistigeil bho bhuidheann de mhodailean tagraiche. Anns na suidheachaidhean as bunaitiche, thathas a’ toirt aire do chruinneachadh dàta a tha ann mu thràth. Ach, faodaidh an obair cuideachd a bhith a’ toirt a-steach dealbhadh dheuchainnean gus am bi an dàta a chaidh fhaighinn a’ freagairt gu math air an duilgheadas taghadh mhodail.
Am measg nam modalan taghaidh mhodail as urrainn cruinneas a leasachadh le bhith ag atharrachadh paramadairean tha:
- Tar-dhearbhadh
- Rannsachadh Clèithe
- Sgòthan geala
5. Meudachadh Lùghdachadh
Is e lughdachadh meudachd a chanar ri gluasad dàta bho àite àrd-mheudach gu àite le tomhas ìosal gus am bi an riochdachadh beag-mheudach a’ gleidheadh cuid de thaobhan cudromach den dàta tùsail, gu h-iomchaidh faisg air a mheud gnèitheach. Tha an àireamh de chaochladairean air thuaiream airson mion-sgrùdadh air a lughdachadh nuair a thèid meudachd a lughdachadh. Is dòcha nach tèid beachdachadh air dàta taobh a-muigh, mar eisimpleir, gus èifeachdas ìomhaighean a leasachadh.
Tha algorithm lughdachadh meudachd a’ toirt a-steach na leanas:
- Taghadh feart
- Mion-sgrùdadh Prìomh Chomharran (PCA)
Stàladh Scikit-learn
Feumar NumPy, SciPy, Matplotlib, IPython, Sympy, agus Pandas a chuir a-steach mus cleachd iad Scikit-learn. Nach stàlaich sinn iad le bhith a’ cleachdadh pip bhon chonsail (ag obair airson Windows a-mhàin).
Feuch an stàlaich sinn Scikit-learn a-nis gu bheil sinn air na leabharlannan riatanach a chuir a-steach.
feartan
Tha Scikit-learn, ris an canar uaireannan sklearn, na inneal Python airson modalan ionnsachaidh inneal agus modaladh staitistigeil a bhuileachadh. Faodaidh sinn a chleachdadh gus grunn mhodalan ionnsachaidh inneal a chruthachadh airson ais-tharraing, seòrsachadh, agus cruinneachadh, a bharrachd air innealan staitistigeil airson na modalan sin a mheasadh. Tha e cuideachd a’ toirt a-steach lughdachadh meudachd, taghadh feart, às-tharraing feart, dòighean-obrach ensemble, agus stòran-dàta togte. Nì sinn sgrùdadh air gach aon de na feartan sin aon aig aon àm.
1. A 'toirt a-steach clàran-dàta
Tha Scikit-learn a’ toirt a-steach grunn stòran-dàta ro-thogte, leithid an stòr-dàta iris, dàta prìsean dachaigh, stòr-dàta titanic, agus mar sin air adhart. Is e prìomh bhuannachdan nan stòran-dàta sin gu bheil iad furasta an tuigsinn agus faodar an cleachdadh gus modalan ML a leasachadh sa bhad. Tha na stòran-dàta sin iomchaidh airson luchd-tòiseachaidh. San aon dòigh, faodaidh tu sklearn a chleachdadh gus stòran-dàta a bharrachd a thoirt a-steach. San aon dòigh, faodaidh tu a chleachdadh gus stòran-dàta a bharrachd a thoirt a-steach.
2. A 'sgoltadh seata dàta airson Trèanadh agus Deuchainn
Bha Sklearn a’ toirt a-steach comas an dàta a roinn ann an roinnean trèanaidh is deuchainn. Tha feum air roinneadh an dàta airson measadh neo-phàirteach air coileanadh ro-innse. Faodaidh sinn sònrachadh cia mheud den dàta againn a bu chòir a bhith air a ghabhail a-steach san t-seata-dàta trèana is deuchainn. Roinn sinn an dàta le bhith a’ cleachdadh sgoltadh deuchainn trèana gus am bi an seata trèana a’ toirt a-steach 80% den dàta agus gu bheil 20% anns an t-seata deuchainn. Faodar an stòr-dàta a roinn mar a leanas:
3. Ais-tharraing sreathach
Is e dòigh ionnsachaidh inneal stèidhichte air ionnsachadh a th’ ann an Linear Regression. Bidh e a’ dèanamh obair ais-tharraing. Stèidhichte air caochladairean neo-eisimeileach, tha ath-thilleadh a’ modail luach ro-innse amasan. Tha e air a chleachdadh sa mhòr-chuid gus faighinn a-mach an ceangal eadar caochladairean agus ro-innse. Tha diofar mhodalan ath-thòiseachaidh eadar-dhealaichte a thaobh an seòrsa ceangail a bhios iad a’ measadh eadar caochladairean eisimeileach agus neo-eisimeileach, a bharrachd air an àireamh de chaochladairean neo-eisimeileach a thathar a’ cleachdadh. Is urrainn dhuinn dìreach am modal Linear Regression a chruthachadh a’ cleachdadh sklearn mar a leanas:
4. Logistic Regression
Is e dòigh seòrsachaidh cumanta ath-thilleadh loidsigeach. Tha e san aon teaghlach ri ath-thilleadh polynomial agus sreathach agus buinidh e don teaghlach seòrsaiche sreathach. Tha co-dhùnaidhean ais-tharraing loidsigeach sìmplidh a thuigsinn agus tha iad luath airson obrachadh a-mach. San aon dòigh ri ais-thionndadh sreathach, tha ais-thionndadh loidsigeach na dhòigh ath-thilleadh fo stiùir. Tha an caochladair toraidh gnèitheach, mar sin is e sin an aon eadar-dhealachadh. Faodaidh e dearbhadh a bheil galar cridhe air euslainteach no nach eil.
Faodar diofar chùisean seòrsachaidh, leithid lorg spama, fhuasgladh le bhith a’ cleachdadh ais-tharraing loidsigeach. Tha ro-innse tinneas an t-siùcair, a’ dearbhadh an ceannaich neach-cleachdaidh toradh sònraichte no an atharraich e gu farpaiseach, a’ dearbhadh am bi neach-cleachdaidh a’ cliogadh air ceangal margaidheachd sònraichte, agus tha mòran a bharrachd de shuidheachaidhean nan dìreach beagan eisimpleirean.
5. Craobh-cinnidh
Is e an craobh co-dhùnaidh an dòigh seòrsachaidh agus ro-innse as cumhachdaiche agus as fharsainge. Is e craobh co-dhùnaidh structar craoibhe a tha coltach ri clàr-sruth, le gach nód a-staigh a’ riochdachadh deuchainn air feart, gach meur a’ riochdachadh co-dhùnadh an deuchainn, agus gach nód duille (nòta crìochnachaidh) a’ cumail bileag clas.
Nuair nach eil dàimh sreathach aig na caochladairean eisimeileach ris na caochladairean neo-eisimeileach, ie nuair nach toir ais-thionndadh sreathach toraidhean ceart, tha craobhan co-dhùnaidh buannachdail. Faodar an nì DecisionTreeRegression() a chleachdadh san aon dòigh gus craobh co-dhùnaidh a chleachdadh airson ais-tharraing.
6. Coille air thuaiream
Tha coille air thuaiream a ionnsachadh innealan dòigh-obrach airson fuasgladh fhaighinn air cùisean ais-tharraing agus seòrsachadh. Bidh e a’ cleachdadh ionnsachadh ensemble, a tha na dhòigh-obrach a tha a’ cothlamadh ioma seòrsachadh gus fuasgladh fhaighinn air duilgheadasan toinnte. Tha modh coille air thuaiream air a dhèanamh suas de àireamh mhòr de chraobhan co-dhùnaidh. Faodar a chleachdadh gus tagraidhean iasad a sheòrsachadh, giùlan meallta a lorg, agus a bhith a’ dùileachadh briseadh a-mach galair.
7. Matrix Confusion
Is e clàr a th’ ann am matrix troimh-chèile a thathar a’ cleachdadh airson cunntas a thoirt air coileanadh modail seòrsachaidh. Tha na ceithir faclan a leanas air an cleachdadh airson sgrùdadh a dhèanamh air matrix troimh-chèile:
- Fìor adhartach: Tha e a’ comharrachadh gun robh am modail a’ ro-innse toradh fàbharach agus gu robh e ceart.
- Fìor àicheil: Tha e a’ comharrachadh gun robh am modail a’ ro-innse droch thoradh agus gu robh e ceart.
- Meallta dearbhach: Tha e a’ comharrachadh gun robh dùil aig a’ mhodail ri toradh fàbharach ach gur e fìor àicheil a bh’ ann.
- False Negative: Tha e a’ comharrachadh gun robh dùil aig a’ mhodail ri toradh àicheil, fhad ‘s a bha a’ bhuil gu math dòchasach.
Cur an gnìomh matrix troimh-chèile:
nithean matha
- Tha e sìmplidh a chleachdadh.
- Tha am pasgan Scikit-lean air leth sùbailte agus feumail, a’ frithealadh amasan fìor san t-saoghal leithid ro-innse giùlan luchd-cleachdaidh, leasachadh neuroimage, agus mar sin air adhart.
- Lorgaidh luchd-cleachdaidh a tha airson na h-algorithms a cheangal ris na h-àrd-chabhsairean aca sgrìobhainnean API mionaideach air làrach-lìn Scikit-learn.
- Bidh grunn ùghdaran, co-oibrichean, agus coimhearsnachd mhòr air-loidhne air feadh an t-saoghail a’ toirt taic agus a’ cumail Scikit-learn ùraichte.
ana
- Chan eil e na dheagh roghainn airson sgrùdadh domhainn.
Co-dhùnadh
Tha Scikit-learn na phasgan deatamach airson gum bi tuigse làidir aig a h-uile neach-saidheans dàta agus beagan eòlas leis. Bu chòir don iùl seo do chuideachadh le bhith a’ làimhseachadh dàta a’ cleachdadh sklearn. Tha mòran a bharrachd de chomasan Scikit-learn a lorgas tu mar a thèid thu air adhart tron chuairt-dànachd saidheans dàta agad. Roinn do bheachdan anns na beachdan.
Leave a Reply