Tafole ea likateng[Pata][Bontša]
Haeba u setsebi sa Python kapa u ntse u batla sesebelisoa se matla seo u ka se sebelisang ho hlahisa ho ithuta ka mochine tsamaisong ea tlhahiso, Scikit-Learn ke laebrari eo u lokelang ho e hlahloba.
Scikit-Learn e ngotsoe hantle ebile e bonolo ho e sebelisa, ebang u sa tsoa ithuta ka mochini, u batla ho tsoha le ho sebetsa kapele, kapa u batla ho sebelisa sesebelisoa sa morao-rao sa lipatlisiso sa ML.
E u lumella ho haha mohlala oa data o boletsoeng esale pele ka mela e 'maloa feela ea khoutu ebe o sebelisa mofuta oo ho lumellana le data ea hau joalo ka laeborari ea boemo bo holimo. E bonolo ebile e sebetsa hantle le tse ling Lilaebrari tsa Python joalo ka Matplotlib bakeng sa charting, NumPy bakeng sa array vectorization, le li-pandas bakeng sa pono ea data.
Tataisong ena, u tla fumana tsohle mabapi le hore na ke eng, u ka e sebelisa joang, hammoho le melemo le likotsi tsa eona.
ke eng Scikit-ithute?
Scikit-learn (e tsejoang hape e le sklearn) e fana ka mefuta e fapaneng ea lipalo le ho ithuta ka mochini. Ho fapana le li-modules tse ngata, sklearn e hlahisoa Python ho e-na le C. Ho sa tsotellehe ho ntlafatsoa ho Python, katleho ea sklearn e hlahisoa ke tšebeliso ea eona ea NumPy bakeng sa ts'ebetso e phahameng ea linear algebra le mesebetsi e mengata.
Scikit-Learn e entsoe e le karolo ea morero oa Google Summer of Code mme esale e nolofatsa bophelo ba limilione tsa bo-ramahlale ba data ba Python lefatšeng ka bophara. Karolo ena ea letoto e tsepamisitse maikutlo ho hlahiseng laeborari le ho tsepamisa maikutlo nthong e le 'ngoe - liphetoho tsa dataset, e leng mohato oa bohlokoa le oa bohlokoa o lokelang ho nkuoa pele ho etsoa mohlala oa ho bolela esale pele.
Laeborari e ipapisitse le SciPy (Scientific Python), e tlamehang ho kengoa pele o ka sebelisa scikit-learn. Stack ena e na le lintlha tse latelang:
- NumPy: Pakete e tloaelehileng ea n-dimensional array ea Python
- SciPy: Ke sephutheloana sa mantlha sa khomphutha ea mahlale
- Pandas: Mehaho ea data le tlhahlobo
- Matplotlib: Ke laeborari e matla ea ho rera ea 2D/3D
- Sympy: Lipalo tsa tšoantšetso
- IPython: Kholiso e ntlafetseng e sebetsang
Lisebelisoa tsa laebrari ea ho ithuta ka Scikit
Scikit-Learn ke sephutheloana sa Python se bulehileng se nang le tlhahlobo e rarahaneng ea lintlha le likarolo tsa merafo. E tla le li-algorithms tse ngata tse hahelletsoeng ho u thusa ho fumana molemo ka ho fetisisa mererong ea hau ea mahlale a data. Laeborari ea ho ithuta ka Scikit e sebelisoa ka mekhoa e latelang.
1. Ho theoha
Tshekatsheko ya poelomorago ke thekeniki ya dipalopalo ya go sekaseka le go tlhaloganya kamano gareng ga diphapantsho tse pedi kgotsa go feta. Mokhoa o sebelisoang ho etsa tlhahlobo ea ho khutlela morao o thusa ho fumana hore na ke lintlha life tse bohlokoa, tse ka hlokomolohuoang, le hore na li sebelisana joang. Mekhoa ea ho theoha, mohlala, e ka sebelisoa ho utloisisa hamolemo boitšoaro ba litheko tsa thepa.
Li-algorithms tsa regression li kenyelletsa:
- Ho Tšoara Kelello
- Ridge Regression
- Boitšoaro ba Lasso
- Pheliso ea Sefate sa Qeto
- Random Forest
- Mechini ea Ts'ehetso ea Vector (SVM)
2. Kemiso
Mokgwa wa Karolelano ke mokgwa wa ho Ithuta o Okametsweng o sebedisang dintlha tsa thupelo ho hlwaya sehlopha sa ditebello tse ntjha. Algorithm ho Classification e ithuta ho tsoa ho e fanoeng setatata kapa litebello ebe o hlophisa litebello tse ling ho e 'ngoe ea lihlopha kapa lihlopha tse ngata. Ka mohlala, li ka sebelisoa ho arola melaetsa ea imeile e le spam kapa che.
Li-algorithms tsa Classification li kenyelletsa tse latelang:
- Khopotso ea maikutlo
- K-Baahelani ba Haufi
- Mochini oa Vector oa Tšehetso
- Sefate sa Qeto
- Random Forest
3. Ho kopanya
Li-algorithms tsa clustering ho Scikit-learn li sebelisoa ho hlophisa data e nang le thepa e ts'oanang hore e be lihlopha. Ho bokellana ke mokhoa oa ho hlophisa sehlopha sa lintho hore tse sehlopheng se le seng li tšoane le tsa lihlopha tse ling. Lintlha tsa bareki, mohlala, li ka aroloa ho latela sebaka sa bona.
Clustering algorithms e kenyelletsa tse latelang:
- DB-SEKANE
- K-Ho bolela
- Mini-Batch K-Mes
- Sehlopha sa Spectral
4. Khetho ea Mohlala
Li-algorithms tsa khetho ea mohlala li fana ka mekhoa ea ho bapisa, ho netefatsa, le ho khetha li-parameter le mehlala e nepahetseng bakeng sa ho sebelisoa mererong ea mahlale a data. Ho fanoe ka lintlha, khetho ea mohlala ke bothata ba ho khetha mohlala oa lipalo-palo ho sehlopha sa mehlala ea likhetho. Maemong a mantlha, pokello ea data e neng e ntse e le teng e eloa hloko. Leha ho le joalo, mosebetsi o ka boela oa kenyelletsa moralo oa liteko e le hore data e fumanoeng e tšoanele bothata ba khetho ea mohlala.
Li-module tsa khetho ea mohlala tse ka ntlafatsang ho nepahala ka ho fetola liparamente li kenyelletsa:
- Ho netefatsa
- Grid Search
- Metrics
5. Phokotso ea Boemo
Ho fetisoa ha data ho tloha sebakeng se phahameng ho ea sebakeng se tlaase-tlaase e le hore setšoantšo se tlaase se boloke lintlha tse ling tsa bohlokoa tsa data ea pele, hantle haufi le tekanyo ea tlhaho, e tsejoang e le phokotso ea litekanyo. Palo ea mefuta e sa fetoheng bakeng sa tlhahlobo e fokotsehile ha boholo bo fokotsehile. Lintlha tse kantle, mohlala, li kanna tsa se nkuoe ho ntlafatsa ts'ebetso ea lipono.
Algorithm ea Phokotso ea Dimensionality e kenyelletsa tse latelang:
- Likhetho
- Tshekatsheko ya Motsamaisi-Kakaretso (PCA)
Ho kenya Scikit-learn
NumPy, SciPy, Matplotlib, IPython, Sympy, le Pandas li tlameha ho kenngoa pele u sebelisa Scikit-learn. Ha re li kenye re sebelisa pip ho tloha console (e sebetsa feela bakeng sa Windows).
Ha re kenye Scikit-ithute kaha joale re kentse lilaebrari tse hlokahalang.
Likaroloana
Scikit-learn, eo ka linako tse ling e tsejoang e le sklearn, ke sesebelisoa sa Python sa ho kenya tšebetsong mefuta ea ho ithuta ea mochini le mohlala oa lipalo. Re ka e sebelisa ho theha mefuta e mengata ea ho ithuta ea mochini bakeng sa ho khutlela morao, ho hlophisa, le ho kopanya, hammoho le lisebelisoa tsa lipalo tsa ho lekola mefuta ena. E boetse e kenyelletsa phokotso ea boholo, khetho ea likarolo, tlhahiso ea likarolo, mekhoa e kopaneng, le li-database tse hahelletsoeng. Re tla hlahloba e 'ngoe le e 'ngoe ea litšobotsi tsena ka bonngoe.
1. Ho kenya Boitsebiso
Scikit-learn e kenyelletsa palo ea li-dataset tse hahiloeng esale pele, joalo ka dataset ea iris, pokello ea lintlha tsa theko ea lehae, titanic dataset, joalo-joalo. Melemo ea bohlokoa ea li-dataset tsena ke hore li bonolo ho li utloisisa 'me li ka sebelisoa ho hlahisa mefuta ea ML hang-hang. Lintlha tsena li loketse ba qalang. Ka mokhoa o ts'oanang, o kanna oa sebelisa sklearn ho kenya li-dataset tse ling. Ka mokhoa o ts'oanang, u ka e sebelisa ho kenya li-database tse ling.
2. Ho Arola Setsi sa Boitsebiso bakeng sa Koetliso le Teko
Sklearn e kenyelelitse bokhoni ba ho arola dataset ka likarolo tsa koetliso le liteko. Hoa hlokahala ho arola datha bakeng sa tlhahlobo e sa lebelloang ea ts'ebetso ea bonohe. Re ka hlakisa hore na data ea rona e kae e tlamehang ho kenyeletsoa tereneng le li-dataset tsa liteko. Re arolelitse dataset ka ho arola liteko tsa terene hoo sete ea terene e nang le 80% ea data mme sete ea liteko e na le 20%. Dataset e ka aroloa ka tsela e latelang:
3. Linear Regression
Linear Regression ke mokhoa o hlophisitsoeng oa ho ithuta o thehiloeng ho mochini oa ho ithuta. E etsa mosebetsi oa ho khutlisa. Ho ipapisitsoe le mefuta e ikemetseng, mehlala ea ho khutlela morao ke boleng ba ho lepa lipheo. Hangata e sebelisoa ho khetholla kamano pakeng tsa mefuta-futa le ho bolela esale pele. Mefuta e fapaneng ea ho khutlela morao e fapana ho ea ka mofuta oa khokahanyo eo ba e hlahlobang pakeng tsa mefuta e itšetlehileng ka eona le e ikemetseng, hammoho le palo ea mefuta e ikemetseng e sebelisoang. Re ka theha mofuta oa Linear Regression re sebelisa sklearn ka tsela e latelang:
4. Logistic Regression
Mokhoa o tloaelehileng oa ho arola ka lihlopha ke ho fokotseha ha lintho. E lelapeng le le leng le polynomial le linear regression 'me ke ea lelapa la linear classifier. Liphuputso tsa "logistic regression" li bonolo ho utloisisa 'me li potlakile ho bala. Ka mokgwa o tshwanang le wa poelomorago ya mola, poelomorago ya thulaganyo ke thekniki ya poelomorago yeo e hlokometswego. Phapang ea tlhahiso ke ea karohano, kahoo ke eona feela phapang. E ka tseba hore na mokuli o na le lefu la pelo kapa che.
Mathata a fapaneng a ho hlopha, joalo ka ho lemoha spam, a ka rarolloa ho sebelisoa mokhoa oa ho khutlisa lintho. Polelo ea lefu la tsoekere, ho etsa qeto ea hore na moreki o tla reka sehlahisoa se itseng kapa a fetohele ho mohanyetsi, a etsa qeto ea hore na mosebelisi o tla tobetsa sehokelo se itseng sa ho bapatsa, 'me maemo a mang a mangata ke mehlala e seng mekae feela.
5. Sefate sa Qeto
Mokhoa o matla ka ho fetisisa le o sebelisoang haholo oa ho arola le ho bolela esale pele ke sefate sa liqeto. Sefate sa qeto ke sebopeho sa sefate se shebahalang joaloka flowchart, le node e 'ngoe le e 'ngoe ea ka hare e emelang teko ho tšobotsi, lekala le leng le le leng le emela sephetho sa tlhahlobo, le lekhasi le leng le le leng (terminal node) le tšoereng label ea sehlopha.
Ha mefuta e itšetlehileng ka eona e se na kamano ea moeli le mefuta e ikemetseng, ke hore, ha ho fokotseha ha linear ho sa hlahise liphetho tse nepahetseng, lifate tsa liqeto li molemo. Ntho ea DecisionTreeRegression() e ka sebelisoa ka tsela e ts'oanang ho sebelisa sefate sa qeto bakeng sa ho theola maemo.
6. Random Forest
Moru o sa reroang ke a ho ithuta mochine mokhoa oa ho rarolla mathata a ho fokotseha le ho arola. E sebelisa thuto e kopaneng, e leng mokhoa o kopanyang lihlopha tse ngata ho rarolla mathata a rarahaneng. Mokhoa o sa reroang oa meru o entsoe ka palo e kholo ea lifate tsa liqeto. E ka sebelisoa ho arola likopo tsa likalimo, ho lemoha boitšoaro ba bomenemene, le ho lebella ho qhoma ha mafu.
7. Pherekano Matrix
Matrix ea pherekano ke tafole e sebelisoang ho hlalosa ts'ebetso ea mofuta oa lihlopha. Mantsoe a mane a latelang a sebelisoa ho hlahloba matrix a pherekano:
- 'Nete e nepahetseng: Ho bolela hore mohlala o hlahisitse sephetho se setle mme se ne se nepahetse.
- 'Nete e Negative: E bolela hore mohlala o hlahisitse sephetho se sebe mme se ne se nepahetse.
- Phoso ea Bohata: Ho bolela hore mohlala o ne o lebelletse sephetho se setle empa e ne e hlile e le se sebe.
- Phoso ea Bohata: E bolela hore mohlala o ne o lebelletse sephetho se sebe, athe sephetho se ne se hlile se le ntle.
Ts'ebetsong ea pherekano ea matrix:
Pros
- Ho bonolo ho e sebelisa.
- Sephutheloana sa ho ithuta ka Scikit se khona ho ikamahanya le maemo 'me se na le thuso, se sebeletsa lipheo tsa lefats'e tsa nnete tse kang ho bolela esale pele ka boitšoaro ba bareki, nts'etsopele ea neuroimage, joalo-joalo.
- Basebelisi ba lakatsang ho hokahanya li-algorithms le sethala sa bona ba tla fumana litokomane tse qaqileng tsa API webosaeteng ea Scikit-ithute.
- Bangoli ba bangata, basebetsi-'moho, le tšehetso e kholo ea sechaba sa Marang-rang lefatšeng ka bophara le ho boloka Scikit-ithute e ntse e le teng.
tlhoka mesola
- Ha se khetho e nepahetseng bakeng sa boithuto bo tebileng.
fihlela qeto e
Scikit-Learn ke sephutheloana sa bohlokoa bakeng sa rasaense e mong le e mong oa data ho ba le kutloisiso e matla le boiphihlelo bo itseng ka. Tataiso ena e lokela ho u thusa ka ho qhekella ha data u sebelisa sklearn. Ho na le bokhoni bo bong ba Scikit-ithute boo u tla bo fumana ha u ntse u tsoela pele ka papali ea hau ea mahlale a data. Arolelana maikutlo a hau ho maikutlo.
Leave a Reply