Table of Contents[Qari][muuji]
Haddii aad tahay barnaamij-sameeyaha Python ama haddii aad raadinayso qalab awood leh oo aad ka faa'iidaysato si aad u geliso barashada mashiinka nidaamka wax soo saarka, Scikit-learn waa maktabad aad u baahan tahay inaad hubiso.
Scikit-learn waa mid si wanaagsan loo diiwaangeliyay oo fudud in la isticmaalo, haddii aad ku cusub tahay barashada mashiinka, aad rabto in aad si degdeg ah u kacdo oo aad u shaqeyso, ama aad rabto in aad isticmaasho qalabka cilmi-baarista ML ee ugu casrisan.
Waxay kuu ogolaanaysaa inaad ku dhisto model xogta saadaaliya oo kaliya dhowr sadar oo kood ah ka dibna u isticmaasho moodalkaas si uu ugu habboonaado xogtaada sidii maktabad heer sare ah. Waa dabacsanaan waxayna si fiican ula shaqeysaa kuwa kale Maktabadaha Python sida Matplotlib ee jaantuska, NumPy ee qaabaynta habaynta, iyo pandas ee aragga xogta.
Hagahan, waxaad ka heli doontaa dhammaan waxa uu yahay, sida aad u isticmaali karto, oo ay la socdaan faa'iidooyinka iyo khasaarooyinka.
waa maxay Scikit-baro?
Scikit-learn (sidoo kale loo yaqaan sklearn) waxay bixisaa noocyo kala duwan oo noocyo xisaabeed ah iyo barashada mashiinka. Si ka duwan qaybaha badankooda, sklearn waxa lagu horumariyaa Python halkii uu ka ahaan lahaa C. In kasta oo lagu soo saaray Python, waxtarka sklearn ayaa loo nisbeeyay adeegsigeeda NumPy ee aljebrada toosan ee waxqabadka sare leh iyo hawlgallada toosan.
Scikit-Learn waxaa loo sameeyay iyada oo qayb ka ah mashruuca Xagaaga ee Google ee mashruuca waxayna tan iyo markaas ka dhigtay nolosha malaayiin saynisyahano xog-urur ah oo adduunka oo dhan ah mid fudud. Qaybtan taxanaha ahi waxay diiradda saaraysaa soo bandhigida maktabadda oo diiradda saaraysa hal shay - isbeddellada xogta, kuwaas oo ah tallaabo muhiim ah oo muhiim ah in la qaado ka hor inta aan la samayn qaabka saadaasha.
Maktabadu waxay ku salaysan tahay SciPy (Scientific Python), oo ay tahay in la rakibo ka hor intaadan isticmaalin scikit-learn. Xirmadaan waxay ka kooban tahay waxyaabaha soo socda:
- NumPy: Python's standard n-cabbir xirmo
- SciPy: Waa xirmo aasaasi u ah xisaabinta sayniska
- Pandas: Qaab-dhismeedka xogta iyo falanqaynta
- Matplotlib: Waa maktabad qaabayn 2D/3D awood leh
- Sympy: Xisaabta astaanta ah
- IPython: Console is dhexgal oo la hagaajiyay
Codsiyada maktabadda-barashada Scikit
Scikit-learn waa xirmo Python il furan oo leh falanqaynta xogta casriga ah iyo sifooyinka macdanta. Waxay la socotaa tiro badan oo algorithms-ku-dhisan si ay kaaga caawiyaan inaad sida ugu fiican uga faa'iidaysato mashaariicda sayniska xogtaada. Maktabada-barashada Scikit waxa loo adeegsadaa siyaabaha soo socda.
1. Dib u gurasho
Falanqaynta dib-u-celinta waa farsamo xisaabeed oo lagu falanqeeyo laguna fahmo xidhiidhka ka dhexeeya laba ama ka badan doorsoomayaal. Habka loo isticmaalo in lagu sameeyo falanqaynta dib u noqoshada waxay caawisaa go'aaminta walxaha khuseeya, kuwaas oo laga yaabo in la iska indho tiro, iyo sida ay u falgalaan. Farsamooyinka dib-u-celinta, tusaale ahaan, waxaa loo isticmaali karaa in si wanaagsan loo fahmo hab-dhaqanka qiimaha saamiyada.
Algorithms dib u noqoshada waxaa ka mid ah:
- toosan dhaca
- Ridge Regression
- Dib -u -dhaca Lasso
- Dib-u-noqoshada Geedka Go'aanka
- Kaymaha Random
- Taageerada Mashiinnada Vector (SVM)
2. Qoondaynta
Habka Kala-saariddu waa hab barasho la kormeero oo adeegsata xogta tababarka si loo aqoonsado qaybta indho-indheynta cusub. Algorithm ee Kala-saarista waxay wax ka barataa mid la bixiyay dataset ama indho-indhayn ka dibna u kala saara indho-indhayn dheeraad ah mid ka mid ah fasallo ama kooxo badan. Waxay tusaale ahaan, loo isticmaali karaa in lagu kala saaro isgaarsiinta iimaylka sidii spam ama aan ahayn.
Kala soocida algorithms waxaa ka mid ah kuwan soo socda:
- Dib u soo noolaynta logistic
- K- Deriska Ugu Dhaw
- Taageerada Mashiinka Vector
- Geedka Go'aanka
- Kaymaha Random
3. Koox-kooxeed
Algorithms-ka ururinta ee ku jira Scikit-learn waxa loo isticmaalaa in si toos ah loogu habeeyo xogta leh sifooyin la mid ah oo la isku dhejiyo. Kooxaysigu waa habka kooxaynta agabyo kala duwan si kuwa isku koox ahi ay ula mid noqdaan kuwa kooxaha kale. Xogta macmiilka, tusaale ahaan, waxa laga yaabaa in lagu kala saaro iyadoo lagu salaynayo meesha ay joogaan.
Algorithms-ka ururinta waxaa ka mid ah kuwan soo socda:
- DB-SCAN
- K-Macnaha
- Mini-Batch K-Means
- Kooxda Spectral
4. Xulashada Model
Algorithms-doorashada moodelku waxay bixiyaan habab isbarbardhigga, xaqiijinta, iyo xulashada cabbirrada ugu wanaagsan iyo moodooyinka loo isticmaalo dadaallada sayniska ee xogta. Marka la eego xogta, xulashada moodalku waa dhibaatada ka soo xulida qaabka tirakoobka koox ka mid ah moodooyinka murashaxiinta. Duruufaha aasaasiga ah, xog ururin horay u jiray ayaa lagu xisaabtamayaa. Si kastaba ha ahaatee, hawshu waxay sidoo kale ku jiri kartaa naqshadaynta tijaabooyinka si xogta la helay ay si fiican ugu habboonaato dhibaatada xulashada qaabka.
Qaababka xulashada ee hagaajin kara saxnaanta iyadoo la hagaajinayo cabbirada waxaa ka mid ah:
- Xaqiijinta isdhaafsiga
- Raadinta Grid
- tubta
5. Dhimista cabbirka
Wareejinta xogta meel sare oo cabbirkeedu sarreeyo oo loo wareejiyo meel cabbir hoose si ay matalaadda cabbirka hoose u ilaaliso qaybo muhiim ah oo ka mid ah xogta asalka ah, oo u dhow cabbirkeeda asalka ah, waxaa loo yaqaannaa dhimista cabbirka. Tirada doorsoomayaasha random ee falanqaynta waa la dhimaa marka cabbirka la yareeyo. Xogta ka baxsan, tusaale ahaan, waxaa laga yaabaa in aan loo tixgelin si ay u wanaajiso hufnaanta muuqaallada.
Algorithm-yaraynta cabbirka waxaa ka mid ah kuwan soo socda:
- Xulashada xulashada
- Falanqaynta Qaybta Maamulaha (PCA)
Ku rakibida Scikit-barro
NumPy, SciPy, Matplotlib, IPython, Sympy, iyo Pandas ayaa loo baahan yahay in la rakibo ka hor inta aan la isticmaalin Scikit-learn. Aynu ku rakibno iyaga anagoo adeegsanayna pip console-ka (wuxuu u shaqeeyaa Windows oo keliya).
Aynu rakibno Scikit-bar hadda in aan rakibnay maktabadihii loo baahnaa.
Features
Scikit-learn, mararka qaarkood loo yaqaan sklearn, waa qalab Python ah oo loogu talagalay hirgelinta moodooyinka barashada mashiinka iyo qaabaynta tirakoobka. Waxaa laga yaabaa inaan u isticmaalno si aan u abuurno noocyo badan oo barashada mashiinka dib-u-celinta, kala-soocidda, iyo ururinta, iyo sidoo kale qalabyada tirakoobka ee lagu qiimeeyo moodooyinkan. Waxa kale oo ka mid ah dhimista cabbirka, xulashada sifada, soo saarista sifada, hababka isu-ururinta, iyo kaydinta xogta. Mid kasta oo ka mid ah sifooyinkaas ayaan mid mid u baari doonnaa.
1. Soo dejinta Xogta
Scikit-learn waxa ku jira tiro kayd xog ah oo horay loo dhisay, sida xogta iris-ka, xogta qiimaha guriga, dataset titanic, iyo wixii la mid ah. Faa'iidooyinka ugu muhiimsan ee xog-ururintani waa inay fudud yihiin in la fahmo oo loo isticmaali karo in isla markiiba la sameeyo moodooyinka ML. Xog-ururintani waxay ku habboon yihiin kuwa cusub. Sidoo kale, waxaad isticmaali kartaa sklearn si aad u soo dejiso xog-ururin dheeraad ah. Sidoo kale, waxaad u isticmaali kartaa inaad soo dejiso xog-ururin dheeraad ah.
2. Qaybinta Xogta Tababarka iyo Imtixaanka
Sklearn waxa ka mid ahaa awooda lagu kala qaybiyo xogta xogta qaybo tababar iyo tijaabo ah. Kala qaybinta xog-ururinta ayaa looga baahan yahay qiimayn aan eex lahayn ee waxqabadka saadaasha. Waxa laga yaabaa in aan qeexno inta xog ah ee ay tahay in lagu daro tareenka iyo kaydka xogta. Waxaanu u qaybinay xogta anagoo adeegsanayna kala qaybsanaanta tijaabada tareenka taasoo ka dhigaysa in tareenku ka kooban yahay 80% xogta halka tijaabada tijaabada ahi ay tahay 20%. Xogta xogta waxa loo qaybin karaa sidan soo socota:
3. Dib u noqoshada toosan
Dib u noqoshada toosan waa farsamo barasho mashiinka ku salaysan oo la kormeerayo. Waxay fulisaa shaqo dib u celin ah. Iyada oo ku saleysan doorsoomayaal madax-banaan, dib-u-dhac ayaa moodaa qiimaha saadaalinta yoolka. Inta badan waxaa loo isticmaalaa in lagu go'aamiyo xiriirka ka dhexeeya doorsoomayaasha iyo saadaalinta. Noocyada kala duwan ee dib-u-celinta waxay ku kala duwan yihiin nooca xidhiidhka ay ku qiimeeyaan inta u dhaxaysa doorsoomayaal ku tiirsan iyo kuwa madaxbannaan, iyo sidoo kale tirada doorsoomayaasha madaxbannaan ee la isticmaalo. Waxaan si fudud u abuuri karnaa qaabka Regression Linear anagoo adeegsanayna sklearn sida soo socota:
4. Dib-u-celinta Logistic
Habka kala soocidda guud waa dib u noqoshada saadka. Waa isku qoys iyo dib u noqoshada toosan waxaana iska leh qoyska kala soocida toosan. Natiijooyinka dib u noqoshada saadka waa sahlan tahay in la fahmo waana degdeg in la xisaabiyo. Si la mid ah dib-u-celinta tooska ah, dib-u-celinta saadka ayaa ah farsamo dib-u-celin la kormeero. Doorsoomka wax soo saarku waa qayb, markaa taasi waa farqiga kaliya. Waxay go'aamin kartaa in bukaanku qabo cudurka wadnaha iyo in kale.
Arrimaha kala soocida kala duwan, sida ogaanshaha spamka, ayaa laga yaabaa in lagu xalliyo iyada oo la adeegsanayo dib-u-celinta saadka. Saadaasha cudurka macaanka, go'aaminta haddii macaamiilku iibsanayo alaab gaar ah ama u beddelayo qof xafiiltama, go'aaminta haddii isticmaaluhu uu gujin doono isku xirka suuqgeynta gaarka ah, iyo xaalado badan oo kale ayaa ah tusaalooyin yar.
5. Geedka go'aanka
Farsamaynta iyo saadaalinta ugu awoodda badan uguna isticmaalka badan waa geedka go'aanka. Geedka go'aanku waa qaab dhismeed geed oo u eg jaantuska qulqulka, iyada oo ud kasta oo gudaha ah ay u taagan tahay imtixaan sifada ah, laan kastaa waxay u taagan tahay gunaanadka imtixaanka, iyo noodh kasta oo caleen ah (terminal node) oo haysta calaamad fasalka.
Marka doorsoomayaasha ku tiirsan aysan xiriir toos ah la yeelan doorsoomayaal madax-bannaan, ie marka dib-u-celinta toosan aysan soo saarin natiijooyin sax ah, geedaha go'aannada ayaa faa'iido leh. Shayga DecisionTreeRegression() waxa loo isticmaali karaa si la mid ah si looga faa'iidaysto geedka go'aanka dib u noqoshada.
6. Kaynta random
Kaynta random waa a barashada mashiinka habka loo xalliyo dib u noqoshada iyo arrimaha kala saarista. Waxay ka dhigtaa isticmaalka barashada isku dhafan, taas oo ah farsamo isku daraya kalasaarayaal badan si loo xalliyo dhibaatooyinka adag. Habka kaynta random waxa uu ka kooban yahay tiro badan oo geedo go'aan ah. Waxa loo isticmaali karaa in lagu kala saaro codsiyada amaahda, lagu ogaado dhaqanka khiyaanada leh, iyo odoroska cudurrada dillaaca.
7. Jahwareerka Matrix
Matrix jahawareersan waa miis loo isticmaalo in lagu qeexo qaabka kala soocida. Afartan kelmadood ee soo socda ayaa loo isticmaalaa si loo baadho matrixka jaahwareerka:
- Togan Run: Waxa ay muujinaysaa in qaabku saadaaliyay natiijo wanaagsan oo ay sax ahayd.
- Run Negative: Waxay muujinaysaa in tusaaluhu saadaaliyay natiijo xun oo ay sax ahayd.
- Fiican Been ah: Waxay muujinaysaa in moodalku filayey natiijo wanaagsan laakiin runtii waxay ahayd mid taban.
- Negative Been ah: Waxay ka dhigan tahay in moodalku filayey natiijo xun, halka natiijadu ay ahayd mid dhab ah.
Hirgelinta matrixka jaahwareerka:
Faa'iidooyinka
- Waa sahlan tahay in la isticmaalo.
- Xirmada-barashada Scikit waa mid aad laqabsan karo oo faa'iido leh, iyada oo u adeegaysa yoolalka adduunka dhabta ah sida saadaalinta dabeecadda macaamilka, horumarka neerfaha, iyo wixii la mid ah.
- Isticmaalayaasha raba inay ku xidhaan algorithms-ka aaladahooda waxay ka heli doonaan dukumeenti API oo faahfaahsan mareegta Scikit-learn.
- Qorayaal badan, la-hawlgalayaasheeda, iyo beesha caalamka oo dhan oo taageero online ah oo la soco Scikit-wax cusub baro.
Qasaarooyinka
- Ma aha doorashada ugu habboon ee daraasad qoto dheer.
Ugu Dambeyn
Scikit-learn waa xirmo muhiim u ah saynisyahano xog kasta si uu si adag u qabsado iyo xoogaa khibrad ah. Hagahan waa inuu kaa caawiyaa wax-ka-beddelka xogta iyadoo la adeegsanayo sklearn. Waxa jira awoodo kale oo badan oo Scikit-barro oo aad ogaan doonto markaad ku sii socoto kacabashadaada sayniska. La wadaag fikradahaaga faallooyinka.
Leave a Reply