Teburin Abubuwan Ciki[Boye][Nuna]
Idan ku masu shirye-shiryen Python ne ko kuma idan kuna neman kayan aikin kayan aiki mai ƙarfi don amfani da su don gabatar da koyan injin a cikin tsarin samarwa, Scikit-learn ɗakin karatu ne wanda kuke buƙatar bincika.
Scikit-learn yana da ingantaccen rubuce-rubuce kuma mai sauƙin amfani, ko kun kasance sababbi ga koyon injin, kuna son tashi da gudu cikin sauri, ko kuna son amfani da kayan aikin bincike na ML na zamani.
Yana ba ku damar gina ƙirar bayanan tsinkaya a cikin ƴan layukan lamba kawai sannan kuyi amfani da wannan ƙirar don dacewa da bayananku azaman babban ɗakin karatu. Yana da sassauƙa kuma yana aiki da kyau tare da sauran Dakunan karatu na Python kamar Matplotlib don zane-zane, NumPy don tsararruwar haɓakawa, da pandas don ganin bayanai.
A cikin wannan jagorar, zaku gano duk abin da yake, yadda zaku iya amfani da shi, tare da fa'idodi da rashin amfaninsa.
Mene ne Scikit-koya?
Scikit-learn (wanda kuma aka sani da sklearn) yana ba da nau'ikan ƙididdiga daban-daban da koyan inji. Ba kamar yawancin kayayyaki ba, sklearn yana haɓakawa a cikin Python maimakon C. Duk da an haɓaka shi a Python, an danganta ingancin sklearn ga amfani da NumPy don babban aiki na layi na algebra da ayyukan tsararru.
An ƙirƙiri Scikit-Learn a matsayin wani ɓangare na aikin Google na Summer of Code kuma tun daga lokacin ya sanya rayuwar miliyoyin masana kimiyyar bayanai na Python-centric a duk faɗin duniya mafi sauƙi. Wannan sashe na jerin yana mai da hankali kan gabatar da ɗakin karatu da kuma mai da hankali kan kashi ɗaya - sauye-sauyen tsarin bayanai, waɗanda maɓalli ne kuma muhimmin matakin da za a ɗauka kafin haɓaka ƙirar tsinkaya.
Laburaren ya dogara ne akan SciPy (Scientific Python), wanda dole ne a sanya shi kafin ku iya amfani da scikit-learn. Wannan tarin ya ƙunshi abubuwa masu zuwa:
- NumPy: Python daidaitaccen kunshin n-dimensional array
- SciPy: Kunshin ne na asali don lissafin kimiyya
- Pandas: Tsarin bayanai da bincike
- Matplotlib: Laburaren makirci ne mai ƙarfi na 2D/3D
- Sympy: Lissafi na alamomi
- IPython: Ingantaccen na'ura mai kwakwalwa
Aikace-aikace na ɗakin karatu na Scikit
Scikit-learn shine buɗaɗɗen tushen Python kunshin tare da nagartaccen bincike na bayanai da fasalulluka na ma'adinai. Ya zo tare da ɗimbin ginannun algorithms don taimaka muku samun mafi kyawun ayyukan kimiyyar bayanan ku. Ana amfani da ɗakin karatu na Scikit ta hanyoyi masu zuwa.
1. Komawa
Binciken koma baya wata dabara ce ta ƙididdiga don nazari da fahimtar haɗin tsakanin masu canji biyu ko fiye. Hanyar da aka yi amfani da ita don yin nazarin koma baya na taimakawa wajen tantance abubuwan da suka dace, waɗanda za a iya watsi da su, da kuma yadda suke hulɗa. Za a iya amfani da fasahohin koma baya, alal misali, don ƙarin fahimtar halin farashin hannun jari.
Algorithms na koma baya sun haɗa da:
- Ƙirgar komawa da baya
- Ridge Regression
- Rushewar Lasso
- Komawar Bishiyar Yankewa
- Random daji
- Goyan bayan Injinan Vector (SVM)
2. Rabawa
Hanyar Rarraba hanya ce ta Kulawa ta ilmantarwa wacce ke amfani da bayanan horo don gano nau'in sabbin abubuwan lura. Algorithm a cikin Rarraba yana koya daga abin da aka bayar bayanai ko lura sannan kuma ya rarraba ƙarin abubuwan lura zuwa ɗaya daga cikin ajujuwa da yawa ko ƙungiyoyi. Ana iya amfani da su, alal misali, don rarraba sadarwar imel azaman spam ko a'a.
Algorithms rarrabuwa sun haɗa da:
- Juyin Juya Harkar
- K-Masu Maƙwabta
- Tallafa Kayan Injin
- Yanke hukunci
- Random daji
3. Tari
Ana amfani da algorithms na tari a cikin Scikit-learn don tsara bayanai ta atomatik tare da kaddarorin makamantan su cikin saiti. Tari shine tsari na haɗa tarin abubuwa ta yadda waɗanda suke rukuni ɗaya suka fi kama da na sauran ƙungiyoyi. Bayanan abokin ciniki, alal misali, ƙila za a iya raba su dangane da wurinsu.
Algorithms na tari sun haɗa da:
- DB-SCAN
- K-Ma'ana
- Mini-Batch K-Ma'ana
- Rukunin Spectral
4. Zaɓin Samfurin
Algorithms na zaɓin samfuri suna ba da hanyoyi don kwatantawa, ingantawa, da zaɓar mafi kyawun sigogi da ƙira don amfani a cikin shirye-shiryen kimiyyar bayanai. Idan aka ba da bayanai, zaɓin ƙirar shine matsalar ɗaukar ƙirar ƙididdiga daga ƙungiyar ƙirar ɗan takara. A cikin yanayi mafi mahimmanci, ana yin la'akari da tarin bayanan da aka rigaya. Koyaya, aikin na iya haɗawa da ƙirar gwaje-gwaje don bayanan da aka samu sun dace da matsalar zaɓin ƙirar.
Samfuran zaɓin samfura waɗanda zasu iya inganta daidaito ta hanyar daidaita sigogi sun haɗa da:
- Tabbatarwa ta giciye
- Binciken Grid
- Matakan ƙira
5. Rage Girman Girma
Canja wurin bayanai daga sararin sararin samaniya mai girma zuwa ƙananan sararin samaniya ta yadda ƙaramin girman wakilci ya adana wasu muhimman al'amura na ainihin bayanan, wanda ke kusa da girmansa, an san shi da rage girman girma. Ana rage adadin masu canjin bazuwar don bincike lokacin da aka rage girman girma. Bayanan da aka fitar, alal misali, ƙila ba za a yi la'akari da su don inganta haɓakar abubuwan gani ba.
Rage girman girman algorithm ya haɗa da masu zuwa:
- Zaɓin fasalin
- Babban Bankin Bincike (PCA)
Shigar da Scikit-koyi
Ana buƙatar shigar da NumPy, SciPy, Matplotlib, IPython, Sympy, da Pandas kafin amfani da Scikit-learn. Bari mu shigar da su ta amfani da pip daga na'ura wasan bidiyo (yana aiki don Windows kawai).
Bari mu shigar da Scikit-koyi yanzu da mun shigar da ɗakunan karatu da ake buƙata.
Features
Scikit-learn, wani lokaci ana kiransa sklearn, kayan aiki ne na Python don aiwatar da ƙirar koyan inji da ƙirar ƙididdiga. Za mu iya amfani da shi don ƙirƙirar nau'ikan koyan injuna da yawa don koma baya, rarrabuwa, da tari, da kuma kayan aikin ƙididdiga don tantance waɗannan samfuran. Hakanan ya haɗa da rage girman girma, zaɓin fasalin, haɓaka fasalin, hanyoyin tattarawa, da ginanniyar bayanan bayanai. Za mu bincika kowane ɗayan waɗannan halayen ɗaya bayan ɗaya.
1. Shigo da Datasets
Scikit-learn ya haɗa da adadin bayanan da aka riga aka gina, kamar iris dataset, bayanan farashin gida, bayanan titanic, da sauransu. Babban fa'idodin waɗannan bayanan bayanan shine cewa suna da sauƙin fahimta kuma ana iya amfani da su don haɓaka ƙirar ML nan da nan. Waɗannan bayanan bayanan sun dace da novice. Hakazalika, zaku iya amfani da sklearn don shigo da ƙarin saitin bayanai. Hakazalika, zaku iya amfani da shi don shigo da ƙarin saitin bayanai.
2. Rarraba Dataset don Horo da Gwaji
Sklearn ya haɗa da ikon rarraba bayanan zuwa sassan horo da gwaji. Ana buƙatar raba saitin bayanai don ƙima mara son kai na aikin hasashen. Muna iya fayyace adadin bayanan mu ya kamata a haɗa a cikin jirgin ƙasa da na'urorin gwaji. Mun raba bayanan ta amfani da tsaga gwajin jirgin kasa wanda saitin jirgin ya ƙunshi kashi 80% na bayanan kuma tsarin gwajin yana da kashi 20%. Za a iya raba ma'aunin bayanan kamar haka:
3. Juyin Juya Hali
Juyin layi na layi dabara ce ta ilmantarwa na tushen koyo. Yana aiwatar da aikin koma baya. Dangane da sauye-sauye masu zaman kansu, sake fasalin ƙimar hasashen manufa. Ana amfani da shi galibi don tantance alaƙa tsakanin masu canji da tsinkaya. Samfuran koma baya daban-daban sun bambanta dangane da nau'in haɗin da suke kimantawa tsakanin masu dogaro da masu zaman kansu, da kuma adadin masu canji masu zaman kansu da ake amfani da su. Za mu iya ƙirƙira ƙirar Regression kawai ta hanyar amfani da sklearn kamar haka:
4. Komawar Hankali
Hanyar rarrabuwa gama gari ita ce koma bayan dabaru. Yana cikin iyali guda da koma bayan al'amuran da suka shafi yawan jama'a da na layi kuma yana cikin dangin mizani. Abubuwan da aka gano na koma bayan dabaru suna da sauƙin fahimta kuma suna da sauri don ƙididdigewa. Hakazalika da koma bayan layi, jujjuyawar dabaru hanya ce ta jujjuyawar da ake kulawa. Madaidaicin abin da aka fitar ya kasu kashi-kashi, don haka shine kawai bambanci. Yana iya ƙayyade ko majiyyaci yana da cututtukan zuciya ko a'a.
Ana iya magance batutuwan rarrabuwa iri-iri, kamar gano spam, ta amfani da koma bayan dabaru. Hasashen cutar ciwon sukari, tantance idan mabukaci zai sayi takamaiman samfuri ko ya canza zuwa abokin hamayya, tantance ko mai amfani zai danna hanyar haɗin talla, da sauran al'amuran da yawa kaɗan ne kawai misalai.
5. Bishiyar yanke hukunci
Mafi ƙarfi kuma mafi yawan amfani da rarrabuwa da dabarun tsinkaya shine itacen yanke shawara. Bishiyar yanke shawara ita ce tsarin bishiyar da take kama da taswirar ruwa, tare da kowane kumburi na ciki yana wakiltar gwaji akan sifa, kowane reshe yana wakiltar ƙarshen gwajin, kuma kowane kumburin ganye (ƙullin ƙarshen) yana riƙe da lakabin aji.
Lokacin da masu dogara ba su da dangantaka ta layi tare da masu canji masu zaman kansu, watau lokacin da juzu'i na layi ba ya samar da daidaitattun binciken, bishiyoyi masu yanke shawara suna da amfani. Ana iya amfani da abin DecisionTreeRegression() ta irin wannan hanya don amfani da bishiyar yanke shawara don komawa baya.
6. Dajin Random
Dajin bazuwar shine a injin inji hanyar magance matsalar koma baya da rarrabuwa. Yana yin amfani da tarin koyo, wanda wata dabara ce wacce ke haɗa nau'ikan nau'ikan nau'ikan nau'ikan don magance matsaloli masu rikitarwa. Hanyar gandun daji bazuwar an yi shi da babban adadin bishiyar yanke shawara. Ana iya amfani da shi don rarraba aikace-aikacen lamuni, gano halaye na yaudara, da hasashen barkewar cututtuka.
7. Rudani Matrix
Matrix ruɗani tebur ne da ake amfani da shi don bayyana aikin ƙirar ƙira. Ana amfani da kalmomi huɗu masu zuwa don bincika matrix ɗin ruɗani:
- Gaskiya Mai Kyau: Yana nuna cewa ƙirar ta yi hasashen sakamako mai kyau kuma daidai ne.
- Gaskiya Negative: Yana nuna cewa samfurin yayi hasashe mummunan sakamako kuma yayi daidai.
- Ƙarya Mai Kyau: Yana nuna cewa ƙirar tana tsammanin sakamako mai kyau amma da gaske mara kyau ne.
- Ƙarya mara kyau: Yana nuna cewa samfurin yana tsammanin sakamako mara kyau, yayin da sakamakon ya kasance tabbatacce.
Aiwatar da matrix ruɗani:
ribobi
- Abu ne mai sauki don amfani.
- Kunshin koyo na Scikit yana da matukar dacewa kuma yana da amfani, yana ba da manufofin duniya na gaske kamar hasashen halayen mabukaci, ci gaban neuroimage, da sauransu.
- Masu amfani waɗanda ke son haɗa algorithms tare da dandamali za su sami cikakkun takaddun API akan gidan yanar gizon Scikit-Learn.
- Marubuta da yawa, masu haɗin gwiwa, da babban tallafi na kan layi na duniya kuma suna ci gaba da koyan Scikit na zamani.
fursunoni
- Ba shine kyakkyawan zaɓi don nazari mai zurfi ba.
Kammalawa
Scikit-learn kunshin ne mai mahimmanci ga kowane masanin kimiyyar bayanai don samun fahimta mai ƙarfi da gogewa da shi. Wannan jagorar ya kamata ya taimaka muku da sarrafa bayanai ta amfani da sklearn. Akwai ƙarin damar Scikit-koyi waɗanda za ku gano yayin da kuke ci gaba ta hanyar kasadar kimiyyar bayanan ku. Raba ra'ayoyin ku a cikin sharhi.
Leave a Reply