Orodha ya Kanuni Kuu za Kujifunza kwa Mashine kwa Wanaoanza

Orodha ya Yaliyomo[Ficha][Onyesha]

Kwa hivyo, algorithms za Kujifunza kwa Mashine ni nini?
Mafunzo Yanayosimamiwa, Yasiyosimamiwa na Kuimarisha+-
Kanuni Kuu za Kujifunza kwa Mashine+-
Hitimisho

Ulimwengu unabadilika haraka kwa sababu ya akili bandia, na kujifunza kwa mashine, ambayo ina athari kwa kila kipengele cha maisha yetu ya kila siku.

Kuanzia visaidizi vya sauti vinavyotumia NLP na kujifunza kwa mashine ili kuweka miadi, kuangalia matukio kwenye kalenda yetu na kucheza muziki hadi vifaa ambavyo ni sahihi sana hivi kwamba vinaweza kutazamia mahitaji yetu kabla hata hatujazingatia.

Kompyuta zinaweza kucheza chess, kufanya upasuaji, na kukua kuwa mashine nadhifu zaidi, zinazofanana na binadamu kwa usaidizi wa kanuni za kujifunza mashine.

Tuko katika wakati wa maendeleo endelevu ya kiteknolojia, na kwa kuona jinsi kompyuta zimekua kupitia wakati, tunaweza kufanya utabiri kuhusu kitakachotokea katika siku zijazo.

Uwekaji demokrasia wa zana na mbinu za kompyuta ni mojawapo ya vipengele muhimu vya mapinduzi haya ambayo yanajitokeza. Wanasayansi wa data wameunda kompyuta zenye nguvu za kusaga data katika miaka mitano iliyopita kwa kutekeleza bila juhudi mbinu za kisasa. Matokeo yake ni ya kushangaza.

Katika chapisho hili, tutaangalia kwa karibu mashine kujifunza algorithms na tofauti zao zote.

Kwa hivyo, algorithms za Kujifunza kwa Mashine ni nini?

Mbinu inayotumiwa na mfumo wa AI kutekeleza kazi yake—kwa ujumla, kutabiri thamani za pato kutoka kwa data fulani ya ingizo—inajulikana kama kanuni ya kujifunza kwa mashine.

Kanuni ya kujifunza kwa mashine ni mchakato unaotumia data na hutumiwa kuunda miundo ya kujifunza kwa mashine ambayo iko tayari kwa uzalishaji. Ikiwa kujifunza kwa mashine ndio treni inayofanya kazi, basi kanuni za ujifunzaji kwa mashine ndizo treni zinazosogeza kazi.

Mbinu bora ya kutumia mashine ya kujifunza itabainishwa na tatizo la biashara unalojaribu kushughulikia, aina ya mkusanyiko wa data unaotumia na rasilimali ulizo nazo.

Kanuni za kujifunza mashine ni zile zinazogeuza seti ya data kuwa modeli. Kulingana na aina ya tatizo unalojaribu kujibu, nguvu ya uchakataji inayopatikana, na aina ya data uliyonayo, algoriti za kujifunza zinazosimamiwa, zisizosimamiwa, au za kuimarisha zinaweza kufanya kazi vizuri.

Kwa hiyo, tulizungumza juu ya kujifunza kusimamiwa, kutosimamiwa, na kuimarisha, lakini ni nini? Hebu tuzichunguze.

Mafunzo Yanayosimamiwa, Yasiyosimamiwa na Kuimarisha

Kujifunza kwa Usimamiaji

Katika ujifunzaji unaosimamiwa, muundo wa AI hutengenezwa kulingana na ingizo ambalo limetolewa na lebo inayowakilisha matokeo yaliyotabiriwa. Kulingana na pembejeo na matokeo, modeli hutengeneza mlinganyo wa ramani, na kwa kutumia mlingano huo wa ramani, hutabiri lebo ya ingizo katika siku zijazo.

Hebu sema tunahitaji kuunda mfano ambao unaweza kutofautisha kati ya mbwa na paka. Picha nyingi za paka na mbwa huingizwa kwenye modeli na lebo zinazoonyesha kama ni paka au mbwa ili kutoa mafunzo kwa wanamitindo.

Muundo huu unatafuta kuweka mlinganyo unaohusiana na lebo kwenye picha za kuingiza picha hizo. Hata kama mfano haujawahi kuona picha hapo awali, baada ya mafunzo, inaweza kutambua ikiwa ni ya paka au mbwa.

Kujifunza kisichohifadhiwa

Kujifunza bila kusimamiwa kunahusisha kutoa mafunzo kwa kielelezo cha AI kwenye pembejeo tu bila kuziwekea lebo. Muundo hugawanya data ya ingizo katika vikundi vilivyo na sifa zinazohusiana.

Lebo ya baadaye ya ingizo basi hutabiriwa kulingana na jinsi sifa zake zinavyolingana na mojawapo ya uainishaji. Fikiria hali ambapo ni lazima kugawanya kundi la mipira nyekundu na bluu katika makundi mawili.

Wacha tufikirie kuwa sifa zingine za mipira ni sawa, isipokuwa rangi. Kwa msingi wa jinsi inavyoweza kugawanya mipira katika madarasa mawili, mfano hutafuta sifa ambazo ni tofauti kati ya mipira.

Vikundi viwili vya mipira-moja ya bluu na nyekundu-hutolewa wakati mipira imegawanywa katika makundi mawili kulingana na hue yao.

Kuimarisha Kujifunza

Katika ujifunzaji wa kuimarisha, mtindo wa AI unatafuta kuongeza faida ya jumla kwa kutenda kama inavyoweza katika hali fulani. Maoni kuhusu matokeo yake ya awali husaidia modeli kujifunza.

Fikiria kuhusu hali wakati roboti inapoelekezwa kuchagua njia kati ya pointi A na B. Roboti kwanza huchagua mojawapo ya kozi kwa sababu haina matumizi ya awali.

Roboti hupokea pembejeo kwenye njia inayochukua na kupata maarifa kutoka kwayo. Roboti inaweza kutumia ingizo ili kurekebisha suala wakati mwingine inapokumbana na hali sawa.

Kwa mfano, roboti ikichagua chaguo B na kupokea zawadi, kama vile maoni chanya, wakati huu inaelewa kuwa ni lazima ichague njia B ili kuongeza zawadi yake.

Sasa hatimaye kile ambacho nyote mnangojea, ni algorithms.

Kanuni Kuu za Kujifunza kwa Mashine

1. Urejeshaji wa Mstari

Mbinu rahisi zaidi ya kujifunza kwa mashine ambayo inapotoka kutoka kwa ujifunzaji unaosimamiwa ni urejeshaji wa mstari. Pamoja na maarifa kutoka kwa anuwai huru, hutumiwa zaidi kutatua maswala ya rejista na kuunda utabiri juu ya anuwai tegemezi.

Kupata safu ya kufaa zaidi, ambayo inaweza kusaidia katika kutabiri matokeo ya vigeuzo tegemezi vinavyoendelea, ni lengo la urekebishaji wa mstari. Bei za nyumba, umri, na mishahara ni baadhi ya mifano ya maadili yanayoendelea.

linear regression

Muundo unaojulikana kama urejeshaji rahisi wa mstari hutumia mstari ulionyooka kukokotoa uhusiano kati ya kigezo kimoja huru na kigeu kimoja tegemezi. Kuna zaidi ya vigeu viwili huru katika urejeshaji wa mstari mwingi.

Mfano wa rejista ya mstari una mawazo manne ya msingi:

Linearity: Kuna muunganisho wa mstari kati ya X na maana ya Y.
Homoscedasticity: Kwa kila thamani ya X, tofauti iliyobaki ni sawa.
Kujitegemea: Uchunguzi ni huru kutoka kwa kila mmoja kwa suala la uhuru.
Kawaida: Wakati X imerekebishwa, Y kawaida husambazwa.

Urejeshaji wa mstari hufanya kazi vyema kwa data inayoweza kutengwa kwa mistari. Inaweza kudhibiti uwekaji kupita kiasi kwa kutumia urekebishaji, uthibitishaji mtambuka na mbinu za kupunguza ukubwa. Hata hivyo, kuna matukio ambapo uhandisi wa kina wa vipengele unahitajika, ambao mara kwa mara unaweza kusababisha kufifia kupita kiasi na kelele.

2. Urekebishaji wa vifaa

Urejeshaji wa kumbukumbu ni mbinu nyingine ya kujifunza kwa mashine ambayo huachana na ujifunzaji unaosimamiwa. Matumizi yake kuu ni uainishaji, wakati inaweza pia kutumika kwa shida za rejista.

Urejeshaji wa kumbukumbu hutumika kutabiri kigezo tegemezi cha kategoria kwa kutumia maelezo kutoka kwa vipengele huru. Lengo ni kuainisha matokeo, ambayo yanaweza tu kuwa kati ya 0 na 1.

Udhibiti wa vifaa

Jumla ya vipengee vilivyopimwa huchakatwa na chaguo za kukokotoa za sigmoid, chaguo la kukokotoa ambalo hubadilisha thamani kati ya 0 na 1.

Msingi wa urejeshaji wa vifaa ni makadirio ya uwezekano wa juu zaidi, mbinu ya kukokotoa vigezo vya usambazaji unaodhaniwa wa uwezekano kutokana na data maalum iliyozingatiwa.

3. Mti wa Uamuzi

Njia nyingine ya kujifunza kwa mashine ambayo hutengana na ujifunzaji unaosimamiwa ni mti wa uamuzi. Kwa masuala yote mawili ya uainishaji na urekebishaji, mbinu ya mti wa uamuzi inaweza kutumika.

Zana hii ya kufanya maamuzi, ambayo inafanana na mti, hutumia viwakilishi vinavyoonekana ili kuonyesha matokeo tarajiwa ya vitendo, gharama na athari zake. Kwa kugawanya data katika sehemu tofauti, wazo ni sawa na akili ya mwanadamu.

Mti wa Uamuzi

Data imegawanywa katika sehemu tofauti kadiri tunavyoweza kuichanganua. Lengo kuu la Mti wa Uamuzi ni kujenga modeli ya mafunzo ambayo inaweza kutumika kutabiri darasa la kigezo cha lengo. Thamani zinazokosekana zinaweza kushughulikiwa kiotomatiki kwa kutumia Mti wa Uamuzi.

Hakuna sharti la usimbaji wa risasi moja, vigeu vya dummy, au hatua zingine za utayarishaji wa data. Ni ngumu kwa maana kwamba ni ngumu kuongeza data mpya kwake. Ikiwa utapata data ya ziada iliyo na lebo, unapaswa kufundisha tena mti kwenye hifadhidata nzima.

Kwa hivyo, miti ya uamuzi ni chaguo mbaya kwa programu yoyote inayohitaji mabadiliko ya mtindo wa nguvu.

Kulingana na aina ya utofauti unaolengwa, miti ya uamuzi imegawanywa katika aina mbili:

Kigezo cha Kitengo: Mti wa Uamuzi ambao utofauti wa lengo ni wa Kitengo.
Kigezo Kinachoendelea: Mti wa Uamuzi ambao utofauti wa lengo ni Unaoendelea.

4. Msitu wa nasibu

Mbinu ya Msitu Nasibu ndiyo mbinu inayofuata ya kujifunza kwa mashine na ni kanuni ya ujifunzaji ya mashine inayosimamiwa inayotumiwa sana katika masuala ya uainishaji na urekebishaji. Pia ni njia ya msingi ya mti, sawa na mti wa uamuzi.

Msitu wa miti, au miti mingi ya maamuzi, hutumiwa na mbinu ya msitu bila mpangilio kufanya maamuzi. Wakati wa kushughulikia kazi za uainishaji, mbinu ya msitu nasibu ilitumia vigeu vya kategoria huku ikishughulikia kazi za urekebishaji na seti za data ambazo zina viwezo vinavyoendelea.

Msitu wa nasibu

Mkusanyiko, au uchanganyaji wa miundo mingi, ndivyo mbinu ya msitu wa nasibu hufanya, ambayo ina maana kwamba utabiri hufanywa kwa kutumia kundi la modeli badala ya moja tu.

Uwezo wa kutumika kwa matatizo ya uainishaji na urekebishaji, ambayo hujumuisha mifumo mingi ya kisasa ya kujifunza mashine, ni faida kuu ya msitu wa nasibu.

Mikakati miwili tofauti hutumiwa na Ensemble:

Bagging: Kwa kufanya hivi, data zaidi hutolewa kwa hifadhidata ya mafunzo. Ili kupunguza tofauti katika utabiri, hii inafanywa.
Kukuza ni mchakato wa kuchanganya wanafunzi dhaifu na wanaojifunza wenye nguvu kwa kujenga modeli zinazofuatana, na kusababisha modeli ya mwisho yenye usahihi wa hali ya juu.

5. Naive Bayes

Suala la binary (daraja mbili) na uainishaji wa tabaka nyingi linaweza kutatuliwa kwa kutumia mbinu ya Naive Bayes. Njia inapofafanuliwa kwa kutumia nambari za pembejeo za binary au kategoria, ni rahisi kufahamu. Wazo lililotolewa na mwanafunzi wa darasa la Naive Bayes ni kwamba uwepo wa kipengele kimoja kwenye darasa hauhusiani na uwepo wa sifa zingine zozote.

Naïve Bayes

Fomula hapo juu inaonyesha:

P(H): Uwezekano kwamba hypothesis H ni sahihi. Uwezekano wa hapo awali unajulikana kama hii.
P (E): Uwezekano wa ushahidi
P(E|H): Uwezekano kwamba dhana hiyo inaungwa mkono na ushahidi.
P(H|E): Uwezekano kwamba dhana hiyo ni ya kweli, kutokana na ushahidi.

Kiainishi cha Naive Bayes kitazingatia kila moja ya sifa hizi kibinafsi wakati wa kuamua uwezekano wa matokeo fulani, hata kama sifa hizi zimeunganishwa. Mfano wa Naive Bayesian ni rahisi kuunda na kufaa kwa hifadhidata kubwa.

Inajulikana kufanya vizuri zaidi kuliko hata mbinu changamano za uainishaji huku ikiwa ya msingi. Ni mkusanyiko wa algoriti ambazo zote zinatokana na Nadharia ya Bayes, badala ya mbinu moja.

6. K-Majirani wa Karibu

Mbinu ya majirani wa K-karibu (kNN) ni kitengo kidogo cha kujifunza kwa mashine inayosimamiwa ambayo inaweza kutumika kushughulikia masuala ya uainishaji na urejeshaji. Algorithm ya KNN inadhania kuwa vitu vinavyoweza kulinganishwa vinaweza kupatikana karibu.

Ninakumbuka kama mkusanyiko wa watu wenye nia moja. kNN inanufaika na wazo la mfanano kati ya vidokezo vingine vya data kwa kutumia ukaribu, ukaribu au umbali. Ili kuweka lebo kwenye data isiyoonekana kulingana na alama za data zinazoweza kuonekana zilizo karibu zaidi, mbinu ya hisabati hutumiwa kubainisha utengano kati ya pointi kwenye grafu.

K Majirani wa Karibu

Lazima utambue umbali kati ya pointi za data ili kutambua maeneo ya karibu ya kulinganishwa. Vipimo vya umbali kama vile umbali wa Euclidean, umbali wa Hamming, umbali wa Manhattan, na umbali wa Minkowski vinaweza kutumika kwa hili. K inajulikana kama nambari ya jirani iliyo karibu zaidi, na mara nyingi ni nambari isiyo ya kawaida.

KNN inaweza kutumika kwa matatizo ya uainishaji na urekebishaji. Ubashiri unaofanywa wakati KNN inatumiwa kwa masuala ya urejeshaji unategemea wastani au wastani wa matukio ya K yanayofanana zaidi.

Matokeo ya algoriti ya uainishaji kulingana na KNN inaweza kubainishwa kama darasa lenye masafa ya juu zaidi kati ya matukio ya K yanayofanana zaidi. Kila tukio kimsingi hupiga kura kwa tabaka lao, na utabiri ni wa tabaka ambalo hupokea kura nyingi zaidi.

7. K-njia

Ni mbinu ya kujifunza bila kusimamiwa ambayo hushughulikia masuala ya nguzo. Seti za data zimegawanywa katika idadi fulani ya vikundi-pigie tufanye K-kwa njia ambayo vidokezo vya data vya kila kikundi ni sawa na tofauti na zile zilizo katika vikundi vingine.

K ina maana 1

K-njia mbinu ya nguzo:

Kwa kila nguzo, algoriti ya K-njia huchagua k centroids, au pointi.
Na sentirodi zilizo karibu au nguzo za K, kila sehemu ya data huunda nguzo.
Sasa, centroids mpya hutolewa kulingana na washiriki wa nguzo tayari waliopo.
Umbali wa karibu zaidi kwa kila nukta ya data hukokotolewa kwa kutumia vipenyo hivi vilivyosasishwa. Hadi centroids hazibadilika, mchakato huu unarudiwa.

Ni wepesi zaidi, wa kutegemewa zaidi, na rahisi kuelewa. Ikiwa kuna matatizo, uwezo wa k-means' kubadilika hufanya marekebisho kuwa rahisi. Wakati hifadhidata ni tofauti au zimetengwa vyema kutoka kwa nyingine, matokeo ni bora zaidi. Haiwezi kudhibiti data potofu au wauzaji nje.

8. Mashine za Vector za Kusaidia

Unapotumia mbinu ya SVM kuainisha data, data mbichi huonyeshwa kama nukta katika nafasi ya n-dimensional (ambapo n ni idadi ya vipengele ulivyo navyo). Data basi inaweza kuainishwa kwa urahisi kwa sababu thamani ya kila kipengele huunganishwa kwa kuratibu mahususi.

Ili kutenganisha data na kuiweka kwenye grafu, tumia mistari inayojulikana kama viainishaji. Mbinu hii hupanga kila nukta ya data kama sehemu katika nafasi ya n-dimensional, ambapo n ni idadi ya vipengele ulivyo navyo na thamani ya kila kipengele ni thamani maalum ya kuratibu.

Msaada wa mashine ya Vector

Sasa tutapata mstari unaogawanya data katika seti mbili za data ambazo zimeainishwa tofauti. Umbali kutoka kwa alama za karibu zaidi katika kila moja ya vikundi viwili utakuwa wa mbali zaidi kwenye mstari huu.

Kwa kuwa pointi mbili za karibu zaidi ni zile ambazo ziko mbali zaidi na mstari katika mfano hapo juu, mstari unaogawanya data katika makundi mawili ambayo yaliwekwa tofauti ni mstari wa kati. Kiainishaji chetu ni mstari huu.

9. Kupunguza Dimensionality

Kwa kutumia mbinu ya kupunguza vipimo, data ya mafunzo inaweza kuwa na viambajengo vichache vya ingizo. Kwa maneno rahisi, inarejelea mchakato wa kupunguza ukubwa wa seti ya kipengele chako. Wacha tufikirie hifadhidata yako ina safu wima 100; kupunguzwa kwa vipimo kutapunguza kiasi hicho hadi safu wima 20.

Kupunguza Vipimo

Muundo huo hukua kiotomatiki kuwa wa kisasa zaidi na una hatari kubwa ya kutoshea kupita kiasi kadiri idadi ya vipengele inavyoongezeka. Tatizo kubwa zaidi la kufanya kazi na data katika vipimo vikubwa zaidi ni kile kinachojulikana kama "laana ya ukubwa," ambayo hutokea wakati data yako ina idadi kubwa ya sifa.

Vipengele vifuatavyo vinaweza kutumika kukamilisha upunguzaji wa vipimo:

Ili kupata na kuchagua sifa zinazofaa, uteuzi wa vipengele hutumiwa.
Kwa kutumia vipengele vilivyopo tayari, kipengele cha uhandisi huunda vipengele vipya mwenyewe.

Hitimisho

Kujifunza kwa mashine bila kusimamiwa au kusimamiwa kunawezekana. Chagua mafunzo yanayosimamiwa ikiwa data yako si nyingi na imetambulishwa vyema kwa ajili ya mafunzo.

Seti kubwa za data mara nyingi zingefanya kazi na kutoa matokeo bora kwa kutumia ujifunzaji usiosimamiwa. Kujifunza kwa kina njia ni bora ikiwa una mkusanyiko mkubwa wa data ambao unapatikana kwa urahisi.

Kuimarisha ujifunzaji na ujifunzaji wa kina wa kuimarisha ni baadhi ya mada ulizosoma. Sifa, matumizi na vikwazo vya mitandao ya Neural sasa ni wazi kwako. Mwisho kabisa, ulizingatia chaguo za lugha tofauti za programu, IDE, na majukwaa linapokuja suala la kuunda yako mwenyewe. mifano ya kujifunza mashine.

Kitu kinachofuata unachohitaji kufanya ni kuanza kusoma na kutumia kila moja mashine kujifunza mbinu. Hata kama somo ni pana, mada yoyote inaweza kueleweka kwa saa chache ikiwa utazingatia kina chake. Kila somo linasimama peke yake kutoka kwa wengine.

Lazima ufikirie kuhusu suala moja kwa wakati mmoja, ulisome, uliweke katika vitendo, na utumie lugha unayochagua kutekeleza algorithm(za) ndani yake.

Orodha ya Kanuni Kuu za Kujifunza kwa Mashine kwa Wanaoanza

Kwa hivyo, algorithms za Kujifunza kwa Mashine ni nini?