Lîsteya Algorîtmayên Fêrbûna Makîneya Mezin ji bo Destpêkeran

Table of Contents[Veşartin][Rêdan]

Ji ber vê yekê, algorîtmayên Fêrbûna Makîneyê çi ne?
Fêrbûna Çavdêrî, Bêçavdêr & Bihêzkirin+- Ji
Algorîtmayên Fêrbûna Makîneya Mezin+- Ji
Xelasî

Ji ber îstîxbarata sûnî, û fêrbûna makîneyê, ku bandorê li her aliyek jiyana me ya rojane dike, cîhan zû diguhere.

Ji arîkarên deng ên ku NLP û fêrbûna makîneyê bikar tînin ji bo veqetandina randevûyan, li bûyeran li salnameya me digerin, û muzîkê dilîzin heya amûrên ku ew qas rast in ku ew dikarin hewcedariyên me pêşbîn bikin berî ku em wan jî bifikirin.

Bi alîkariya algorîtmayên fêrbûna makîneyê, kompîtur dikarin şetrencê bilîzin, emeliyat bikin, û bi aqiltir, makîneyên mîna mirovan pêşve bibin.

Em di demek pêşkeftina teknolojiyê ya domdar de ne, û bi dîtina ka komputer bi demê re çawa pêş ketine, em dikarin pêşbîniyan bikin ka dê di pêşerojê de çi bibe.

Demokratîkirina amûr û rêbazên hesabkirinê yek ji aliyên sereke yên vê şoreşê ye ku derdikeve pêş. Zanyarên daneyê di van pênc salên dawîn de bi pêkanîna metodolojiyên pêşkeftî ve, di van pênc salên dawîn de komputerên bi hêz dane çêkirin. Encam ecêb in.

Di vê postê de, em ê ji nêz ve lê binêrin fêrbûna makîneyê algorîtmayan û hemî guhertoyên wan.

Ji ber vê yekê, algorîtmayên Fêrbûna Makîneyê çi ne?

Nêzîkatiya ku ji hêla pergala AI-ê ve tê bikar anîn da ku peywira xwe pêk bîne - bi gelemperî, pêşbînkirina nirxên derketinê ji daneyên têketinê yên hatî dayîn - wekî algorîtmayek fêrbûna makîneyê tê zanîn.

Algorîtmaya fêrbûna makîneyê pêvajoyek e ku daneyan bikar tîne û ji bo afirandina modelên fêrbûna makîneyê ku ji bo hilberînê amade ne tê bikar anîn. Ger fêrbûna makîneyê trêna ku karekî pêk tîne ye, wê hingê algorîtmayên fêrbûna makîneyê lokomotîf in ku xebatê bi rê ve dimeşînin.

Nêzîkatiya fêrbûna makîneyê ya çêtirîn a ku hûn bikar bînin dê ji hêla pirsgirêka karsaziya ku hûn hewl didin çareser bikin, celebê databasa ku hûn bikar tînin û çavkaniyên ku we hene ve were destnîşankirin.

Algorîtmayên fêrbûna makîneyê ew in ku komek daneyê vediguherînin modelek. Li gorî celebê pirsgirêka ku hûn hewl didin bersivê bidin, hêza pêvajoyê ya berdest, û celebê daneya ku we heye, algorîtmayên fêrbûna çavdêrî, neçavdêrî an bihêzkirin dikarin baş bimeşînin.

Ji ber vê yekê, me li ser fêrbûna çavdêrîkirî, bêserûber û bihêzkirinê peyivî, lê ew çi ne? Ka em wan bikolin.

Fêrbûna Çavdêrî, Bêçavdêr & Bihêzkirin

Fêrbûna Çavdêr

Di fêrbûna çavdêrîkirî de, modela AI-ê li ser bingeha têketina ku hatî peyda kirin û etîketa ku encama pêşbînîkirî temsîl dike tê pêşve xistin. Li ser bingeha ketin û derkanan, model hevkêşeyek nexşeyê pêşdixe, û bi karanîna wê hevkêşana nexşeyê, ew etîketa dahatan di pêşerojê de pêşbîn dike.

Em bibêjin ku divê em modelek çêbikin ku bikaribe kûçik û pisîkê ji hev cuda bike. Gelek wêneyên pisîk û kûçikan bi etîketên ku destnîşan dikin ka ew pisîk in an kûçik in, di modelê de têne danîn da ku modelê perwerde bikin.

Model hewl dide ku hevkêşiyek saz bike ku etîketên li ser wêneyên têketinê bi wan wêneyan re têkildar dike. Her çend modelê berê wêneyek nedîtibe jî, piştî perwerdehiyê, ew dikare nas bike ka ew pisîk e an kûçik e.

Fêrbûna Bêserûber

Fêrbûna bêserûber tenê li ser danûstendinan perwerdekirina modelek AI-ê digire bêyî ku wan nîşan bide. Model daneyên têketinê li komên bi taybetmendiyên têkildar dabeş dike.

Dûv re etîketa paşerojê ya têketinê li gorî ku taybetmendiyên wê ji nêz ve bi yek ji senifandinan re hevûdu dikin tê pêşbînîkirin. Rewşa ku divê em komek topên sor û şîn di du kategoriyan de dabeş bikin bifikirin.

Ka em bihesibînin ku taybetmendiyên din ên topan yek in, ji bilî reng. Li ser bingeha ku meriv çawa dikare topan li du çînan dabeş bike, model li taybetmendiyên ku di navbera topan de cûda ne digere.

Dema ku top li ser bingeha rengê xwe li du koman têne dabeş kirin, du komên topan -yek şîn û yek sor- têne hilberandin.

Fêrbûna Hêzkirinê

Di fêrbûna bihêzkirinê de, modela AI-ê hewl dide ku bi tevlêbûnê û her weha ku di rewşek taybetî de dikare qezenca giştî zêde bike. Bersivdan li ser encamên wê yên berê dibe alîkar ku model fêr bibe.

Li ser senaryoyê bifikirin dema ku robotek tê ferman kirin ku rêyek di navbera xalên A û B de hilbijêrin. Robot pêşî yek ji qursan hildibijêre ji ber ku ezmûna wî ya berê tune.

Robot li ser riya ku dimeşe têgihîştinê distîne û jê zanînê distîne. Robot dikare têketinê bikar bîne da ku gava din ku ew bi rewşek wekhev re rû bi rû bimîne pirsgirêkê çareser bike.

Mînakî, heke robot vebijarka B hildibijêre û xelatek werdigire, wek bertekên erênî, ew vê carê fam dike ku divê ew riya B hilbijêrin da ku xelata xwe zêde bike.

Naha di dawiyê de ya ku hûn hemî li bendê ne, algorîtma ne.

Algorîtmayên Fêrbûna Makîneya Mezin

1. Rêjeya Rêjeyî

Nêzîkatiya fêrbûna makîneyê ya herî hêsan a ku ji fêrbûna çavdêrîkirî vediqete regresyona xêz e. Bi zanîna ji guhêrbarên serbixwe, ew bi piranî ji bo çareserkirina pirsgirêkên paşveçûnê û çêkirina pêşbîniyên li ser guhêrbarên girêdayî domdar tê bikar anîn.

Dîtina rêza herî baş, ku dikare di pêşbînkirina encamê de ji bo guhêrbarên girêdayî domdar arîkar bike, armanca paşvekêşana xêzkirî ye. Bihayên xaniyan, temen û mûçe çend mînakên nirxên domdar in.

Regression Linear

Modelek ku wekî paşvekêşana xêzikî ya hêsan tê zanîn xêzek rast bikar tîne da ku têkiliya di navbera guhêrbarek serbixwe û guhêrbarek girêdayî de hesab bike. Zêdetirî du guhêrbarên serbixwe di regresîyona piralî ya xêzikî de hene.

Modela regresyonê ya xêzkirî çar texmînên bingehîn hene:

Linearity: Di navbera X û navgîniya Y de têkiliyek xêzek heye.
Homoscedasticity: Ji bo her nirxa X-ê, cihêrengiya mayî yek e.
Serxwebûn: Çavdêr di warê serxwebûnê de ji hev serbixwe ne.
Normalî: Dema ku X sabît e, Y bi gelemperî tê belav kirin.

Regresyona xêzkirî ji bo daneyên ku dikarin bi rêzan ve werin veqetandin bi heybet pêk tê. Ew dikare bi karanîna teknolojiyên rêkûpêkkirin, pejirandîkirina xaçerê, û kêmkirina dimensîyonê zêde guncan kontrol bike. Lêbelê, rewş hene ku endezyariya taybetmendiya berfireh hewce dike, ku carinan dibe sedema zêdebûn û deng.

2. Regression Lojîstîk

Regresyona lojîstîkî teknîkek din a fêrbûna makîneyê ye ku ji fêrbûna çavdêrîkirî dûr dikeve. Bikaranîna wê ya sereke dabeşkirin e, di heman demê de ew dikare ji bo pirsgirêkên paşveçûnê jî were bikar anîn.

Regresyona lojîstîkî ji bo pêşbînkirina guhêrbara girêdayî kategorîk bi karanîna agahdariya ji faktorên serbixwe tê bikar anîn. Armanc ev e ku meriv hilberan dabeş bike, ku tenê dikare di navbera 0 û 1-ê de bikeve.

Regression Logistic

Tevahiya giran a têketinê ji hêla fonksiyona sigmoîd ve, fonksiyonek aktîvkirinê ya ku nirxan di navbera 0 û 1-ê de vediguherîne, tê hilberandin.

Bingeha paşvekêşana lojîstîkî texmînkirina îhtîmala herî zêde ye, rêbazek ji bo hesabkirina pîvanên dabeşkirina îhtîmala texmînkirî ya ku daneyên taybetî yên çavdêriyê dide.

3. Dara Biryarê

Rêbazek din a fêrbûna makîneyê ku ji fêrbûna çavdêrîkirî vediqete dara biryarê ye. Hem ji bo pirsgirêkên dabeşkirinê û hem jî ji bo vegerandinê, nêzîkatiya dara biryarê dikare were bikar anîn.

Ev amûra biryargirtinê, ku dişibe darê, nûnertiyên dîtbar bikar tîne da ku encamên paşerojê, lêçûn û bertekên çalakiyan nîşan bide. Bi dabeşkirina daneyan li beşên cuda, raman bi hişê mirovan re wekhev e.

Dara Biryarê

Daneyên bi qasî ku me karîbû wan bişkînin li beşên cûda hatine dabeş kirin. Armanca sereke ya Dara Biryarê avakirina modelek perwerdehiyê ye ku dikare were bikar anîn da ku çîna guhêrbar a armanc pêşbîn bike. Nirxên winda bi karanîna Dara Biryarê bixweber têne rêve kirin.

Ji bo şîfrekirina yek-shot, guhêrbarên dummy, an gavên din ên pêş-dermankirina daneyê hewcedarî tune. Di vê wateyê de hişk e ku dijwar e ku meriv daneyên nû li wê zêde bike. Ger we daneya pêvekirî ya nîşankirî wergirt, divê hûn darê li ser tevahiya databasê ji nû ve perwerde bikin.

Wekî encamek, darên biryarê ji bo her serîlêdana ku guhartina modela dînamîkî hewce dike bijarek belengaz in.

Li ser bingeha celebê guhêrbar a armanc, darên biryarê li du celeb têne dabeş kirin:

Guherbara Kategorî: Dara Biryarê ya ku tê de guherbara armancê Kategorîk e.
Guherbara Berdewam: Dara Biryarê ya ku tê de guherbara armancê Berdewam e.

4. Daristana Random

Rêbaza Daristana Random teknîka fêrbûna makîneyê ya din e û algorîtmayek fêrbûna makîneyê ya çavdêrîkirî ye ku di mijarên dabeşkirin û paşveçûnê de bi berfirehî tê bikar anîn. Ew di heman demê de rêbazek darê ye, mîna dara biryarê.

Daristanek daran, an jî gelek darên biryarê, bi rêbaza daristana rasthatî tê bikar anîn da ku dadbar bikin. Dema ku peywirên dabeşkirinê dimeşîne, rêbaza daristanên rasthatî guhêrbarên kategorîk bikar tîne dema ku peywirên regresyonê bi danûstendinên ku guhêrbarên domdar vedihewîne re mijûl dike.

Random Forest

Ensemble, an tevlihevkirina gelek modelan, ew e ku rêbaza daristana bêserûber dike, ku tê vê wateyê ku pêşbîniyên bi karanîna komek modelan ne tenê yek têne çêkirin.

Qabiliyeta ku meriv hem ji bo pirsgirêkên dabeşkirin û hem jî paşverûbûnê, ku piraniya pergalên fêrbûna makîneya nûjen pêk tîne, were bikar anîn, feydeyek bingehîn a daristana rasthatî ye.

Du stratejiyên cûda ji hêla Ensemble ve têne bikar anîn:

Bagging: Bi kirina vê yekê, ji bo databasa perwerdehiyê bêtir dane têne hilberandin. Ji bo kêmkirina guherîna pêşbîniyan, ev tê kirin.
Pêşveçûn pêvajoyek e ku şagirtên qels bi şagirtên hêzdar re bi avakirina modelên li pey hev ve têne hevber kirin, ku di encamê de modela dawîn bi rastbûna herî zêde pêk tê.

5. Naîv Bayes

Pirsgirêkek dabeşkirina binar (du-çîni) û pir-çîniyî dikare bi teknîka Naive Bayes were çareser kirin. Dema ku rêbaz bi karanîna nirxên têketina binary an kategoriyê tê ravekirin, têgihîştina wê ya herî hêsan e. Texmînek ku ji hêla dabeşkerek Naive Bayes ve hatî çêkirin ev e ku hebûna yek taybetmendiyek di polê de ti bandorek li ser hebûna taybetmendiyên din tune.

Naîv Bayes

Formula jorîn destnîşan dike:

P(H): Îhtîmala ku hîpoteza H rast be. Îhtîmala berê wekî vê tê binavkirin.
P(E): Îhtîmala delîlan
P(E|H): Îhtîmala ku hîpotez bi delîlan were piştgirî kirin.
P(H|E): Îhtîmala ku hîpotez rast be, li gorî delîlan.

Tesnîfkerek Naive Bayes dema ku îhtîmala encamek diyarkirî destnîşan dike, her çend van taybetmendiyan bi hevûdu ve girêdayî bin jî dê her yek ji van taybetmendiyan bi rengek ferdî bihesibîne. Modelek Naive Bayesian ji bo berhevokên mezin têne çêkirin û bi bandor hêsan e.

Tê zanîn ku di dema bingehîn de ji teknîkên kategorîzekirinê yên herî tevlihev jî çêtir pêk tîne. Ew berhevokek algorîtmayan e ku hemî li ser bingeha Teorema Bayes-ê ne, ne yek metodek.

6. K-Nêziktirîn Cîran

Teknolojiya K-Nêzîktirîn Cîran (kNN) komek fêrbûna makîneyê ya çavdêrîkirî ye ku dikare ji bo çareserkirina pirsgirêkên dabeşkirin û paşveçûnê were bikar anîn. Algorîtmaya KNN-ê texmîn dike ku hêmanên berawirdî dikarin li nêzîkê werin dîtin.

Ez wê weke kombûna kesên hemfikir bi bîr tînim. kNN ji ramana wekheviya di navbera xalên daneyên din de bi karanîna nêzîkbûn, nêzîkbûn, an dûrbûnê sûd werdigire. Ji bo ku daneyên nayên dîtin li ser bingeha nuqteyên daneya çavdêrîkirî yên herî nêzik ên nîşankirî nîşan bikin, rêbazek matematîkî tête bikar anîn da ku veqetandina di navbera xalên li ser grafikekê de were destnîşankirin.

K Cîranên Nêzîktirîn

Pêdivî ye ku hûn dûrahiya di navbera nuqteyên daneyê de diyar bikin da ku cîhên berhevkirî yên herî nêzîk nas bikin. Pîvandinên dûrbûnê yên wekî dûrahiya Euclidean, dûrahiya Hamming, dûrahiya Manhattan, û dûrahiya Minkowski dikare ji bo vê were bikar anîn. K wekî jimareya cîranê herî nêzîk tê zanîn, û ew pir caran jimareyek xerîb e.

KNN dikare ji bo pirsgirêkên dabeşkirin û paşveçûnê were sepandin. Pêşbîniya ku tê çêkirin dema ku KNN ji bo pirsgirêkên paşveçûnê tê bikar anîn li ser bingeha navînî an navînî ya bûyerên herî mîna K-yê ye.

Encama algorîtmayek dabeşkirinê ya li ser bingeha KNN-ê dikare wekî çîna bi frekansa herî bilind di nav K-ya bûyerên herî mîna hev de were destnîşankirin. Her mînak bi eslê xwe dengek ji pola xwe re derdixe, û pêşbînî ji çîna ku herî zêde deng distîne ye.

7. K-tê wateya

Ew teknîkek ji bo fêrbûna bêserûber e ku pirsgirêkên kombûnê çareser dike. Komên daneyan li hejmareke diyarkirî ya koman têne dabeş kirin - em jê re dibêjin K - bi vî rengî ku xalên daneya her komê ji yên di komikên din de homojen û cihê ne.

K Wateya 1

K-wateya metodolojiya kombûnê:

Ji bo her komê, algorîtmaya K-means k navend, an xalan hildibijêre.
Bi navendên herî nêzîk an komikên K-yê re, her xala daneyê komekê çêdike.
Naha, sentroîdên nû li gorî endamên komê yên berê hene têne hilberandin.
Dûrahiya herî nêzîk ji bo her xala daneyê bi karanîna van sentroîdên nûvekirî tê hesibandin. Heta ku navend neguherin, ev pêvajo dubare dibe.

Zûtir, pêbawertir û têgihîştina hêsan e. Ger pirsgirêk hebin, adaptasyona k-means verastkirinê hêsan dike. Dema ku daneyên danûstendinê ji hev cûda an baş têne veqetandin, encam çêtirîn in. Ew nekare daneyên nerêkûpêk an derziyan îdare bike.

8. Piştgiriya Vector Machines

Dema ku teknîka SVM-ê ji bo dabeşkirina daneyan bikar tînin, daneyên xav di cîhek n-alî de wekî xal têne xuyang kirin (ku n hejmara taybetmendiyên we hene). Dûv re dane dikarin bi hêsanî werin dabeş kirin ji ber ku nirxa her taybetmendiyê wê hingê bi hevrêzek taybetî ve girêdayî ye.

Ji bo veqetandina daneyan û danîna wan li ser grafikekê, rêzikên ku wekî dabeşker têne zanîn bikar bînin. Ev nêzîkatî her xala daneyê wekî xalek li cîhek n-dimensîyonel nîşan dide, ku n hejmara taybetmendiyên we hene û nirxa her taybetmendiyê nirxek hevrêzek taybetî ye.

Piştgiriya Vector Machine

Naha em ê rêzek bi cih bikin ku daneyan li du komên daneyên ku bi rengek cûda hatine kategorîzekirin dabeş dike. Dûrahiya ji xalên herî nêzîk di her du koman de dê li ser vê xetê ji hev dûrtirîn be.

Ji ber ku du xalên herî nêzîk ew in ku ji rêza di mînaka li jor de herî dûr in, xeta ku daneyan dike du komên ku ji hev cuda hatine kategorîzekirin xeta navîn e. Tesnîfkerê me ev rêz e.

9. Kêmkirina Dimensionality

Bi karanîna nêzîkbûna kêmkirina pîvanê, dibe ku daneyên perwerdehiyê kêmtir guhêrbarên têketinê hebin. Bi gotinên hêsan, ew pêvajoya piçûkkirina mezinahiya koma taybetmendiya we vedibêje. Ka em bifikirin ku databasa we 100 stûn hene; Kêmkirina mezinbûnê dê wê mîqdarê dakeve 20 stûnan.

Kêmkirina Dimensionality

Model bixweber sofîstîketir dibe û ji ber ku hejmara taybetmendiyan zêde dibe xetereyek zêde ya zêdebûnê heye. Pirsgirêka herî mezin a bi xebata bi daneyan re di pîvanên mezintir de ew e ku wekî "laneta dimensîyonê" tê zanîn, ku dema ku daneyên we hejmareke zêde taybetmendî dihewîne pêk tê.

Hêmanên jêrîn dikarin werin bikar anîn da ku kêmkirina pîvanê pêk bînin:

Ji bo dîtin û bijartina taybetmendiyên têkildar, hilbijartina taybetmendiyê tê bikar anîn.
Bi karanîna taybetmendiyên jixwe heyî, endezyariya taybetmendiyê bi destan taybetmendiyên nû diafirîne.

Xelasî

Fêrbûna makîneyê ya bêserûber an bi çavdêrî hem jî gengaz e. Ger daneyên we kêm zêde ne û ji bo perwerdehiyê baş hatine nîşankirin fêrbûna çavdêriyê hilbijêrin.

Komîteyên daneya mezin bi gelemperî bi karanîna fêrbûna neçapkirî encamên çêtir çêdikin û hilberînin. Hînbûna dûr Rêbaz çêtirîn in heke we berhevokek daneya berbiçav hebe ku bi hêsanî peyda dibe.

Fêrbûna xurtkirinê û hînbûna xurtkirina kûr hin mijarên ku we xwendiye ne. Taybetmendî, bikaranîn û astengiyên torên neuralî naha ji we re zelal in. Di dawiyê de, lê ne hindik, we vebijarkên ji bo zimanên bernamenûs, IDE û platformên cihêreng dihesiband dema ku ew hate çêkirina ya xwe. modelên fêrbûna makîneyê.

Tiştê din ku hûn hewce ne bikin ev e ku hûn dest bi xwendin û karanîna her yekê bikin fêrbûna makîneyê nêzîkbûhatinî. Ger mijar berfireh be jî, heke hûn li ser kûrahiya wê bisekinin, her mijar dikare di çend demjimêran de were fam kirin. Her mijar ji yên din bi tenê ye.

Pêdivî ye ku hûn li ser pirsgirêkek yek carî bifikirin, wê bixwînin, bixin pratîkê, û zimanek bijartina xwe bikar bînin da ku algorîtma(an) tê de bicîh bikin.

Lîsteya Algorîtmayên Fêrbûna Makîneya Mezin ji bo Destpêkan

Ji ber vê yekê, algorîtmayên Fêrbûna Makîneyê çi ne?