Kaundan[Itago][Ipakita]
Ang kalibutan dali nga nagbag-o tungod sa artipisyal nga paniktik, ug pagkat-on sa makina, nga adunay epekto sa matag aspeto sa atong adlaw-adlaw nga kinabuhi.
Gikan sa mga voice assistant nga naggamit sa NLP ug machine learning sa pag-book og mga appointment, pagpangita og mga panghitabo sa among kalendaryo, ug pagpatugtog og musika ngadto sa mga himan nga tukma kaayo nga ilang mapaabut ang among mga panginahanglan sa dili pa namo kini isipon.
Ang mga kompyuter mahimong magduwa og chess, mag-opera, ug mahimong mas maalamon, mas sama sa tawo nga mga makina uban sa tabang sa mga algorithm sa pagkat-on sa makina.
Anaa kami sa usa ka panahon sa padayon nga pag-uswag sa teknolohiya, ug pinaagi sa pagtan-aw kung giunsa ang pag-uswag sa mga kompyuter sa paglabay sa panahon, makahimo kami mga panagna kung unsa ang mahitabo sa umaabot.
Ang demokratisasyon sa mga galamiton ug pamaagi sa pag-compute mao ang usa sa mga mahinungdanong aspeto niining rebolusyon nga nagpakita. Mga siyentista sa datos nakamugna ug gamhanang data-crunching computers sulod sa milabayng lima ka tuig pinaagi sa walay kahago nga pagpatuman sa mga cutting-edge nga pamaagi. Makatilingala ang mga resulta.
Niini nga post, atong tan-awon pag-ayo pagkat-on sa makina mga algorithm ug ang tanan niini nga mga kalainan.
Busa, unsa ang Machine Learning algorithms?
Ang pamaagi nga gigamit sa sistema sa AI aron matuman ang buluhaton niini—sa kasagaran, pagtagna sa mga kantidad sa output gikan sa gihatag nga datos sa input—nailhan nga usa ka algorithm sa pagkat-on sa makina.
Ang algorithm sa pagkat-on sa makina usa ka proseso nga naggamit sa datos ug gigamit sa paghimo og mga modelo sa pagkat-on sa makina nga andam na alang sa produksiyon. Kung ang pagkat-on sa makina mao ang tren nga nagdala sa usa ka trabaho, nan ang mga algorithm sa pagkat-on sa makina mao ang mga lokomotibo nga nagpalihok sa trabaho.
Ang labing maayo nga pamaagi sa pagkat-on sa makina nga gamiton matino pinaagi sa problema sa negosyo nga imong gisulayan nga sulbaron, ang klase sa dataset nga imong gigamit, ug ang mga kapanguhaan nga imong magamit.
Ang mga algorithm sa pagkat-on sa makina mao kadtong naghimo sa usa ka set sa datos nga usa ka modelo. Depende sa klase sa problema nga imong gisulayan pagtubag, ang gahum sa pagproseso nga magamit, ug ang tipo sa datos nga naa kanimo, gibantayan, wala gibantayan, o mga algorithm sa pagkat-on sa pagpalig-on mahimo’g maayo.
Mao nga, naghisgot kami bahin sa gibantayan, wala gibantayan, ug gipalig-on nga pagkat-on, apan unsa kini? Susihon nato sila.
Gibantayan, Wala Gibantayan ug Pagpalig-on sa Pagkat-on
Pagkat-on nga Pagkat-on
Sa gibantayan nga pagkat-on, ang modelo sa AI gihimo base sa input nga gihatag ug ang label nga nagrepresentar sa gitagna nga sangputanan. Pinasukad sa mga input ug output, ang modelo naghimo og usa ka mapping equation, ug gamit ang mapping equation, kini nagtagna sa label sa mga input sa umaabot.
Ingnon ta nga kinahanglan ta maghimo ug modelo nga makaila sa iro ug iring. Daghang mga litrato sa mga iring ug iro ang gipakaon sa modelo nga adunay mga label nga nagpakita kung sila mga iring o iro aron mabansay ang modelo.
Ang modelo nagtinguha sa paghimo og usa ka equation nga may kalabutan sa mga label sa input nga mga litrato sa mga imahe. Bisan kung ang modelo wala pa makakita sa imahe kaniadto, pagkahuman sa pagbansay, kini makaila kung kini sa usa ka iring o usa ka iro.
Dili Masaligan nga Pagkat-on
Ang walay pagdumala nga pagkat-on naglakip sa pagbansay sa usa ka modelo sa AI lamang sa mga input nga walay pagmarka niini. Gibahin sa modelo ang data sa input ngadto sa mga grupo nga adunay kalabutan nga mga kinaiya.
Ang umaabot nga label sa input unya gitagna depende sa kung unsa ka duol ang mga hiyas niini sa usa sa mga klasipikasyon. Tagda ang sitwasyon diin kinahanglan natong bahinon ang usa ka grupo sa pula ug asul nga mga bola ngadto sa duha ka kategoriya.
Atong hunahunaon nga ang ubang mga kinaiya sa bola managsama, gawas sa kolor. Pinasukad kung giunsa ang pagbahin sa mga bola sa duha nga mga klase, ang modelo nangita alang sa mga kinaiya nga lahi sa mga bola.
Duha ka pungpong sa mga bola—usa ka asul ug usa ka pula—mahimo sa dihang ang mga bola bahinon sa duha ka grupo base sa kolor niini.
Pagpalig-on sa Pagkat-on
Sa pagkat-on sa pagpalig-on, ang modelo sa AI nagtinguha nga mapadako ang kinatibuk-ang ganansya pinaagi sa paglihok ingon usab sa mahimo niini sa usa ka partikular nga kahimtang. Ang feedback sa nauna nga mga resulta makatabang sa modelo nga makat-on.
Hunahunaa ang senaryo kung ang usa ka robot gisugo sa pagpili sa usa ka ruta tali sa mga punto A ug B. Ang robot una nga mopili sa bisan hain sa mga kurso tungod kay kini walay kasinatian.
Ang robot makadawat og input sa rota nga gikinahanglan niini ug makakuha og kahibalo gikan niini. Mahimong magamit sa robot ang input aron ayuhon ang isyu sa sunod higayon nga makasugat kini og susamang kahimtang.
Pananglitan, kung ang robot mopili sa opsyon B ug makadawat og ganti, sama sa positibong feedback, kini nakasabut niining higayona nga kini kinahanglang mopili sa paagi B aron madugangan ang ganti niini.
Karon sa katapusan kung unsa ang imong gihulat, mao ang mga algorithm.
Major Machine Learning Algorithm
1. Linear Regression
Ang pinakasimple nga pamaagi sa pagkat-on sa makina nga nagtipas gikan sa gibantayan nga pagkat-on mao ang linear regression. Uban sa kahibalo gikan sa mga independyenteng mga variable, kasagaran kini gigamit aron masulbad ang mga isyu sa pagbag-o ug paghimo mga panagna sa padayon nga nagsalig nga mga variable.
Ang pagpangita sa linya nga labing angay, nga makatabang sa pagtagna sa sangputanan alang sa padayon nga nagsalig nga mga variable, mao ang katuyoan sa linear regression. Ang mga presyo sa balay, edad, ug sweldo maoy pipila ka pananglitan sa padayon nga mga bili.
Usa ka modelo nga nailhan nga yano nga linear regression naggamit sa usa ka tul-id nga linya aron makalkulo ang asosasyon tali sa usa ka independent variable ug usa ka dependent variable. Adunay labaw pa sa duha nga independente nga mga variable sa daghang linear regression.
Ang usa ka linear regression nga modelo adunay upat ka nagpahiping mga pangagpas:
- Linearity: Adunay usa ka linear nga koneksyon tali sa X ug ang mean sa Y.
- Homoscedasticity: Alang sa matag bili sa X, ang nahabilin nga kalainan parehas.
- Independence: Ang mga obserbasyon independente sa usag usa sa termino sa independensya.
- Normalidad: Kung ang X gitakda, ang Y kay kasagarang giapod-apod.
Ang linear regression maayo nga nahimo alang sa datos nga mahimong mabulag sa linya. Makontrol niini ang overfitting pinaagi sa paggamit sa regularization, cross-validation, ug mga pamaagi sa pagkunhod sa dimensionality. Bisan pa, adunay mga higayon kung diin gikinahanglan ang daghang bahin sa engineering, nga usahay moresulta sa sobra nga pagkabutang ug kasaba.
2. Logistic Regression
Ang logistic regression usa pa nga pamaagi sa pagkat-on sa makina nga nagpalayo sa gibantayan nga pagkat-on. Ang panguna nga paggamit niini mao ang pagklasipikar, samtang mahimo usab kini gamiton alang sa mga problema sa pagbag-o.
Ang logistic regression gigamit sa pagtagna sa categorical dependent variable gamit ang impormasyon gikan sa independent factor. Ang tumong mao ang pagklasipikar sa mga output, nga mahimong mahulog lamang tali sa 0 ug 1.
Ang gibug-aton nga kinatibuk-an sa mga input giproseso sa sigmoid function, usa ka function sa pagpaaktibo nga nagbag-o sa mga kantidad tali sa 0 ug 1.
Ang basehan sa logistic regression mao ang maximum likelihood estimation, usa ka paagi sa pagkuwenta sa mga parameter sa gituohang probability distribution nga gihatag sa piho nga naobserbahan nga datos.
3. Desisyon nga Punoan
Ang laing paagi sa pagkat-on sa makina nga nagbulag sa gibantayan nga pagkat-on mao ang punoan sa desisyon. Alang sa mga isyu sa klasipikasyon ug regression, ang pamaagi sa decision tree mahimong magamit.
Kini nga himan sa paghimo og desisyon, nga susama sa usa ka kahoy, naggamit sa biswal nga mga representasyon aron ipakita ang umaabot nga mga resulta, gasto, ug mga epekto sa mga aksyon. Pinaagi sa pagbahin sa datos ngadto sa lain nga mga bahin, ang ideya susama sa hunahuna sa tawo.
Ang datos gibahin sa lahi nga mga bahin kutob sa mahimo namon nga mabuak kini. Ang nag-unang tumong sa Decision Tree mao ang paghimo og usa ka modelo sa pagbansay nga magamit sa pagtagna sa klase sa target variable. Ang nawala nga mga kantidad mahimong awtomatiko nga madumala gamit ang Desisyon nga Punoan.
Walay kinahanglanon alang sa one-shot encoding, dummy variables, o uban pang mga lakang sa pretreatment sa datos. Kini estrikto sa diwa nga lisud ang pagdugang sa bag-ong datos niini. Kung nakakuha ka dugang nga gimarkahan nga datos, kinahanglan nimo nga bansayon pag-usab ang punoan sa tibuuk nga dataset.
Ingon usa ka sangputanan, ang mga punoan sa desisyon usa ka dili maayo nga pagpili alang sa bisan unsang aplikasyon nga nanginahanglan dinamikong pagbag-o sa modelo.
Pinasukad sa klase sa target nga variable, ang mga punoan sa desisyon giklasipikar sa duha ka klase:
- Categorical Variable: Usa ka Decision Tree diin ang goal variable kay Categorical.
- Padayon nga Variable: Usa ka Desisyon Tree diin ang tumong variable mao ang Padayon.
4. Random nga Lasang
Ang Random Forest Method mao ang sunod nga pamaagi sa pagkat-on sa makina ug usa ka gibantayan nga algorithm sa pagkat-on sa makina nga kaylap nga gigamit sa mga isyu sa klasipikasyon ug regression. Usa usab kini ka pamaagi nga nakabase sa kahoy, susama sa usa ka punoan sa desisyon.
Ang usa ka lasang sa mga kahoy, o daghang mga punoan sa desisyon, gigamit sa random nga paagi sa kalasangan sa paghimog mga paghukom. Kung nagdumala sa mga buluhaton sa pagklasipikar, ang random nga pamaagi sa kalasangan naggamit mga kategorya nga variable samtang nagdumala sa mga buluhaton sa pag-regression nga adunay mga dataset nga adunay padayon nga mga variable.
Usa ka ensemble, o pagsagol sa daghang mga modelo, mao ang gibuhat sa random nga pamaagi sa kalasangan, nga nagpasabut nga ang mga panagna gihimo gamit ang usa ka grupo sa mga modelo kaysa usa ra.
Ang abilidad nga gamiton alang sa mga problema sa klasipikasyon ug regression, nga naglangkob sa kadaghanan sa modernong mga sistema sa pagkat-on sa makina, usa ka mahinungdanong kaayohan sa random nga lasang.
Duha ka lainlaing estratehiya ang gigamit sa Ensemble:
- Bagging: Pinaagi sa pagbuhat niini, mas daghang datos ang gihimo para sa dataset sa pagbansay. Aron maminusan ang kalainan sa mga panagna, gihimo kini.
- Ang Boosting mao ang proseso sa paghiusa sa huyang nga mga estudyante sa kusgan nga mga estudyante pinaagi sa paghimo og sunud-sunod nga mga modelo, nga moresulta sa katapusan nga modelo nga adunay labing tukma nga katukma.
5. Naive Bayes
Ang binary (duha ka klase) ug multi-class nga isyu sa klasipikasyon mahimong masulbad gamit ang teknik sa Naive Bayes. Kung ang pamaagi gipatin-aw gamit ang binary o kategorya nga mga kantidad sa input, kini labing kadali nga masabtan. Ang usa ka pangagpas nga gihimo sa usa ka Naive Bayes classifier mao nga ang paglungtad sa usa ka bahin sa usa ka klase wala’y kalabotan sa presensya sa bisan unsang ubang mga bahin.
Ang pormula sa ibabaw nagpakita:
- P(H): Ang posibilidad nga husto ang hypothesis H. Ang nauna nga posibilidad gitawag nga ingon niini.
- P(E): Ang posibilidad sa ebidensya
- P(E|H): Ang posibilidad nga ang hypothesis gisuportahan sa ebidensya.
- P(H|E): Ang kalagmitan nga ang hypothesis tinuod, nga gihatag sa ebidensya.
Ang usa ka Naive Bayes classifier magtagad sa matag usa niini nga mga kinaiya sa tagsa-tagsa sa diha nga pagtino sa kalagmitan sa usa ka resulta, bisan kon kini nga mga hiyas konektado sa usag usa. Ang usa ka Naive Bayesian nga modelo yano ra nga matukod ug epektibo alang sa dagkong mga dataset.
Nahibal-an nga kini molihok nga labi ka maayo kaysa bisan sa labing komplikado nga mga pamaagi sa pagkategorya samtang sukaranan. Kini usa ka koleksyon sa mga algorithm nga ang tanan gibase sa Bayes' Theorem, kay sa usa ka paagi.
6. K-Pinaduol nga mga Silingan
Ang K-labing duol nga silingan (kNN) nga teknik usa ka subset sa gibantayan nga pagkat-on sa makina nga magamit aron matubag ang mga isyu sa klasipikasyon ug pagbag-o. Ang KNN algorithm nagtuo nga ang susama nga mga butang makit-an sa duol.
Nahinumdom ko niini isip usa ka panagtapok sa mga tawo nga parehas og hunahuna. Gipahimuslan sa kNN ang ideya sa pagkaparehas tali sa ubang mga punto sa datos nga naggamit sa kaduol, kaduol, o distansya. Aron mamarkahan ang dili makita nga datos base sa labing duol nga gimarkahan nga maobserbahan nga mga punto sa datos, usa ka pamaagi sa matematika ang gigamit aron mahibal-an ang pagbulag tali sa mga punto sa usa ka graph.
Kinahanglan nimo nga mahibal-an ang gilay-on tali sa mga punto sa datos aron mahibal-an ang labing duol nga parehas nga mga lugar. Ang mga pagsukod sa distansya sama sa Euclidean distance, Hamming distance, Manhattan distance, ug Minkowski distance mahimong magamit alang niini. Ang K nailhan nga labing duol nga silingan nga numero, ug kini kasagaran usa ka katingad-an nga numero.
Ang KNN mahimong magamit sa mga problema sa pagklasipikar ug pagbalik. Ang panagna nga gihimo kung ang KNN gigamit sa mga isyu sa pag-regression gibase sa mean o median sa K-kadaghanan nga parehas nga mga panghitabo.
Ang resulta sa usa ka algorithm sa klasipikasyon base sa KNN mahimong matino isip klase nga adunay pinakataas nga frequency taliwala sa K nga labing susama nga mga panghitabo. Ang matag higayon sa esensya nagboto alang sa ilang klase, ug ang panagna iya sa klase nga nakadawat labing daghang mga boto.
7. K-nagpasabot
Kini usa ka teknik alang sa wala gibantayan nga pagkat-on nga nagtubag sa mga isyu sa clustering. Ang mga set sa datos gibahin ngadto sa usa ka piho nga gidaghanon sa mga pungpong—tawagon kini nga K—sa paagi nga ang mga punto sa datos sa matag cluster managsama ug lahi sa mga naa sa ubang mga cluster.
K-means clustering methodology:
- Alang sa matag cluster, ang K-means algorithm mopili sa k centroids, o mga punto.
- Uban sa labing duol nga centroids o K clusters, ang matag data point nagporma og cluster.
- Karon, ang mga bag-ong sentroid gihimo depende sa mga miyembro sa cluster nga anaa na.
- Ang labing duol nga gilay-on alang sa matag data point gikalkulo gamit kining updated nga mga sentroid. Hangtud nga ang mga centroid dili mausab, kini nga proseso gisubli.
Kini mas paspas, mas kasaligan, ug mas sayon sabton. Kung adunay mga isyu, ang pagkamapasibo sa k-means naghimo sa mga pagbag-o nga yano. Kung ang mga dataset lahi o maayo nga nahimulag gikan sa usag usa, ang mga resulta labing maayo. Dili kini makadumala sa sayop nga datos o outlier.
8. Pagsuporta sa Vector Machines
Kung gigamit ang teknik sa SVM sa pagklasipikar sa datos, ang hilaw nga datos gipakita ingon mga tuldok sa usa ka n-dimensional nga wanang (diin ang n ang gidaghanon sa mga bahin nga naa kanimo). Ang datos mahimong dali nga maklasipikar tungod kay ang kantidad sa matag bahin konektado sa usa ka piho nga coordinate.
Aron mabulag ang datos ug ibutang kini sa usa ka graph, gamita ang mga linya nga nailhan nga mga classifier. Kini nga pamaagi naglaraw sa matag data point isip usa ka punto sa usa ka n-dimensional nga luna, diin ang n mao ang gidaghanon sa mga feature nga anaa kanimo ug ang matag feature sa bili usa ka piho nga coordinate value.
Pangitaon na nato ang usa ka linya nga nagbahin sa datos ngadto sa duha ka set sa datos nga lahi ang pagkategorya. Ang mga gilay-on gikan sa labing duol nga mga punto sa matag usa sa duha ka grupo mao ang pinakalayo nga gilay-on niini nga linya.
Tungod kay ang duha ka labing duol nga mga punto mao ang labing layo sa linya sa panig-ingnan sa ibabaw, ang linya nga nagbahin sa datos sa duha nga mga grupo nga lahi ang pagkategorya mao ang tunga nga linya. Ang among classifier mao kini nga linya.
9. Pagkunhod sa Dimensyon
Gamit ang pamaagi sa pagkunhod sa dimensyon, ang datos sa pagbansay mahimong adunay gamay nga mga variable sa pag-input. Sa yano nga termino, kini nagtumong sa proseso sa pagkunhod sa gidak-on sa imong feature set. Hunahunaa nga ang imong dataset adunay 100 ka kolum; Ang pagkunhod sa dimensionality mokunhod sa maong kantidad ngadto sa 20 ka mga kolum.
Ang modelo awtomatikong motubo nga mas sopistikado ug adunay mas dako nga risgo sa overfitting samtang ang gidaghanon sa mga bahin mosaka. Ang pinakadako nga isyu sa pagtrabaho uban sa data sa mas dako nga mga dimensyon mao ang nailhan nga "sumpa sa dimensionality," nga mahitabo sa diha nga ang imong data naglangkob sa usa ka sobra nga gidaghanon sa mga kinaiya.
Ang mosunod nga mga elemento mahimong gamiton aron makab-ot ang pagkunhod sa dimensyon:
- Aron makit-an ug mapili ang angay nga mga kinaiya, gigamit ang pagpili sa feature.
- Gamit ang naa na nga mga bahin, ang feature engineering mano-mano nga nagmugna og mga bag-ong feature.
Panapos
Ang wala gibantayan o gibantayan nga pagkat-on sa makina pareho nga posible. Pilia ang gibantayan nga pagkat-on kung ang imong datos dili kaayo daghan ug maayo ang pagkatag alang sa pagbansay.
Ang dagkong mga set sa datos kanunay nga makahimo ug makahatag og mas maayo nga mga resulta gamit ang wala'y pagdumala nga pagkat-on. Hilom nga pagkat-on Ang mga pamaagi labing maayo kung ikaw adunay daghang pagkolekta sa datos nga dali nga magamit.
Pagkat-on sa pagpalig-on ug ang lawom nga pagpalig-on sa pagkat-on mao ang pipila ka mga hilisgutan nga imong gitun-an. Ang mga kinaiya, gamit, ug mga limitasyon sa mga neural network klaro na kanimo. Katapusan apan dili labing gamay, imong gikonsiderar ang mga kapilian alang sa lainlaing mga sinultian sa programming, IDE, ug platform kung bahin sa paghimo sa imong kaugalingon. mga modelo sa pagkat-on sa makina.
Ang sunod nga butang nga kinahanglan nimong buhaton mao ang pagsugod sa pagtuon ug paggamit sa matag usa pagkat-on sa makina pagduol. Bisan kung lapad ang hilisgutan, ang bisan unsang hilisgutan mahimong masabtan sa pipila ka oras kung magpunting ka sa giladmon niini. Ang matag hilisgutan nag-inusara gikan sa uban.
Kinahanglan nimong hunahunaon ang usa ka isyu matag higayon, tun-an kini, ipraktis kini, ug gamita ang usa ka lengguwahe nga imong gipili aron ipatuman ang (mga) algorithm niini.
Leave sa usa ka Reply