Efnisyfirlit[Fela][Sýna]
Heimurinn er fljótur að breytast vegna gervigreindar og vélanáms, sem hefur áhrif á alla þætti daglegs lífs okkar.
Allt frá raddaðstoðarmönnum sem nota NLP og vélanám til að bóka tíma, fletta upp viðburðum á dagatalinu okkar og spila tónlist til tækja sem eru svo nákvæm að þau geta séð fyrir þarfir okkar áður en við íhugum þær.
Tölvur geta teflt, gert skurðaðgerðir og þróast í snjallari, manneskjulegri vélar með hjálp vélanáms reiknirit.
Við erum á tímum sífelldra tækniframfara og með því að sjá hvernig tölvur hafa þróast í gegnum tíðina getum við spáð fyrir um hvað mun gerast í framtíðinni.
Lýðræðisvæðing tölvutækja og aðferða er einn af lykilþáttum þessarar byltingar sem sker sig úr. Gagnfræðingar hafa búið til öflugar tölvur til að kreista gögn á síðustu fimm árum með því að innleiða háþróaða aðferðafræði án áreynslu. Niðurstöðurnar eru undraverðar.
Í þessari færslu munum við skoða vel vél nám reiknirit og öll afbrigði þeirra.
Svo, hvað eru reiknirit fyrir vélanám?
Aðferðin sem gervigreindarkerfið notar til að framkvæma verkefni sitt - almennt að spá fyrir um úttaksgildi úr tilteknum inntaksgögnum - er þekkt sem vélrænt reiknirit.
Vélræn reiknirit er ferli sem nýtir gögn og er notað til að búa til vélanámslíkön sem eru tilbúin til framleiðslu. Ef vélanám er lestin sem sinnir starfi, þá eru vélanámsreiknirit eimreiðarnar sem flytja verkið áfram.
Besta vélanámsaðferðin til að nýta ræðst af viðskiptavandanum sem þú ert að reyna að takast á við, tegund gagnasafns sem þú notar og úrræði sem þú hefur tiltækt.
Vélræn reiknirit eru þau sem breyta gagnasetti í líkan. Það fer eftir tegund vandamála sem þú ert að reyna að svara, vinnslumátturinn sem er tiltækur og tegund gagna sem þú hefur, undir eftirliti, eftirlitslausu eða styrkingarnámi reiknirit geta reynst vel.
Svo ræddum við um nám undir eftirliti, án eftirlits og styrkingarnám, en hver eru þau? Við skulum kanna þá.
Umsjón, án eftirlits og styrkingarnám
Umsjón nám
Í námi undir eftirliti er gervigreind líkanið þróað út frá inntakinu sem hefur verið veitt og merkinu sem táknar fyrirhugaða útkomu. Byggt á inntakinu og úttakinu, þróar líkanið kortlagningarjöfnu og með því að nota þá kortlagningarjöfnu spáir það fyrir um merki inntakanna í framtíðinni.
Segjum að við þurfum að búa til líkan sem getur greint á milli hunds og köttar. Margar myndir af köttum og hundum eru færðar inn í líkanið með merkingum sem gefa til kynna hvort þeir séu kettir eða hundar til að þjálfa líkanið.
Líkanið leitast við að koma á jöfnu sem tengir merkimiðana á inntaksmyndunum við þessar myndir. Jafnvel þótt fyrirsætan hafi aldrei séð myndina áður, eftir þjálfun, getur hún greint hvort hún er af kötti eða hundi.
Ekkert eftirlit með námi
Nám án eftirlits felur í sér að þjálfa gervigreind líkan eingöngu á inntak án þess að merkja þau. Líkanið skiptir inntaksgögnunum í hópa með tengda eiginleika.
Framtíðarmerki inntaksins er síðan spáð eftir því hversu náið eiginleikar þess passa við eina af flokkunum. Íhuga aðstæður þar sem við verðum að skipta hópi af rauðum og bláum boltum í tvo flokka.
Gerum ráð fyrir að aðrir eiginleikar kúlanna séu eins, að litum undanskildum. Á grundvelli þess hvernig það getur skipt kúlunum í tvo flokka leitar líkanið að þeim eiginleikum sem eru mismunandi á milli kúlanna.
Tveir kúluþyrpingar - ein blá og önnur rauð - verða til þegar kúlunum er skipt í tvo hópa eftir litbrigðum þeirra.
Styrkingarnám
Í styrktarnámi leitast gervigreind líkanið við að hámarka heildarhagnað með því að starfa eins vel og það getur í tilteknum kringumstæðum. Endurgjöf um fyrri niðurstöður hjálpar líkaninu að læra.
Hugsaðu um atburðarásina þegar vélmenni fær fyrirmæli um að velja leið á milli punkta A og B. Vélmennið velur fyrst annað hvort námskeiðanna vegna þess að það hefur enga fyrri reynslu.
Vélmennið fær inntak um leiðina sem það fer og öðlast þekkingu á því. Vélmennið getur notað inntak til að laga vandamálið næst þegar það lendir í svipuðum aðstæðum.
Til dæmis, ef vélmennið velur valmöguleika B og fær verðlaun, svo sem jákvæð viðbrögð, skilur það að þessu sinni að það verður að velja leið B til að auka verðlaunin.
Nú loksins er það sem þið eruð öll að bíða eftir, reikniritin.
Helstu reiknirit fyrir vélanám
1. Línuleg aðhvarf
Einfaldasta vélanámsaðferðin sem víkur frá námi undir eftirliti er línuleg aðhvarf. Með þekkingu frá óháðum breytum er hún að mestu notuð til að leysa aðhvarfsvandamál og búa til spár um stöðugar háðar breytur.
Að finna línuna sem hentar best, sem getur hjálpað til við að spá fyrir um útkomuna fyrir samfelldar háðar breytur, er markmið línulegrar aðhvarfs. Húsnæðisverð, aldur og laun eru nokkur dæmi um samfelld verðmæti.
Líkan sem kallast einföld línuleg aðhvarf notar beina línu til að reikna tengslin milli einnar óháðrar breytu og einnar háðrar breytu. Það eru fleiri en tvær óháðar breytur í margfaldri línulegri aðhvarf.
Línulegt aðhvarfslíkan hefur fjórar undirliggjandi forsendur:
- Línulegt samband: Það er línuleg tenging á milli X og meðaltals Y.
- Homoscedasticity: Fyrir hvert gildi X er afgangsdreifingin sú sama.
- Sjálfstæði: Athuganir eru óháðar hver annarri hvað varðar sjálfstæði.
- Normality: Þegar X er fastur er Y normaldreifður.
Línuleg aðhvarf virkar frábærlega fyrir gögn sem hægt er að aðskilja eftir línum. Það getur stjórnað offitun með því að nota reglusetningu, krossfullgildingu og víddarminnkun tækni. Hins vegar eru tilvik þar sem þörf er á víðtækri eiginleikatækni, sem getur stundum leitt til ofþenslu og hávaða.
2. Logistic Regression
Logistic regression er önnur vélanámstækni sem fer frá námi undir eftirliti. Helsta notkun þess er flokkun, en einnig er hægt að nota það fyrir aðhvarfsvandamál.
Logistic regression er notað til að spá fyrir um flokkaháðu breytuna með því að nota upplýsingarnar frá óháðu þáttunum. Markmiðið er að flokka úttak, sem getur aðeins fallið á milli 0 og 1.
Vegin heildarfjölda inntakanna er unnin af sigmoid aðgerðinni, virkjunaraðgerð sem breytir gildum á milli 0 og 1.
Grundvöllur logistic regressions er hámarkslíkindamat, aðferð til að reikna út færibreytur áætluðrar líkindadreifingar miðað við tiltekin gögn.
3. Ákvörðunartré
Önnur vélanámsaðferð sem klofnar úr námi undir eftirliti er ákvörðunartréð. Fyrir bæði flokkunar- og aðhvarfsmál er hægt að nota ákvörðunartrésaðferðina.
Þetta ákvarðanatökutæki, sem líkist tré, notar sjónræna framsetningu til að sýna væntanlegar niðurstöður aðgerða, kostnað og afleiðingar. Með því að skipta gögnunum í aðskilda hluta er hugmyndin hliðstæð mannshuganum.
Gögnin hafa verið skipt í aðskilda hluta eins mikið og við gátum kornað þau. Meginmarkmið ákvörðunartrés er að byggja upp þjálfunarlíkan sem hægt er að nota til að spá fyrir um flokk markbreytunnar. Gildi sem vantar er hægt að meðhöndla sjálfkrafa með því að nota ákvörðunartréð.
Það er engin krafa um kóðun í einu skoti, dummy breytur eða önnur gagnaformeðferðarskref. Það er stíft í þeim skilningi að erfitt er að bæta ferskum gögnum við það. Ef þú færð fleiri merkt gögn, ættir þú að endurþjálfa tréð á öllu gagnasafninu.
Fyrir vikið eru ákvörðunartré lélegur kostur fyrir hvaða forrit sem krefst kraftmikilla líkanabreytinga.
Byggt á tegund markbreytu eru ákvörðunartré flokkuð í tvær tegundir:
- Categorical Variable: Ákvörðunartré þar sem markmiðsbreytan er Categorical.
- Continuous Variable: Ákvörðunartré þar sem markmiðsbreytan er Continuous.
4. Random Forest
Random Forest Method er næsta vélanámstækni og er vélrænt reiknirit undir eftirliti sem notað er mikið í flokkunar- og aðhvarfsmálum. Það er líka tré-undirstaða aðferð, svipað ákvörðunartré.
Trjáskógur, eða mörg ákvörðunartré, er notað með handahófskenndu skógaraðferðinni til að dæma. Við meðhöndlun flokkunarverkefna notaði tilviljanakennda skógaraðferðin flokkabreytur meðan hún meðhöndlaði aðhvarfsverkefni með gagnasöfnum sem innihalda samfelldar breytur.
Sameining, eða blanda af mörgum gerðum, er það sem handahófskennda skógaraðferðin gerir, sem þýðir að spár eru gerðar með því að nota hóp líkana frekar en bara eitt.
Hæfni til að nota fyrir bæði flokkunar- og aðhvarfsvandamál, sem mynda meirihluta nútíma vélanámskerfa, er lykilávinningur handahófskennda skógarins.
Tvær mismunandi aðferðir eru notaðar af Ensemble:
- Bagging: Með því að gera þetta eru fleiri gögn framleidd fyrir þjálfunargagnasettið. Til að minnka muninn á spánum er þetta gert.
- Uppörvun er ferlið við að sameina veika nemendur og sterka nemendur með því að byggja upp líkön í röð, sem leiðir til loka líkansins með hámarks nákvæmni.
5. Naive Bayes
Hægt er að leysa tvíflokka (tveggja flokka) og fjölflokka flokkunarvandamál með Naive Bayes tækninni. Þegar aðferðin er útskýrð með því að nota tvöfalda eða flokka inntaksgildi er einfaldast að átta sig á henni. Forsenda sem barnalegur Bayes flokkari gerir er að tilvist eins eiginleika í flokki hafi engin áhrif á tilvist neinna annarra eiginleika.
Ofangreind formúla gefur til kynna:
- P(H): Líkurnar á að tilgáta H sé rétt. Fyrri líkurnar eru nefndar þessar.
- P(E): Líkurnar á sönnunargögnunum
- P(E|H): Líkurnar á að tilgátan sé studd af sönnunargögnum.
- P(H|E): Líkurnar á að tilgátan sé sönn miðað við sönnunargögnin.
Naive Bayes flokkari myndi taka tillit til hvers þessara eiginleika fyrir sig þegar hann ákvarðar líkur á ákveðinni niðurstöðu, jafnvel þótt þessir eiginleikar séu tengdir hver öðrum. Naive Bayesian líkan er einfalt að smíða og skilvirkt fyrir stór gagnasöfn.
Það er vitað að það skilar betri árangri en jafnvel flóknustu flokkunaraðferðirnar á meðan það er undirstöðu. Þetta er safn reiknirita sem eru öll byggð á Bayes setningunni, frekar en einni aðferð.
6. K-Næstu nágrannar
K-nearest neighbors (kNN) tæknin er undirmengi vélanáms undir eftirliti sem hægt er að nota til að takast á við flokkunar- og aðhvarfsvandamál. KNN reikniritið gerir ráð fyrir að sambærilega hluti sé að finna í nágrenninu.
Ég minnist þess sem samkomu einstaklinga með sama hugarfar. kNN nýtir sér hugmyndina um líkindi milli annarra gagnapunkta með því að nýta nálægð, nálægð eða fjarlægð. Til þess að merkja óséðu gögnin út frá næstu merktu sjáanlegu gagnapunktum, er stærðfræðileg aðferð notuð til að ákvarða aðskilnað milli punkta á línuriti.
Þú verður að ákvarða fjarlægðina á milli gagnapunktanna til að bera kennsl á næstu sambærilegu bletti. Til þess er hægt að nota fjarlægðarmælingar eins og Euclidean fjarlægð, Hamming fjarlægð, Manhattan fjarlægð og Minkowski fjarlægð. K er þekkt sem næsta nágrannatala og það er oft oddatala.
Hægt er að beita KNN á flokkunar- og aðhvarfsvandamál. Spáin sem gerð er þegar KNN er notað við aðhvarfsvandamál byggist á meðaltali eða miðgildi K-líkustu atvika.
Niðurstöðu flokkunaralgríms sem byggir á KNN er hægt að ákvarða sem flokkinn með hæstu tíðnina meðal K sem eru líkust. Sérhvert tilvik greiðir í rauninni atkvæði fyrir sinn flokk og spáin tilheyrir þeim flokki sem fær flest atkvæði.
7. K-merki
Það er tækni fyrir nám án eftirlits sem tekur á klasavandamálum. Gagnasöfnum er skipt í ákveðinn fjölda klasa – köllum við það K – á þann hátt að gagnapunktar hvers klasa eru einsleitir og aðgreindir frá þeim sem eru í hinum klasunum.
K-means klasaaðferðafræði:
- Fyrir hvern klasa velur K-means algrímið k miðpunkta, eða punkta.
- Með næstu miðpunktum eða K þyrpingum myndar hver gagnapunktur klasa.
- Nú eru nýir miðstöðvar framleiddar eftir því hvaða klasameðlimir eru þegar til staðar.
- Næsta fjarlægð fyrir hvern gagnapunkt er reiknuð með þessum uppfærðu miðpunktum. Þar til miðpunktarnir breytast ekki er þetta ferli endurtekið.
Það er fljótlegra, áreiðanlegra og auðveldara að skilja það. Ef það eru vandamál gerir aðlögunarhæfni k-means aðlögun einfaldar. Þegar gagnasöfnin eru aðgreind eða vel einangruð hvert frá öðru eru niðurstöðurnar bestar. Það getur ekki stjórnað óreglulegum gögnum eða frávikum.
8. Stuðningur við vektorvélar
Þegar SVM tæknin er notuð til að flokka gögn eru hrá gögn sýnd sem punktar í n-víddarrými (þar sem n er fjöldi eiginleika sem þú hefur). Síðan er auðvelt að flokka gögnin vegna þess að gildi hvers eiginleika er síðan tengt við ákveðið hnit.
Til að aðgreina gögnin og setja þau á línurit, notaðu línur sem kallast flokkarar. Þessi aðferð teiknar hvern gagnapunkt sem punkt í n-víddarrými, þar sem n er fjöldi eiginleika sem þú hefur og gildi hvers eiginleika er ákveðið hnitagildi.
Við munum nú finna línu sem skiptir gögnunum í tvö sett af gögnum sem hafa verið flokkuð á annan hátt. Vegalengdirnar frá næstu punktum í hvorum hópanna tveggja verða lengst á milli eftir þessari línu.
Þar sem tveir nálægustu punktarnir eru þeir sem eru lengst frá línunni í dæminu hér að ofan, er línan sem skiptir gögnunum í tvo hópa sem voru flokkaðir á mismunandi hátt miðlínan. Flokkarinn okkar er þessi lína.
9. Víddarmækkun
Með því að nota nálgun víddarminnkunar gætu þjálfunargögn haft færri inntaksbreytur. Í einföldu máli vísar það til þess ferlis að minnka stærð eiginleikasettsins þíns. Ímyndum okkur að gagnasafnið þitt hafi 100 dálka; víddarskerðing mun minnka þá upphæð í 20 dálka.
Líkanið verður sjálfkrafa flóknara og hefur meiri hættu á að ofklæðast eftir því sem fjöldi eiginleika eykst. Stærsta vandamálið við að vinna með gögn í stærri víddum er það sem er þekkt sem „bölvun víddar“ sem á sér stað þegar gögnin þín innihalda of marga eiginleika.
Hægt er að nota eftirfarandi þætti til að ná víddarminnkun:
- Til að finna og velja viðeigandi eiginleika er val á eiginleikum notað.
- Með því að nota eiginleika sem þegar eru til, býr eiginleikatækni til handvirkt nýja eiginleika.
Niðurstaða
Vélnám án eftirlits eða undir eftirliti er bæði mögulegt. Veldu nám undir eftirliti ef gögnin þín eru minni og vel merkt fyrir þjálfun.
Stór gagnasöfn myndu oft skila árangri og skila betri árangri með því að nota nám án eftirlits. Djúpt nám aðferðir eru bestar ef þú ert með umtalsverða gagnasöfnun sem er aðgengileg.
Styrkingarnám og djúpt styrkingarnám eru nokkur atriði sem þú lærðir. Einkenni tauganeta, notkun og takmarkanir eru þér nú ljósar. Síðast en ekki síst skoðaðir þú möguleikana fyrir mismunandi forritunarmál, IDE og vettvang þegar það kom að því að búa til þitt eigið vélanáms módel.
Það næsta sem þú þarft að gera er að byrja að læra og nota hverja vél nám nálgun. Jafnvel þótt viðfangsefnið sé breitt er hægt að skilja hvaða efni sem er á nokkrum klukkustundum ef þú einbeitir þér að dýpt þess. Hvert viðfangsefni stendur eitt frá öðru.
Þú verður að hugsa um eitt mál í einu, kynna þér það, koma því í framkvæmd og nota tungumál að eigin vali til að innleiða reikniritið(ir) í það.
Skildu eftir skilaboð