Obsah[Skryť][Šou]
Svet sa rýchlo mení vďaka umelej inteligencii a strojovému učeniu, ktoré má vplyv na každý aspekt nášho každodenného života.
Od hlasových asistentov, ktorí používajú NLP a strojové učenie na rezervovanie schôdzok, vyhľadávanie udalostí v našom kalendári a prehrávanie hudby až po zariadenia, ktoré sú také presné, že dokážu predvídať naše potreby skôr, než o nich vôbec uvážime.
Počítače môžu hrať šach, robiť operácie a pomocou algoritmov strojového učenia sa z nich vyvinú inteligentnejšie stroje podobné ľuďom.
Nachádzame sa v čase neustáleho technologického pokroku a keď vidíme, ako sa počítače časom vyvíjali, môžeme predpovedať, čo sa stane v budúcnosti.
Demokratizácia výpočtových nástrojov a metód je jedným z kľúčových aspektov tejto revolúcie, ktorý vyniká. Vedci údajov za posledných päť rokov vytvorili výkonné počítače na spracovanie údajov bez námahy implementáciou špičkových metodológií. Výsledky sú ohromujúce.
V tomto príspevku sa na to pozrieme bližšie strojové učenie algoritmy a všetky ich variácie.
Čo sú teda algoritmy strojového učenia?
Prístup, ktorý používa systém AI na vykonávanie svojej úlohy – vo všeobecnosti predpovedanie výstupných hodnôt z daných vstupných údajov – je známy ako algoritmus strojového učenia.
Algoritmus strojového učenia je proces, ktorý využíva údaje a používa sa na vytváranie modelov strojového učenia, ktoré sú pripravené na výrobu. Ak je strojové učenie vlakom, ktorý vykonáva prácu, potom algoritmy strojového učenia sú lokomotívy, ktoré posúvajú prácu ďalej.
Najlepší prístup strojového učenia na využitie bude určený obchodným problémom, ktorý sa pokúšate vyriešiť, typom súboru údajov, ktorý používate, a zdrojmi, ktoré máte k dispozícii.
Algoritmy strojového učenia sú tie, ktoré premieňajú súbor údajov na model. V závislosti od druhu problému, na ktorý sa pokúšate odpovedať, dostupného výpočtového výkonu a typu údajov, ktoré máte, môžu algoritmy učenia pod dohľadom, bez dozoru alebo zosilnenia fungovať dobre.
Takže sme hovorili o učení pod dohľadom, bez dozoru a posilňovaní, ale čo to je? Poďme ich preskúmať.
Učenie pod dohľadom, bez dozoru a posilňovanie
Učenie pod dohľadom
Pri učení pod dohľadom sa model AI vyvíja na základe poskytnutého vstupu a označenia, ktoré predstavuje predpokladaný výsledok. Na základe vstupov a výstupov model vytvorí mapovaciu rovnicu a pomocou tejto mapovacej rovnice predpovedá označenie vstupov v budúcnosti.
Povedzme, že potrebujeme vytvoriť model, ktorý dokáže rozlíšiť medzi psom a mačkou. Do modelu je vložených viacero fotografií mačiek a psov s označením, či ide o mačky alebo psy, aby sa model mohol trénovať.
Model sa snaží vytvoriť rovnicu, ktorá spája štítky na vstupných fotografiách s týmito obrázkami. Aj keď model nikdy predtým nevidel obrázok, po tréningu dokáže identifikovať, či ide o mačku alebo psa.
Učenie bez dozoru
Učenie bez dozoru zahŕňa trénovanie modelu AI iba na vstupoch bez ich označovania. Model rozdeľuje vstupné údaje do skupín so súvisiacimi charakteristikami.
Budúce označenie vstupu sa potom predpovedá v závislosti od toho, do akej miery sa jeho atribúty zhodujú s jednou z klasifikácií. Zoberme si situáciu, keď musíme rozdeliť skupinu červených a modrých guľôčok do dvoch kategórií.
Predpokladajme, že ostatné vlastnosti loptičiek sú identické, s výnimkou farby. Na základe toho, ako dokáže rozdeliť loptičky do dvoch tried, hľadá model vlastnosti, ktoré sa medzi loptičkami líšia.
Dva zhluky loptičiek – jedna modrá a jedna červená – sa vytvoria, keď sa loptičky rozdelia do dvoch skupín na základe ich odtieňa.
Posilňovacie učenie
Pri posilňovaní učenia sa model AI snaží maximalizovať celkový zisk tým, že koná tak dobre, ako je to možné za konkrétnych okolností. Spätná väzba na jeho predchádzajúce výsledky pomáha modelu učiť sa.
Zamyslite sa nad scenárom, keď robot dostane pokyn, aby si vybral trasu medzi bodmi A a B. Robot si najskôr vyberie jednu z dráh, pretože nemá žiadne predchádzajúce skúsenosti.
Robot dostáva informácie o trase, ktorou sa pohybuje, a získava z nej poznatky. Robot môže využiť vstup na vyriešenie problému, keď sa nabudúce stretne s podobnou okolnosťou.
Napríklad, ak si robot vyberie možnosť B a dostane odmenu, ako je pozitívna spätná väzba, tentoraz chápe, že musí zvoliť spôsob B, aby svoju odmenu zvýšil.
Teraz konečne to, na čo všetci čakáte, sú algoritmy.
Hlavné algoritmy strojového učenia
1. Lineárna regresia
Najjednoduchším prístupom strojového učenia, ktorý sa odchyľuje od učenia pod dohľadom, je lineárna regresia. So znalosťami z nezávislých premenných sa väčšinou využíva na riešenie regresných problémov a vytváranie predpovedí na spojitých závislých premenných.
Cieľom lineárnej regresie je nájsť najvhodnejšiu líniu, ktorá môže pomôcť pri predpovedaní výsledku pre kontinuálne závislé premenné. Ceny domov, vek a mzdy sú niektoré príklady nepretržitých hodnôt.
Model známy ako jednoduchá lineárna regresia používa priamku na výpočet asociácie medzi jednou nezávislou premennou a jednou závislou premennou. Vo viacnásobnej lineárnej regresii existujú viac ako dve nezávislé premenné.
Lineárny regresný model má štyri základné predpoklady:
- Linearita: Medzi X a strednou hodnotou Y existuje lineárne spojenie.
- Homoscedasticita: Pre každú hodnotu X je zvyškový rozptyl rovnaký.
- Nezávislosť: Pozorovania sú navzájom nezávislé, pokiaľ ide o nezávislosť.
- Normálnosť: Keď je X pevné, Y je normálne rozložené.
Lineárna regresia funguje obdivuhodne pre údaje, ktoré možno oddeliť pozdĺž čiar. Môže kontrolovať nadmerné prispôsobenie pomocou techník regularizácie, krížovej validácie a redukcie rozmerov. Existujú však prípady, keď je potrebné rozsiahle inžinierstvo funkcií, čo môže príležitostne viesť k nadmernej montáži a hluku.
2. Logistická regresia
Logistická regresia je ďalšou technikou strojového učenia, ktorá sa líši od učenia pod dohľadom. Jeho hlavné využitie je klasifikácia, pričom ho možno využiť aj pri regresných problémoch.
Logistická regresia sa používa na predpovedanie kategorickej závislej premennej pomocou informácií od nezávislých faktorov. Cieľom je klasifikovať výstupy, ktoré môžu byť len medzi 0 a 1.
Vážený súčet vstupov je spracovaný sigmoidnou funkciou, aktivačnou funkciou, ktorá konvertuje hodnoty medzi 0 a 1.
Základom logistickej regresie je odhad maximálnej pravdepodobnosti, metóda na výpočet parametrov predpokladaného rozdelenia pravdepodobnosti na základe konkrétnych pozorovaných údajov.
3. Rozhodovací strom
Ďalšou metódou strojového učenia, ktorá sa oddeľuje od učenia pod dohľadom, je rozhodovací strom. Pri problémoch s klasifikáciou aj regresiou možno použiť prístup rozhodovacieho stromu.
Tento rozhodovací nástroj, ktorý sa podobá stromu, používa vizuálne znázornenia na zobrazenie budúcich výsledkov akcií, nákladov a dôsledkov. Rozdelením údajov do samostatných častí je myšlienka analogická ľudskej mysli.
Dáta boli rozdelené do odlišných častí, ako sme ich mohli granulovať. Hlavným cieľom stromu rozhodovania je vytvoriť model tréningu, ktorý možno použiť na predpovedanie triedy cieľovej premennej. Chýbajúce hodnoty je možné spracovať automaticky pomocou rozhodovacieho stromu.
Neexistuje žiadna požiadavka na jednorazové kódovanie, fiktívne premenné alebo iné kroky predspracovania údajov. Je rigidná v tom zmysle, že je ťažké do nej pridať čerstvé údaje. Ak ste získali ďalšie označené údaje, mali by ste znova natrénovať strom pre celú množinu údajov.
V dôsledku toho sú rozhodovacie stromy zlou voľbou pre akúkoľvek aplikáciu, ktorá vyžaduje dynamickú zmenu modelu.
Na základe druhu cieľovej premennej sú rozhodovacie stromy rozdelené do dvoch typov:
- Kategorická premenná: Rozhodovací strom, v ktorom je cieľová premenná Kategorická.
- Spojitá premenná: Rozhodovací strom, v ktorom je cieľová premenná spojitá.
4. Náhodný les
Metóda náhodného lesa je ďalšou technikou strojového učenia a je to riadený algoritmus strojového učenia, ktorý sa vo veľkej miere používa pri problémoch s klasifikáciou a regresiou. Je to tiež stromová metóda, podobná rozhodovaciemu stromu.
Les stromov alebo veľa rozhodovacích stromov sa používa metódou náhodného lesa na úsudky. Pri manipulácii s klasifikačnými úlohami metóda náhodného lesa využívala kategorické premenné, zatiaľ čo regresné úlohy spracovávala s množinami údajov, ktoré obsahujú spojité premenné.
Súbor alebo zmiešanie mnohých modelov je to, čo robí metóda náhodného lesa, čo znamená, že predpovede sa robia pomocou skupiny modelov a nie iba jedného.
Kľúčovou výhodou náhodného lesa je možnosť použitia pre klasifikačné aj regresné problémy, ktoré tvoria väčšinu moderných systémov strojového učenia.
Ensemble používa dve rôzne stratégie:
- Vrecovanie: Týmto spôsobom sa vytvorí viac údajov pre tréningový súbor údajov. Toto sa robí, aby sa zmenšili odchýlky v prognózach.
- Posilňovanie je proces kombinovania slabých a silných žiakov vytváraním po sebe nasledujúcich modelov, ktorých výsledkom je konečný model s maximálnou presnosťou.
5. Naivný Bayes
Problém binárnej (dvojtriednej) a viactriednej klasifikácie možno vyriešiť pomocou techniky Naive Bayes. Keď je metóda vysvetlená pomocou binárnych alebo kategórií vstupných hodnôt, je najjednoduchšie ju pochopiť. Naivný Bayesov klasifikátor vychádza z predpokladu, že existencia jedného znaku v triede nemá žiadny vplyv na prítomnosť akýchkoľvek iných znakov.
Vyššie uvedený vzorec naznačuje:
- P(H): Pravdepodobnosť, že hypotéza H je správna. Predchádzajúca pravdepodobnosť sa označuje ako táto.
- P(E): Pravdepodobnosť dôkazov
- P(E|H): Pravdepodobnosť, že hypotézu podporujú dôkazy.
- P(H|E): Pravdepodobnosť, že hypotéza je pravdivá vzhľadom na dôkazy.
Naive Bayesov klasifikátor by pri určovaní pravdepodobnosti určitého výsledku bral do úvahy každú z týchto charakteristík jednotlivo, aj keď sú tieto atribúty navzájom prepojené. Naivný Bayesovský model sa dá jednoducho zostaviť a je efektívny pre veľké súbory údajov.
Je známe, že funguje lepšie ako aj tie najzložitejšie kategorizačné techniky, pričom je základný. Je to zbierka algoritmov, ktoré sú založené skôr na Bayesovej vete, než na jedinej metóde.
6. K-Najbližší susedia
Technika K-najbližších susedov (kNN) je podmnožinou kontrolovaného strojového učenia, ktoré možno použiť na riešenie problémov s klasifikáciou a regresiou. Algoritmus KNN predpokladá, že porovnateľné objekty možno nájsť v blízkosti.
Spomínam si na to ako na stretnutie rovnako zmýšľajúcich jednotlivcov. kNN využíva myšlienku podobnosti medzi inými dátovými bodmi pomocou blízkosti, blízkosti alebo vzdialenosti. Na označenie neviditeľných údajov na základe najbližších označených pozorovateľných údajových bodov sa na určenie vzdialenosti medzi bodmi v grafe používa matematická metóda.
Musíte určiť vzdialenosť medzi dátovými bodmi, aby ste mohli identifikovať najbližšie porovnateľné body. Na tento účel možno použiť merania vzdialenosti, ako je Euklidovská vzdialenosť, Hammingova vzdialenosť, Manhattanská vzdialenosť a Minkowského vzdialenosť. K je známe ako číslo najbližšieho suseda a často je to nepárne číslo.
KNN možno použiť na klasifikačné a regresné problémy. Predpoveď urobená, keď sa KNN používa na regresné problémy, je založená na priemere alebo mediáne K-najpodobnejších výskytov.
Výsledok klasifikačného algoritmu na základe KNN možno určiť ako triedu s najvyššou frekvenciou spomedzi K najpodobnejších výskytov. Každá inštancia v podstate hlasuje za svoju triedu a predpoveď patrí triede, ktorá získa najviac hlasov.
7. K-znamená
Je to technika učenia bez dozoru, ktorá rieši problémy klastrovania. Súbory údajov sú rozdelené do určitého počtu klastrov – nazvime to K – takým spôsobom, že dátové body každého klastra sú homogénne a odlišné od bodov v ostatných klastroch.
Metodológia klastrovania K-means:
- Pre každý klaster algoritmus K-means vyberie k ťažísk alebo bodov.
- S najbližšími centroidmi alebo K klastrami tvorí každý dátový bod zhluk.
- Teraz sa vyrábajú nové centroidy v závislosti od už prítomných členov klastra.
- Najbližšia vzdialenosť pre každý údajový bod sa vypočíta pomocou týchto aktualizovaných ťažísk. Tento proces sa opakuje, kým sa centroidy nezmenia.
Je to rýchlejšie, spoľahlivejšie a jednoduchšie na pochopenie. Ak sa vyskytnú problémy, prispôsobivosť k-means uľahčuje úpravy. Keď sú súbory údajov odlišné alebo dobre izolované od seba, výsledky sú najlepšie. Nemôže spravovať nestále údaje alebo odľahlé hodnoty.
8. Podpora vektorových strojov
Pri použití techniky SVM na klasifikáciu údajov sa nespracované údaje zobrazujú ako bodky v n-rozmernom priestore (kde n je počet funkcií, ktoré máte). Dáta sa potom dajú ľahko klasifikovať, pretože hodnota každého prvku je potom spojená s konkrétnou súradnicou.
Ak chcete oddeliť údaje a umiestniť ich do grafu, použite čiary známe ako klasifikátory. Tento prístup vykresľuje každý údajový bod ako bod v n-rozmernom priestore, kde n je počet prvkov, ktoré máte, a hodnota každého prvku je špecifická hodnota súradníc.
Teraz nájdeme riadok, ktorý rozdeľuje údaje do dvoch súborov údajov, ktoré boli kategorizované odlišne. Vzdialenosti od najbližších bodov v každej z dvoch skupín budú najďalej od seba pozdĺž tejto čiary.
Keďže dva najbližšie body sú tie, ktoré sú najvzdialenejšie od čiary vo vyššie uvedenom príklade, čiara, ktorá rozdeľuje údaje do dvoch skupín, ktoré boli kategorizované odlišne, je stredná čiara. Náš klasifikátor je tento riadok.
9. Zníženie rozmerov
Použitím prístupu redukcie rozmerov môžu mať tréningové dáta menej vstupných premenných. Zjednodušene povedané, odkazuje na proces zmenšovania veľkosti vašej sady funkcií. Predstavme si, že vaša množina údajov má 100 stĺpcov; redukcia rozmerov zníži toto množstvo na 20 stĺpcov.
Model sa automaticky stáva sofistikovanejším a s rastúcim počtom funkcií má väčšie riziko prepasovania. Najväčším problémom pri práci s údajmi vo väčších dimenziách je to, čo je známe ako „prekliatie dimenzionality“, ku ktorému dochádza, keď vaše údaje obsahujú nadmerné množstvo charakteristík.
Na zníženie rozmerov možno použiť nasledujúce prvky:
- Na nájdenie a výber príslušných charakteristík sa používa výber funkcií.
- Pomocou už existujúcich funkcií vytvára inžinierstvo funkcií manuálne nové funkcie.
záver
Strojové učenie bez dozoru alebo pod dohľadom je možné. Vyberte si učenie pod dohľadom, ak sú vaše údaje menej bohaté a dobre označené na školenie.
Veľké súbory údajov by často fungovali a produkovali lepšie výsledky pomocou učenia bez dozoru. Hlboké učenie metódy sú najlepšie, ak máte rozsiahly súbor údajov, ktorý je ľahko dostupný.
Posilnenie učenia a hlboké posilnenie učenia sú niektoré témy, ktoré ste študovali. Charakteristiky, použitie a obmedzenia neurónových sietí sú vám teraz jasné. V neposlednom rade ste zvážili možnosti pre rôzne programovacie jazyky, IDE a platformy pri vytváraní modely strojového učenia.
Ďalšia vec, ktorú musíte urobiť, je začať študovať a používať každý z nich strojové učenie prístup. Aj keď je téma široká, každá téma sa dá pochopiť za pár hodín, ak sa zameriate na jej hĺbku. Každý subjekt stojí samostatne od ostatných.
Musíte premýšľať o jednom probléme naraz, študovať ho, uviesť ho do praxe a použiť jazyk podľa vášho výberu na implementáciu algoritmu(ov).
Nechaj odpoveď