Obsah[Skrýt][Ukázat]
Svět se rychle mění díky umělé inteligenci a strojovému učení, které má dopad na každý aspekt našeho každodenního života.
Od hlasových asistentů, kteří používají NLP a strojové učení k rezervování schůzek, vyhledávání událostí v našem kalendáři a přehrávání hudby až po zařízení, která jsou tak přesná, že dokážou předvídat naše potřeby dříve, než o nich vůbec uvážíme.
Počítače mohou hrát šachy, dělat operace a vyvinout se v chytřejší stroje, které se více podobají lidem, pomocí algoritmů strojového učení.
Nacházíme se v době neustálého technologického pokroku, a když vidíme, jak se počítače postupem času vyvíjely, můžeme předpovídat, co se stane v budoucnosti.
Demokratizace počítačových nástrojů a metod je jedním z klíčových aspektů této revoluce, který vyniká. Datoví vědci během posledních pěti let vytvořili výkonné počítače shromažďující data bez námahy implementací nejmodernějších metodologií. Výsledky jsou ohromující.
V tomto příspěvku se na to podíváme zblízka strojové učení algoritmy a všechny jejich varianty.
Co jsou tedy algoritmy strojového učení?
Přístup, který používá systém AI k provedení svého úkolu – obecně předpovídání výstupních hodnot z daných vstupních dat – je známý jako algoritmus strojového učení.
Algoritmus strojového učení je proces, který využívá data a používá se k vytváření modelů strojového učení, které jsou připraveny k produkci. Pokud je strojové učení vlakem, který vykonává práci, pak jsou algoritmy strojového učení lokomotivami, které pohybují dál.
Nejlepší přístup strojového učení, který lze využít, bude určen obchodním problémem, který se pokoušíte vyřešit, typem datové sady, kterou používáte, a zdroji, které máte k dispozici.
Algoritmy strojového učení jsou ty, které přeměňují soubor dat na model. V závislosti na druhu problému, na který se pokoušíte odpovědět, dostupném výpočetním výkonu a typu dat, která máte, mohou algoritmy učení pod dohledem, bez dozoru nebo zesílení fungovat dobře.
Takže jsme mluvili o učení pod dohledem, bez dozoru a posilování, ale co to je? Pojďme je prozkoumat.
Učení pod dohledem, bez dozoru a posilování
Dozorované učení
Při učení pod dohledem je model umělé inteligence vyvinut na základě poskytnutého vstupu a označení, které představuje předpokládaný výsledek. Na základě vstupů a výstupů model vytvoří mapovací rovnici a pomocí této mapovací rovnice předpovídá označení vstupů v budoucnu.
Řekněme, že potřebujeme vytvořit model, který dokáže rozlišit psa a kočku. Do modelu je vloženo několik fotografií koček a psů se štítky, které označují, zda se jedná o kočky nebo psy, aby bylo možné model trénovat.
Model se snaží vytvořit rovnici vztahující popisky na vstupních fotografiích k těmto obrázkům. I když model nikdy předtím obrázek neviděl, po tréninku dokáže rozpoznat, zda jde o kočku nebo psa.
Učení bez dozoru
Učení bez dozoru zahrnuje trénování modelu umělé inteligence pouze na vstupech bez jejich označování. Model rozděluje vstupní data do skupin se souvisejícími charakteristikami.
Budoucí štítek vstupu se pak předpovídá v závislosti na tom, jak blízko jeho atributy odpovídají jedné z klasifikací. Zvažte situaci, kdy musíme rozdělit skupinu červených a modrých kuliček do dvou kategorií.
Předpokládejme, že ostatní vlastnosti kuliček jsou identické, s výjimkou barvy. Na základě toho, jak dokáže rozdělit koule do dvou tříd, hledá model vlastnosti, které se mezi koulemi liší.
Dva shluky kuliček – jedna modrá a jedna červená – se vytvoří, když se koule rozdělí do dvou skupin na základě jejich odstínu.
Posílení učení
Při posilování učení se model umělé inteligence snaží maximalizovat celkový zisk tím, že jedná tak dobře, jak je to možné za konkrétních okolností. Zpětná vazba na jeho předchozí výsledky pomáhá modelu učit se.
Přemýšlejte o scénáři, kdy je robot instruován, aby si vybral trasu mezi body A a B. Robot si nejprve vybere jednu z tras, protože nemá žádné předchozí zkušenosti.
Robot dostává informace o trase, kterou se pohybuje, a získává z ní znalosti. Robot může využít vstup k vyřešení problému, až se příště setká s podobnou situací.
Pokud si například robot vybere možnost B a obdrží odměnu, například pozitivní zpětnou vazbu, tentokrát chápe, že musí zvolit způsob B, aby zvýšil svou odměnu.
Nyní konečně to, na co všichni čekáte, jsou algoritmy.
Hlavní algoritmy strojového učení
1. Lineární regrese
Nejjednodušším přístupem strojového učení, který se odchyluje od učení pod dohledem, je lineární regrese. Se znalostmi z nezávislých proměnných se většinou využívá k řešení regresních problémů a vytváření predikcí na spojitých závislých proměnných.
Cílem lineární regrese je nalézt nejvhodnější linii, která může pomoci při predikci výsledku pro spojité závislé proměnné. Ceny domů, věk a mzdy jsou některé příklady spojitých hodnot.
Model známý jako jednoduchá lineární regrese používá přímku k výpočtu asociace mezi jednou nezávislou proměnnou a jednou závislou proměnnou. Ve vícenásobné lineární regresi existuje více než dvě nezávislé proměnné.
Lineární regresní model má čtyři základní předpoklady:
- Linearita: Mezi X a střední hodnotou Y existuje lineární spojení.
- Homoscedasticita: Pro každou hodnotu X je zbytkový rozptyl stejný.
- Nezávislost: Pozorování jsou z hlediska nezávislosti na sobě nezávislá.
- Normalita: Když je X pevné, Y je normálně rozděleno.
Lineární regrese funguje obdivuhodně pro data, která lze oddělit podél čar. Může řídit nadměrné vybavení pomocí regularizace, křížové validace a technik redukce rozměrů. Existují však případy, kdy je vyžadováno rozsáhlé inženýrství funkcí, což může občas vést k nadměrnému vybavení a hluku.
2. Logistická regrese
Logistická regrese je další technika strojového učení, která se odchyluje od učení pod dohledem. Jeho hlavní použití je klasifikace, přičemž jej lze využít i pro regresní problémy.
Logistická regrese se používá k předpovědi kategorické závislé proměnné pomocí informací z nezávislých faktorů. Cílem je klasifikovat výstupy, které mohou spadat pouze mezi 0 a 1.
Vážený součet vstupů je zpracován sigmoidní funkcí, aktivační funkcí, která převádí hodnoty mezi 0 a 1.
Základem logistické regrese je odhad maximální věrohodnosti, metoda pro výpočet parametrů předpokládaného rozdělení pravděpodobnosti na základě konkrétních pozorovaných dat.
3. Rozhodovací strom
Další metodou strojového učení, která se odštěpuje od učení pod dohledem, je rozhodovací strom. Pro otázky klasifikace i regrese lze použít přístup rozhodovacího stromu.
Tento rozhodovací nástroj, který připomíná strom, používá vizuální reprezentace k zobrazení potenciálních výsledků akcí, nákladů a dopadů. Rozdělením dat do samostatných částí je myšlenka analogická lidské mysli.
Data byla rozdělena do odlišných částí, jak jsme je mohli granulovat. Hlavním cílem rozhodovacího stromu je vytvořit trénovací model, který lze použít k předpovědi třídy cílové proměnné. Chybějící hodnoty lze automaticky zpracovat pomocí rozhodovacího stromu.
Neexistuje žádný požadavek na jednorázové kódování, fiktivní proměnné nebo jiné kroky předběžného zpracování dat. Je rigidní v tom smyslu, že je obtížné do něj přidávat nová data. Pokud jste získali další označená data, měli byste znovu natrénovat strom na celé datové sadě.
V důsledku toho jsou rozhodovací stromy špatnou volbou pro jakoukoli aplikaci, která vyžaduje dynamickou změnu modelu.
Na základě druhu cílové proměnné jsou rozhodovací stromy rozděleny do dvou typů:
- Kategorická proměnná: Rozhodovací strom, ve kterém je cílová proměnná kategorická.
- Spojitá proměnná: Rozhodovací strom, ve kterém je cílová proměnná spojitá.
4. Náhodný les
Metoda náhodného lesa je další technika strojového učení a je to kontrolovaný algoritmus strojového učení, který se široce používá v otázkách klasifikace a regrese. Je to také stromová metoda, podobná rozhodovacímu stromu.
Les stromů nebo mnoho rozhodovacích stromů se používá metodou náhodného lesa k rozhodování. Při zpracovávání klasifikačních úloh metoda náhodného lesa používala kategorické proměnné, zatímco zpracovávala regresní úlohy s datovými sadami, které obsahují spojité proměnné.
Soubor nebo smíchání mnoha modelů je to, co dělá metoda náhodného lesa, což znamená, že předpovědi jsou prováděny pomocí skupiny modelů, nikoli pouze pomocí jednoho.
Klíčovou výhodou náhodného lesa je možnost použití pro klasifikační i regresní problémy, které tvoří většinu moderních systémů strojového učení.
Ensemble používá dvě různé strategie:
- Bagging: Tímto způsobem se vytvoří více dat pro trénovací datovou sadu. Aby se zmenšily odchylky v předpovědích, provádí se to.
- Posilování je proces kombinování slabých studentů se silnými studenty vytvářením postupných modelů, jejichž výsledkem je konečný model s maximální přesností.
5. Naivní Bayes
Problém binární (dvoutřídní) a vícetřídní klasifikace lze vyřešit pomocí techniky Naive Bayes. Když je metoda vysvětlena pomocí binárních nebo vstupních hodnot kategorií, je nejjednodušší ji pochopit. Naivní Bayesův klasifikátor předpokládá, že existence jednoho prvku ve třídě nemá žádný vliv na přítomnost jakýchkoli jiných prvků.
Výše uvedený vzorec znamená:
- P(H): Pravděpodobnost, že hypotéza H je správná. Předcházející pravděpodobnost se nazývá tato.
- P(E): Pravděpodobnost důkazů
- P(E|H): Pravděpodobnost, že je hypotéza podpořena důkazy.
- P(H|E): Pravděpodobnost, že je hypotéza pravdivá, vzhledem k důkazům.
Naivní Bayesův klasifikátor by při určování pravděpodobnosti určitého výsledku vzal v úvahu každou z těchto charakteristik jednotlivě, i když jsou tyto atributy vzájemně propojeny. Naivní bayesovský model je jednoduchý na konstrukci a efektivní pro velké datové sady.
Je známo, že funguje lépe než i ty nejsložitější kategorizační techniky a přitom je základní. Je to sbírka algoritmů, které jsou všechny založeny na Bayesově teorému, spíše než na jedné metodě.
6. K-Nejbližší sousedé
Technika K-nearest sousedů (kNN) je podmnožinou kontrolovaného strojového učení, kterou lze použít k řešení problémů s klasifikací a regresí. Algoritmus KNN předpokládá, že srovnatelné objekty lze nalézt poblíž.
Pamatuji si to jako shromáždění stejně smýšlejících jedinců. kNN využívá myšlenku podobnosti mezi jinými datovými body pomocí blízkosti, blízkosti nebo vzdálenosti. Aby bylo možné označit neviditelná data na základě nejbližších označených pozorovatelných datových bodů, používá se matematická metoda k určení vzdálenosti mezi body v grafu.
Musíte určit vzdálenost mezi datovými body, abyste mohli identifikovat nejbližší srovnatelná místa. K tomu lze použít měření vzdálenosti, jako je Euklidovská vzdálenost, Hammingova vzdálenost, Manhattanská vzdálenost a Minkowského vzdálenost. K je známé jako číslo nejbližšího souseda a často je to liché číslo.
KNN lze aplikovat na klasifikační a regresní problémy. Předpověď učiněná při použití KNN k regresním problémům je založena na průměru nebo mediánu K-nejpodobnějších výskytů.
Výsledek klasifikačního algoritmu založeného na KNN lze určit jako třídu s nejvyšší frekvencí mezi K nejpodobnějšími výskyty. Každá instance v podstatě hlasuje pro svou třídu a předpověď patří třídě, která obdrží nejvíce hlasů.
7. K-prostředky
Je to technika učení bez dozoru, která řeší problémy se shlukováním. Soubory dat jsou rozděleny do určitého počtu shluků – říkejme tomu K – takovým způsobem, že datové body každého shluku jsou homogenní a odlišné od bodů v ostatních shlucích.
Metodika shlukování K-means:
- Pro každý shluk vybere algoritmus K-means k centroidů neboli bodů.
- S nejbližšími centroidy nebo K shluky tvoří každý datový bod shluk.
- Nyní se vytvářejí nové centroidy v závislosti na již přítomných členech klastru.
- Nejbližší vzdálenost pro každý datový bod se vypočítá pomocí těchto aktualizovaných těžišť. Dokud se těžiště nezmění, tento proces se opakuje.
Je rychlejší, spolehlivější a jednodušší na pochopení. Pokud se vyskytnou problémy, přizpůsobivost k-means usnadňuje úpravy. Když jsou datové sady odlišné nebo dobře izolované od sebe, výsledky jsou nejlepší. Nemůže spravovat nepravidelná data nebo odlehlé hodnoty.
8. Podpora vektorových strojů
Při použití techniky SVM ke klasifikaci dat jsou nezpracovaná data zobrazena jako tečky v n-rozměrném prostoru (kde n je počet funkcí, které máte). Data pak lze snadno klasifikovat, protože hodnota každého prvku je pak spojena s konkrétní souřadnicí.
Chcete-li oddělit data a umístit je do grafu, použijte čáry známé jako klasifikátory. Tento přístup vykresluje každý datový bod jako bod v n-rozměrném prostoru, kde n je počet prvků, které máte, a hodnota každého prvku je specifická hodnota souřadnic.
Nyní najdeme řádek, který rozděluje data na dvě sady dat, které byly kategorizovány odlišně. Vzdálenosti od nejbližších bodů v každé ze dvou skupin budou na této přímce nejdále od sebe.
Protože dva nejbližší body jsou ty, které jsou nejvzdálenější od čáry ve výše uvedeném příkladu, čára, která rozděluje data do dvou skupin, které byly kategorizovány odlišně, je prostřední čára. Náš klasifikátor je tento řádek.
9. Redukce rozměrů
Při použití přístupu redukce rozměrů mohou mít trénovací data méně vstupních proměnných. Jednoduše řečeno, odkazuje na proces zmenšování velikosti vaší sady funkcí. Představme si, že vaše datová sada má 100 sloupců; snížení rozměrů sníží toto množství na 20 sloupců.
Model se automaticky stává sofistikovanějším a s rostoucím počtem funkcí je u něj větší riziko přefitování. Největší problém při práci s daty ve větších dimenzích je to, co je známé jako „prokletí dimenzionality“, ke kterému dochází, když vaše data obsahují nadměrné množství charakteristik.
K redukci rozměrů lze použít následující prvky:
- K nalezení a výběru příslušných charakteristik se používá výběr vlastností.
- Pomocí již existujících prvků vytváří inženýrství prvků ručně nové prvky.
Proč investovat do čističky vzduchu?
Strojové učení bez dohledu nebo pod dohledem je možné. Pokud jsou vaše data méně bohatá a dobře označená pro školení, zvolte řízené učení.
Velké soubory dat by často fungovaly a poskytovaly lepší výsledky pomocí učení bez dozoru. Hluboké učení metody jsou nejlepší, pokud máte rozsáhlý soubor dat, který je snadno dostupný.
Posílení učení a hluboké posílení učení jsou některá témata, která jste studovali. Vlastnosti, použití a omezení neuronových sítí jsou vám nyní jasné. V neposlední řadě jste při vytváření vlastních modely strojového učení.
Další věc, kterou musíte udělat, je začít studovat a používat každý z nich strojové učení přístup. I když je téma široké, každé téma lze pochopit během několika hodin, pokud se zaměříte na jeho hloubku. Každý subjekt stojí samostatně od ostatních.
Musíte přemýšlet o jednom problému najednou, studovat ho, uvést do praxe a použít jazyk podle svého výběru k implementaci algoritmu(ů).
Napsat komentář