Úvod do neurónových sietí

Obsah[Skryť][Šou]

Čo je neurónová sieť?
Ako fungujú neurónové siete?
Typy neurónových sietí+-
použitie
výhody
Nevýhody
záver

Umelá inteligencia (AI) bola pôvodne považovaná za vzdialený sen, technológiu budúcnosti, ale už to tak nie je.

To, čo bolo kedysi témou výskumu, teraz exploduje v reálnom svete. AI sa teraz nachádza na rôznych miestach vrátane vášho pracoviska, školy, bankovníctva, nemocníc a dokonca aj vášho telefónu.

Sú to oči samoriadiacich vozidiel, hlasy Siri a Alexa, mysle za predpovedaním počasia, ruky za roboticky asistovanou chirurgiou a ďalšie.

Umelá inteligencia (AI) sa stáva bežnou súčasťou moderného života. V posledných rokoch sa AI stala hlavným hráčom v širokej škále IT technológií.

Nakoniec, neurónovú sieť používa AI na učenie sa nových vecí.

Dnes sa teda dozvieme o neurónových sieťach, ako to funguje, ich typoch, aplikáciách a oveľa viac.

Čo je neurónová sieť?

In strojové učenie, neurónová sieť je softvérovo naprogramovaná sieť umelých neurónov. Snaží sa napodobňovať ľudský mozog tým, že má množstvo vrstiev „neurónov“, ktoré sú podobné neurónom v našom mozgu.

Prvá vrstva neurónov bude prijímať fotografie, video, zvuk, text a ďalšie vstupy. Tieto údaje prechádzajú všetkými úrovňami, pričom výstup jednej vrstvy prúdi do ďalšej. To je rozhodujúce pre najťažšie úlohy, ako je spracovanie prirodzeného jazyka pre strojové učenie.

V iných prípadoch je však vhodnejšie zamerať sa na kompresiu systému, aby sa zmenšila veľkosť modelu pri zachovaní presnosti a účinnosti. Orezanie neurónovej siete je kompresná metóda, ktorá zahŕňa odstránenie závaží z naučeného modelu. Predstavte si neurónovú sieť s umelou inteligenciou, ktorá bola vycvičená na rozlíšenie ľudí od zvierat.

Neural Network

Obraz bude rozdelený na svetlé a tmavé časti prvou vrstvou neurónov. Tieto údaje sa prenesú do nasledujúcej vrstvy, ktorá určí, kde sú okraje.

Ďalšia vrstva sa pokúsi rozpoznať formy, ktoré vytvorila kombinácia hrán. Podľa údajov, na ktorých boli trénované, údaje prejdú cez množstvo vrstiev podobným spôsobom, aby sa zistilo, či je obrázok, ktorý ste prezentovali, človeka alebo zvieraťa.

Keď sú dáta odovzdané do neurónovej siete, začne ich spracovávať. Potom sa údaje spracujú prostredníctvom úrovní, aby sa dosiahol požadovaný výsledok. Neurónová sieť je stroj, ktorý sa učí zo štruktúrovaného vstupu a zobrazuje výsledky. V neurónových sieťach môžu prebiehať tri typy učenia:

Riadené učenie – Vstupy a výstupy sa dávajú do algoritmov pomocou označených údajov. Potom, čo sa naučili analyzovať údaje, predpovedajú zamýšľaný výsledok.
Učenie bez dozoru – ANN sa učí bez pomoci človeka. Neexistujú žiadne označené údaje a o výstupe rozhodujú vzory nájdené vo výstupných údajoch.
Posilňovacie učenie je, keď sa sieť učí zo spätnej väzby, ktorú dostáva.

Ako fungujú neurónové siete?

Umelé neuróny sa používajú v neurónových sieťach, čo sú sofistikované systémy. Umelé neuróny, tiež známe ako perceptróny, sa skladajú z nasledujúcich komponentov:

Vstup
Váha
Predsudok
Aktivačná funkcia
Výkon

Vrstvy neurónov, ktoré tvoria neurónové siete. Neurónová sieť pozostáva z troch vrstiev:

Vstupná vrstva
Skrytá vrstva
Výstupná vrstva

Údaje vo forme číselnej hodnoty sa odosielajú do vstupnej vrstvy. Skryté vrstvy siete sú tie, ktoré robia najviac výpočtov. Výstupná vrstva v neposlednom rade predpovedá výsledok. Neuróny navzájom dominujú v neurónovej sieti. Na vytvorenie každej vrstvy sa používajú neuróny. Údaje sú smerované do skrytej vrstvy potom, čo ich získa vstupná vrstva.

Na každý vstup sa použijú váhy. V rámci skrytých vrstiev neurónovej siete je váha hodnotou, ktorá prekladá prichádzajúce dáta. Váhy fungujú vynásobením vstupných údajov hodnotou váhy vo vstupnej vrstve.

Potom spustí hodnotu prvej skrytej vrstvy. Vstupné údaje sa transformujú a prenesú do druhej vrstvy cez skryté vrstvy. Výstupná vrstva je zodpovedná za generovanie konečného výsledku. Vstupy a váhy sa vynásobia a výsledok sa doručí neurónom skrytej vrstvy ako súčet. Každému neurónu je pridelená odchýlka. Na výpočet súčtu každý neurón spočíta vstupy, ktoré dostane.

Práca s neurónovou sieťou

Potom hodnota prechádza cez aktivačnú funkciu. Výsledok aktivačnej funkcie určuje, či je neurón aktivovaný alebo nie. Keď je neurón aktívny, posiela informácie do ostatných vrstiev. Údaje sa vytvárajú v sieti, kým neurón dosiahne výstupnú vrstvu pomocou tejto metódy. Dopredná propagácia je na to iný výraz.

Technika dodávania údajov do vstupného uzla a získavanie výstupu cez výstupný uzol je známa ako dopredné šírenie. Keď skrytá vrstva prijme vstupné dáta, dôjde k šíreniu dopredného signálu. Ten je spracovaný podľa aktivačnej funkcie a následne odovzdaný na výstup.

Výsledok premieta neurón vo výstupnej vrstve s najväčšou pravdepodobnosťou. K spätnému šíreniu dochádza, keď je výstup nesprávny. Váhy sú inicializované pre každý vstup pri vytváraní neurónovej siete. Spätné šírenie je proces opätovného nastavenia váh každého vstupu, aby sa znížili chyby a poskytol presnejší výstup.

Typy neurónových sietí

1. Perceptrón

Model perceptrónu Minsky-Papert je jedným z najjednoduchších a najstarších modelov neurónov. Je to najmenšia jednotka neurónovej siete, ktorá vykonáva určité výpočty s cieľom objaviť charakteristiky alebo business intelligence v prichádzajúcich dátach. Na získanie konečného výsledku sa použijú vážené vstupy a použije sa aktivačná funkcia. TLU (threshold logic unit) je iný názov pre perceptrón.

perceptron

Perceptron je binárny klasifikátor, ktorý je riadeným vzdelávacím systémom, ktorý rozdeľuje údaje do dvoch skupín. Logické brány ako AND, OR a NAND možno implementovať pomocou perceptrónov.

2. Feed-Forward neurónová sieť

Najzákladnejšia verzia neurónových sietí, v ktorej vstupné dáta prúdia výlučne jedným smerom, prechádzajú cez umelé neurónové uzly a vystupujú cez výstupné uzly. Vstupné a výstupné vrstvy sú prítomné na miestach, kde môžu alebo nemusia byť prítomné skryté vrstvy. Na základe toho ich možno charakterizovať ako jednovrstvovú alebo viacvrstvovú doprednú neurónovú sieť.

Počet použitých vrstiev je určený zložitosťou funkcie. Šíri sa dopredu len jedným smerom a nešíri sa dozadu. Tu zostávajú hmotnosti konštantné. Vstupy sa vynásobia hmotnosťou, aby sa naplnila aktivačná funkcia. Používa sa na to funkcia aktivácie klasifikácie alebo funkcia aktivácie krokov.

3. Viacvrstvový perceptrón

Úvod do sofistikovaných neurónové siete, v ktorom sú vstupné dáta smerované cez mnoho vrstiev umelých neurónov. Je to úplne prepojená neurónová sieť, pretože každý uzol je spojený so všetkými neurónmi v nasledujúcej vrstve. Vo vstupnej a výstupnej vrstve je prítomných viacero skrytých vrstiev, tj aspoň tri alebo viac vrstiev.

Viacvrstvový perceptrón

Má obojsmerné šírenie, čo znamená, že sa môže šíriť dopredu aj dozadu. Vstupy sa vynásobia váhami a odošlú do aktivačnej funkcie, kde sa menia pomocou spätného šírenia, aby sa minimalizovala strata.

Váhy sú strojovo naučené hodnoty z Neurónových sietí, zjednodušene povedané. V závislosti od rozdielu medzi očakávanými výstupmi a tréningovými vstupmi sa samy upravujú. Softmax sa používa ako funkcia aktivácie výstupnej vrstvy po nelineárnych aktivačných funkciách.

4. Konvolučná neurónová sieť

Na rozdiel od tradičného dvojrozmerného poľa má konvolučná neurónová sieť trojrozmernú konfiguráciu neurónov. Prvá vrstva je známa ako konvolučná vrstva. Každý neurón v konvolučnej vrstve spracováva informácie iba z obmedzenej časti zorného poľa. Podobne ako filter sa vstupné funkcie prijímajú v dávkovom režime.

Sieť rozumie obrázkom v sekciách a môže vykonať tieto akcie niekoľkokrát, aby dokončila celé spracovanie obrazu.

Konvolučná neurónová sieť

Počas spracovania sa obraz skonvertuje z RGB alebo HSI do odtieňov sivej. Ďalšie odchýlky v hodnote pixelov pomôžu pri detekcii hrán a obrázky možno triediť do niekoľkých skupín. K jednosmernému šíreniu dochádza, keď CNN obsahuje jednu alebo viac konvolučných vrstiev, po ktorých nasleduje združovanie, a k obojsmernému šíreniu dochádza, keď je výstup konvolučnej vrstvy odoslaný do plne pripojenej neurónovej siete na klasifikáciu obrazu.

Na extrahovanie určitých prvkov obrázka sa používajú filtre. V MLP sú vstupy vážené a dodávané do aktivačnej funkcie. RELU sa používa pri konvolúcii, zatiaľ čo MLP využíva nelineárnu aktivačnú funkciu, po ktorej nasleduje softmax. Pri rozpoznávaní obrázkov a videa, sémantickej analýze a detekcii parafráz poskytujú konvolučné neurónové siete vynikajúce výsledky.

5. Radiálna sieť predpätia

Za vstupným vektorom nasleduje vrstva neurónov RBF a výstupná vrstva s jedným uzlom pre každú kategóriu v sieti radiálnych základných funkcií. Vstup je klasifikovaný porovnaním s dátovými bodmi z trénovacej sady, kde každý neurón udržiava prototyp. Toto je jeden z príkladov tréningovej sady.

Radiálna predpojatá sieť

Každý neurón vypočítava euklidovskú vzdialenosť medzi vstupom a jeho prototypom, keď je potrebné klasifikovať nový vstupný vektor [n-rozmerný vektor, ktorý sa pokúšate kategorizovať]. Ak máme dve triedy, triedu A a triedu B, nový vstup, ktorý sa má kategorizovať, je podobný prototypom triedy A ako prototypom triedy B.

V dôsledku toho môže byť označený alebo kategorizovaný ako trieda A.

6. Rekurentná neurónová sieť

Opakujúce sa neurónové siete sú navrhnuté tak, aby ukladali výstup vrstvy a potom ho privádzali späť do vstupu, aby pomohli predpovedať výsledok vrstvy. Dopredu neurónové sieť je zvyčajne počiatočná vrstva, po ktorej nasleduje vrstva rekurentnej neurónovej siete, kde si pamäťová funkcia pamätá časť informácií, ktoré mala v predchádzajúcom časovom kroku.

Rekurentná neurónová sieť

Tento scenár využíva dopredné šírenie. Šetrí dáta, ktoré budú potrebné v budúcnosti. V prípade, že je predpoveď nesprávna, na vykonanie menších úprav sa použije rýchlosť učenia. Výsledkom je, že ako postupuje spätné šírenie, bude čoraz presnejšie.

použitie

Neurónové siete sa používajú na riešenie problémov s údajmi v rôznych disciplínach; niektoré príklady sú uvedené nižšie.

Facial Recognition – Facial Recognition Solutions slúžia ako účinné systémy sledovania. Systémy rozpoznávania spájajú digitálne fotografie s ľudskými tvárami. Používajú sa v kanceláriách na selektívny vstup. Systémy teda overujú ľudskú tvár a porovnávajú ju so zoznamom ID uložených v ich databáze.
Predikcia akcií – Investície sú vystavené trhovým rizikám. Na extrémne volatilnom akciovom trhu je prakticky ťažké predvídať budúci vývoj. Pred neurónovými sieťami boli neustále sa meniace býčie a medvedie fázy nepredvídateľné. Ale čo všetko zmenilo? Samozrejme, hovoríme o neurónových sieťach... Multilayer Perceptron MLP (typ dopredného systému umelej inteligencie) sa používa na vytvorenie úspešnej prognózy akcií v reálnom čase.
Sociálne siete – Bez ohľadu na to, ako banálne to môže znieť, sociálne médiá zmenili všednú cestu existencie. Správanie používateľov sociálnych médií sa študuje pomocou umelých neurónových sietí. Pre konkurenčnú analýzu sa údaje dodané denne prostredníctvom virtuálnych interakcií hromadia a skúmajú. Akcie používateľov sociálnych médií replikujú neurónové siete. Správanie jednotlivcov môže byť spojené so vzormi míňania ľudí po analýze údajov prostredníctvom sietí sociálnych médií. Dáta z aplikácií sociálnych médií sa ťažia pomocou Multilayer Perceptron ANN.
Zdravotná starostlivosť – Jednotlivci v dnešnom svete využívajú výhody technológií v zdravotníctve. V zdravotníctve sa konvolučné neurónové siete používajú na detekciu röntgenových lúčov, CT skenovanie a ultrazvuk. Lekárske zobrazovacie údaje získané z vyššie uvedených testov sa vyhodnocujú a vyhodnocujú pomocou modelov neurónových sietí, keďže CNN sa používa pri spracovaní obrazu. Pri vývoji systémov rozpoznávania hlasu sa využíva aj rekurentná neurónová sieť (RNN).
Weather Report – Pred implementáciou umelej inteligencie neboli projekcie meteorologického oddelenia nikdy presné. Predpoveď počasia sa vykonáva hlavne na predpovedanie poveternostných podmienok, ktoré nastanú v budúcnosti. Predpovede počasia sa využívajú na predvídanie pravdepodobnosti prírodných katastrof v modernom období. Predpoveď počasia sa vykonáva pomocou viacvrstvového perceptrónu (MLP), konvolučných neurónových sietí (CNN) a rekurentných neurónových sietí (RNN).
Obrana – Logistika, analýza ozbrojených útokov a lokalizácia predmetov využívajú neurónové siete. Sú tiež zamestnaní vo vzdušných a námorných hliadkach, ako aj pri riadení autonómnych dronov. Umelá inteligencia dáva obrannému priemyslu toľko potrebnú podporu, ktorú potrebuje na rozšírenie svojej technológie. Na zisťovanie existencie podvodných mín sa používajú konvolučné neurónové siete (CNN).

výhody

Aj keď niekoľko neurónov v neurónovej sieti nefunguje správne, neurónové siete budú stále generovať výstupy.
Neurónové siete majú schopnosť učiť sa v reálnom čase a prispôsobovať sa meniacim sa nastaveniam.
Neurónové siete sa môžu naučiť vykonávať rôzne úlohy. Poskytnúť správny výsledok na základe poskytnutých údajov.
Neurónové siete majú silu a schopnosť zvládnuť niekoľko úloh súčasne.

Nevýhody

Neurónové siete sa používajú na riešenie problémov. Nezverejňuje vysvetlenie „prečo a ako“ urobilo rozhodnutia, ktoré urobilo kvôli zložitosti sietí. V dôsledku toho môže dôjsť k narušeniu dôvery v sieť.
Komponenty neurónovej siete sú na sebe navzájom závislé. To znamená, že neurónové siete vyžadujú (alebo sú extrémne závislé na) počítače s dostatočným výpočtovým výkonom.
Proces neurónovej siete nemá žiadne špecifické pravidlo (alebo orientačné pravidlo). V technike pokus-omyl sa správna štruktúra siete vytvorí pokusom o optimálnu sieť. Je to postup, ktorý si vyžaduje veľa dolaďovania.

záver

Pole neurálne siete sa rýchlo rozširuje. Je dôležité naučiť sa a porozumieť konceptom v tomto sektore, aby ste sa s nimi mohli vysporiadať.

V tomto článku je popísaných mnoho typov neurónových sietí. Neurónové siete môžete použiť na riešenie problémov s údajmi v iných oblastiach, ak sa o tejto disciplíne dozviete viac.

Úvod do neurónových sietí

Čo je neurónová sieť?

Ako fungujú neurónové siete?