Sissejuhatus närvivõrkudesse

Sisukord[Peida][Näita]

Mis on närvivõrk?
Kuidas närvivõrgud töötavad?
Neuraalvõrgu tüübid+-
Rakendused
Eelised
Puudused
Järeldus

Algselt peeti tehisintellekti (AI) kaugeks unistuseks, tulevikutehnoloogiaks, kuid see pole enam nii.

See, mis kunagi oli uurimisteema, levib nüüd pärismaailmas plahvatuslikult. AI-d leidub nüüd paljudes kohtades, sealhulgas teie töökohas, koolis, panganduses, haiglates ja isegi teie telefonis.

Need on isejuhtivate sõidukite silmad, Siri ja Alexa hääled, ilmaennustuse taga olevad meeled, roboti abil operatsiooni taga olevad käed ja palju muud.

tehisintellekti (AI) on saamas tänapäeva elu tavaliseks tunnuseks. Viimastel aastatel on tehisintellektist saanud suur osa IT-tehnoloogiate hulgas.

Lõpuks kasutab AI närvivõrku uute asjade õppimiseks.

Nii et täna õpime tundma närvivõrke, nende toimimist, nende tüüpe, rakendusi ja palju muud.

Mis on närvivõrk?

In masinõpe, närvivõrk on tarkvaraliselt programmeeritud tehisneuronite võrk. See püüab jäljendada inimese aju, omades arvukalt "neuronite" kihte, mis on sarnased meie aju neuronitega.

Esimene neuronite kiht võtab vastu fotosid, videoid, heli, teksti ja muid sisendeid. Need andmed liiguvad läbi kõikide tasemete, kusjuures ühe kihi väljund liigub järgmisele. See on kriitilise tähtsusega kõige raskemate ülesannete, näiteks masinõppe loomuliku keele töötlemise jaoks.

Kuid muudel juhtudel on eelistatav süsteemi tihendamine, et vähendada mudeli suurust, säilitades samas täpsuse ja tõhususe. Närvivõrgu kärpimine on tihendusmeetod, mis hõlmab õpitud mudelist kaalude eemaldamist. Mõelge tehisintellekti närvivõrgule, mis on koolitatud eristama inimesi loomadest.

Neural Network

Esimene neuronikiht jagab pildi heledateks ja tumedateks osadeks. Need andmed edastatakse järgmisse kihti, mis määrab, kus servad asuvad.

Järgmine kiht püüab ära tunda vorme, mille servade kombinatsioon on genereerinud. Selle väljaõppe andmete kohaselt läbivad andmed sarnasel viisil mitmeid kihte, et teha kindlaks, kas teie esitatud pilt on inimesest või loomast.

Kui andmed sisestatakse närvivõrku, hakkab see neid töötlema. Pärast seda töödeldakse andmeid soovitud tulemuse saamiseks nende tasemete kaudu. Närvivõrk on masin, mis õpib struktureeritud sisendist ja kuvab tulemused. Närvivõrkudes võib toimuda kolme tüüpi õpe:

Juhendatud õpe – algoritmidele antakse sisendid ja väljundid, kasutades märgistatud andmeid. Pärast andmete analüüsimise õpetamist ennustavad nad kavandatud tulemust.
Järelevalveta õppimine – ANN õpib ilma inimese abita. Sildistatud andmed puuduvad ja väljundi määravad väljundandmetes leiduvad mustrid.
Tugevdusõpe on see, kui võrgustik õpib saadud tagasisidest.

Kuidas närvivõrgud töötavad?

Kunstlikke neuroneid kasutatakse närvivõrkudes, mis on keerukad süsteemid. Kunstlikud neuronid, tuntud ka kui pertseptronid, koosnevad järgmistest komponentidest:

Sisend
Kaal
Erapoolikus
Aktiveerimisfunktsioon
Väljund

Neuronite kihid, mis moodustavad närvivõrke. Närvivõrk koosneb kolmest kihist:

Sisendkiht
Peidetud kiht
Väljundkiht

Andmed numbrilise väärtuse kujul saadetakse sisendkihile. Võrgu peidetud kihid teevad kõige rohkem arvutusi. Lõpuks prognoosib väljundkiht tulemust. Neuronid domineerivad närvivõrgus üksteist. Iga kihi ehitamiseks kasutatakse neuroneid. Andmed suunatakse peidetud kihti pärast seda, kui sisendkiht need kätte saab.

Igale sisendile rakendatakse kaalu. Närvivõrgu peidetud kihtides on kaal väärtus, mis tõlgib sissetulevaid andmeid. Kaalud toimivad, korrutades sisendandmed sisendkihi kaaluväärtusega.

Seejärel käivitab see esimese peidetud kihi väärtuse. Sisendandmed teisendatakse ja edastatakse peidetud kihtide kaudu teisele kihile. Väljundkiht vastutab lõpptulemuse loomise eest. Sisendid ja kaalud korrutatakse ning tulemus edastatakse peidetud kihi neuronitele summana. Igale neuronile on antud kallutatus. Kogusumma arvutamiseks lisab iga neuron vastuvõetud sisendid.

Närvivõrk töötab

Pärast seda liigub väärtus aktiveerimisfunktsiooni kaudu. Aktiveerimisfunktsiooni tulemus määrab, kas neuron on aktiveeritud või mitte. Kui neuron on aktiivne, saadab see teavet teistele kihtidele. Andmeid luuakse võrgus seni, kuni neuron jõuab selle meetodi abil väljundkihti. Edasi levitamine on selle jaoks teine termin.

Sisendsõlme andmete sisestamise ja väljundsõlme kaudu väljundi hankimise tehnikat nimetatakse edasisuunaliseks levitamiseks. Kui peidetud kiht võtab sisendandmed vastu, toimub edasisuunaline levik. Seda töödeldakse vastavalt aktiveerimisfunktsioonile ja edastatakse seejärel väljundisse.

Tulemuse projitseerib väljundkihi neuron suurima tõenäosusega. Tagasi levitamine toimub siis, kui väljund on vale. Närvivõrgu loomise ajal lähtestatakse igale sisendile kaalud. Tagasi levitamine on iga sisendi kaalu muutmise protsess, et vähendada vigu ja pakkuda täpsemat väljundit.

Neuraalvõrgu tüübid

1. Pertseptron

Minsky-Paperti pertseptronimudel on üks lihtsamaid ja vanemaid neuronimudeleid. See on närvivõrgu väikseim üksus, mis teeb teatud arvutusi, et avastada sissetulevates andmetes omadusi või ärianalüüsi. See võtab kaalutud sisendeid ja rakendab lõpptulemuse saamiseks aktiveerimisfunktsiooni. TLU (threshold logic unit) on perceptroni teine nimi.

perceptron

Perceptron on binaarne klassifikaator, mis on juhendatud õppesüsteem, mis jagab andmed kahte rühma. Loogika väravad näiteks AND, OR ja NAND saab rakendada pertseptronidega.

2. Feed-Forward Neural Network

Närvivõrkude kõige elementaarsem versioon, milles sisendandmed liiguvad ainult ühes suunas, läbivad tehisnärvisõlmede ja väljuvad väljundsõlmede kaudu. Sisend- ja väljundkihid esinevad kohtades, kus peidetud kihid võivad olla või mitte. Selle põhjal võib neid iseloomustada kas ühekihilise või mitmekihilise edasisaatva närvivõrguna.

Kasutatavate kihtide arvu määrab funktsiooni keerukus. See levib ainult ühes suunas edasi ja ei levi tagasi. Siin jäävad kaalud konstantseks. Aktiveerimisfunktsiooni toiteks sisendid korrutatakse kaaludega. Selleks kasutatakse klassifikatsiooni aktiveerimise funktsiooni või astmelise aktiveerimise funktsiooni.

3. Mitmekihiline pertseptron

Sissejuhatus keerukatesse närvivõrgud, milles sisendandmed suunatakse läbi paljude tehisneuronite kihtide. See on täielikult seotud närvivõrk, kuna iga sõlm on ühendatud kõigi järgmise kihi neuronitega. Sisend- ja väljundkihtides on mitu peidetud kihti, st vähemalt kolm või enam kihti.

Mitmekihiline perceptron

Sellel on kahesuunaline levik, mis tähendab, et see võib levida nii edasi kui ka tagasi. Sisendid korrutatakse kaaludega ja saadetakse aktiveerimisfunktsiooni, kus neid muudetakse tagasi levitamise teel, et minimeerida kadu.

Lihtsamalt öeldes on raskused närvivõrkude masinõpitud väärtused. Sõltuvalt eeldatavate väljundite ja treeningsisendite vahelisest erinevusest reguleerivad need ise. Softmaxi kasutatakse väljundkihi aktiveerimisfunktsioonina pärast mittelineaarseid aktiveerimisfunktsioone.

4. Konvolutsiooniline närvivõrk

Erinevalt traditsioonilisest kahemõõtmelisest massiivist on konvolutsiooninärvivõrgul neuronite kolmemõõtmeline konfiguratsioon. Esimest kihti tuntakse konvolutsioonikihina. Iga konvolutsioonikihi neuron töötleb teavet ainult piiratud osa nägemisväljast. Sarnaselt filtriga võetakse sisendfunktsioonid pakettrežiimis.

Võrk mõistab pilte osade kaupa ja suudab neid toiminguid kogu pilditöötluse lõpetamiseks teha mitu korda.

Konvolutsiooniline närvivõrk

Pilt teisendatakse töötlemise käigus RGB- või HSI-vormingust halltooniks. Piksliväärtuse edasised variatsioonid aitavad servi tuvastada ja pilte saab sorteerida mitmesse rühma. Ühesuunaline levimine toimub siis, kui CNN sisaldab ühte või mitut konvolutsioonikihti, millele järgneb koondamine, ja kahesuunaline levimine toimub siis, kui konvolutsioonikihi väljund saadetakse kujutise klassifitseerimiseks täielikult ühendatud närvivõrku.

Pildi teatud elementide eraldamiseks kasutatakse filtreid. MLP-s on sisendid kaalutud ja sisestatud aktiveerimisfunktsiooni. RELU kasutatakse konvolutsioonis, samas kui MLP kasutab mittelineaarset aktiveerimisfunktsiooni, millele järgneb softmax. Pildi- ja videotuvastuses, semantilises parsimises ja parafraaside tuvastamises annavad konvolutsioonilised närvivõrgud suurepäraseid tulemusi.

5. Radial Bias Network

Sisendvektorile järgneb RBF-i neuronite kiht ja väljundkiht, millel on üks sõlm iga kategooria jaoks radiaalpõhifunktsioonide võrgus. Sisend klassifitseeritakse, võrreldes seda treeningkomplekti andmepunktidega, kus iga neuron säilitab prototüübi. See on üks koolituskomplekti näidetest.

Radial Bias Network

Iga neuron arvutab eukleidilise kauguse sisendi ja selle prototüübi vahel, kui tuleb klassifitseerida uus sisendvektori [n-mõõtmeline vektor, mida proovite kategoriseerida]. Kui meil on kaks klassi, klass A ja klass B, on uus kategoriseeritav sisend rohkem sarnane A-klassi prototüüpidele kui B-klassi prototüüpidele.

Selle tulemusena võidakse see märgistada või liigitada A-klassi.

6. Korduv närvivõrk

Korduvad närvivõrgud on loodud kihi väljundi salvestamiseks ja seejärel sisendisse tagasi suunamiseks, et aidata prognoosida kihi tulemust. Edasisuunamine Närvivõrgus on tavaliselt esialgne kiht, millele järgneb korduv närvivõrgu kiht, kus mälufunktsioon jätab meelde osa teabest, mis tal oli eelmises ajaetapis.

Korduv närvivõrk

See stsenaarium kasutab edasi levitamist. See salvestab andmed, mida tulevikus vaja läheb. Kui ennustus on vale, kasutatakse õppimiskiirust väiksemate muudatuste tegemiseks. Selle tulemusena muutub see tagasilevitamise edenedes üha täpsemaks.

Rakendused

Närvivõrke kasutatakse andmeprobleemide lahendamiseks erinevates teadusharudes; mõned näited on toodud allpool.

Näotuvastus – näotuvastuslahendused on tõhusad jälgimissüsteemid. Tuvastamissüsteemid seostavad digifotosid inimeste nägudega. Neid kasutatakse kontorites valikuliseks sisenemiseks. Seega kontrollivad süsteemid inimese nägu ja võrdlevad seda andmebaasis salvestatud ID-de loendiga.
Aktsiaprognoos – investeeringud on avatud tururiskidele. Äärmiselt volatiilsel aktsiaturul on edasisi arenguid praktiliselt raske ette näha. Enne närvivõrke olid pidevalt nihkuvad tõusu- ja langusfaasid ettearvamatud. Aga mis kõik muutis? Muidugi räägime närvivõrkudest… Eduka aktsiaprognoosi loomiseks reaalajas kasutatakse mitmekihilist Perceptron MLP-d (teatud tüüpi tehisintellekti süsteem).
Sotsiaalmeedia – Olenemata sellest, kui rumal see võib kõlada, on sotsiaalmeedia muutnud igapäevast eksistentsi teed. Sotsiaalmeedia kasutajate käitumist uuritakse tehisnärvivõrkude abil. Konkurentsianalüüsiks kuhjatakse kokku ja uuritakse igapäevaselt virtuaalse suhtluse kaudu edastatavaid andmeid. Sotsiaalmeedia kasutajate tegevust kordavad närvivõrgud. Üksikisikute käitumist saab seostada inimeste kulutamisharjumustega, kui andmeid analüüsitakse sotsiaalmeedia võrgustike kaudu. Sotsiaalmeedia rakenduste andmeid kaevandatakse Multilayer Perceptron ANN abil.
Tervishoid – tänapäeva maailmas kasutavad inimesed tervishoiutööstuses tehnoloogia eeliseid. Tervishoiuvaldkonnas kasutatakse konvolutsioonilisi närvivõrke röntgenikiirguse tuvastamiseks, CT-skaneerimiseks ja ultraheliks. Eelnimetatud testidest saadud meditsiinilisi pildiandmeid hinnatakse ja hinnatakse närvivõrgu mudelite abil, kuna pilditöötluses kasutatakse CNN-i. Hääletuvastussüsteemide arendamisel kasutatakse ka korduvat närvivõrku (RNN).
Ilmateade – enne tehisintellekti rakendamist ei olnud meteoroloogiaosakonna prognoosid kunagi täpsed. Ilmaennustus tehakse suuresti selleks, et ennustada tulevikus tekkivaid ilmastikutingimusi. Ilmaennustusi kasutatakse loodusõnnetuste tõenäosuse prognoosimiseks tänapäevasel perioodil. Ilmaprognoos tehakse mitmekihiliste pertseptronide (MLP), konvolutsiooniliste närvivõrkude (CNN) ja korduvate närvivõrkude (RNN) abil.
Kaitse – Logistika, relvastatud rünnakute analüüs ja esemete asukoha määramine kasutavad kõik närvivõrke. Neid kasutatakse ka õhu- ja merepatrullides ning autonoomsete droonide haldamisel. Tehisintellekt annab kaitsetööstusele väga vajaliku tõuke oma tehnoloogia laiendamiseks. Veealuste miinide olemasolu tuvastamiseks kasutatakse konvolutsioonilisi närvivõrke (CNN).

Eelised

Isegi kui mõned neuronid närvivõrgus ei tööta korralikult, genereerivad närvivõrgud ikkagi väljundeid.
Närvivõrkudel on võimalus õppida reaalajas ja kohaneda muutuvate seadetega.
Närvivõrgud võivad õppida täitma mitmesuguseid ülesandeid. Esitatud andmete põhjal õige tulemuse saamiseks.
Närvivõrkudel on tugevus ja võime mitme ülesandega korraga toime tulla.

Puudused

Probleemide lahendamiseks kasutatakse närvivõrke. See ei avalda selgitust, miks ja kuidas ta võrkude keerukuse tõttu otsuseid tegi. Selle tulemusena võib võrgu usaldus väheneda.
Närvivõrgu komponendid on üksteisest sõltuvad. See tähendab, et närvivõrgud nõuavad (või sõltuvad väga palju) piisava arvutusvõimsusega arvuteid.
Närvivõrgu protsessil pole konkreetset reeglit (või rusikareegelt). Katse-eksituse meetodil luuakse õige võrgustruktuur, proovides optimaalset võrku. See on protseduur, mis nõuab palju peenhäälestamist.

Järeldus

Valdkond närvivõrgud laieneb kiiresti. Selle sektori mõistete õppimine ja mõistmine on kriitilise tähtsusega, et nendega toime tulla.

Selles artiklis on käsitletud mitut tüüpi närvivõrke. Kui õpite selle distsipliini kohta lisateavet, saate teiste valdkondade andmeprobleemide lahendamiseks kasutada närvivõrke.

Sissejuhatus närvivõrkudesse

Mis on närvivõrk?

Kuidas närvivõrgud töötavad?