Introducere în rețelele neuronale

Cuprins[Ascunde][Spectacol]

Ce este rețeaua neuronală?
Cum funcționează rețelele neuronale?
Tipuri de rețele neuronale+-
aplicatii
Avantaje
Dezavantaje
Concluzie

Inițial, inteligența artificială (AI) a fost considerată a fi un vis îndepărtat, o tehnologie pentru viitor, dar nu mai este cazul.

Ceea ce a fost cândva un subiect de cercetare explodează acum în lumea reală. AI se găsește acum într-o varietate de locuri, inclusiv la locul de muncă, la școală, la bancă, spitale și chiar și pe telefon.

Sunt ochii vehiculelor care se conduc singure, vocile lui Siri și Alexa, mințile din spatele prognozei meteo, mâinile din spatele intervențiilor chirurgicale asistate de robot și multe altele.

Inteligență artificială (AI) devine o trăsătură banală a vieții moderne. În ultimii câțiva ani, AI a apărut ca un jucător major într-o gamă largă de tehnologii IT.

În cele din urmă, rețeaua neuronală este folosită de AI pentru a învăța lucruri noi.

Așa că astăzi vom afla despre rețelele neuronale, cum funcționează, tipurile lor, aplicațiile și multe altele.

Ce este rețeaua neuronală?

In masina de învățare, o rețea neuronală este o rețea programată prin software de neuroni artificiali. Încearcă să imite creierul uman, având numeroase straturi de „neuroni”, care sunt similare cu neuronii din creierul nostru.

Primul strat de neuroni va accepta fotografii, video, sunet, text și alte intrări. Aceste date circulă prin toate nivelurile, iar rezultatul unui strat curge în următorul. Acest lucru este esențial pentru cele mai dificile sarcini, cum ar fi procesarea limbajului natural pentru învățarea automată.

Cu toate acestea, în alte cazuri, este de preferat să se urmărească compresia sistemului pentru a reduce dimensiunea modelului, menținând în același timp precizia și eficiența. Tunderea unei rețele neuronale este o metodă de compresie care include eliminarea greutăților dintr-un model învățat. Luați în considerare o rețea neuronală de inteligență artificială care a fost antrenată pentru a distinge oamenii de animale.

Retea neurala

Imaginea va fi împărțită în părți luminoase și întunecate de primul strat de neuroni. Aceste date vor fi trecute în următorul strat, care va determina unde sunt marginile.

Următorul strat va încerca să recunoască formele pe care le-a generat combinația marginilor. Conform datelor pe care a fost antrenat, datele vor trece prin numeroase straturi într-un mod similar pentru a determina dacă imaginea pe care ați prezentat-o este a unui om sau a unui animal.

Când datele sunt date într-o rețea neuronală, aceasta începe să le proceseze. După aceea, datele sunt procesate prin nivelurile sale pentru a obține rezultatul dorit. O rețea neuronală este o mașină care învață din intrările structurate și afișează rezultatele. Există trei tipuri de învățare care pot avea loc în rețelele neuronale:

Învățare supravegheată – Intrările și ieșirile sunt date algoritmilor folosind date etichetate. După ce au fost învățați cum să analizeze datele, ei prognozează rezultatul dorit.
Învățare nesupravegheată – O ANN învață fără asistența unui om. Nu există date etichetate, iar rezultatul este decis de modelele găsite în datele de ieșire.
Consolidarea învățării este atunci când o rețea învață din feedback-ul pe care îl primește.

Cum funcționează rețelele neuronale?

Neuronii artificiali sunt folosiți în rețelele neuronale, care sunt sisteme sofisticate. Neuronii artificiali, cunoscuți și sub numele de perceptroni, sunt formați din următoarele componente:

Intrare
Greutate
Părtinire
Funcție de activare
producție

Straturile de neuroni care alcătuiesc rețelele neuronale. O rețea neuronală este formată din trei straturi:

Stratul de intrare
Strat ascuns
Stratul de ieșire

Datele sub forma unei valori numerice sunt trimise la stratul de intrare. Straturile ascunse ale rețelei sunt cele care fac cele mai multe calcule. Stratul de ieșire, nu în ultimul rând, prognozează rezultatul. Neuronii se domină unul pe altul într-o rețea neuronală. Neuronii sunt utilizați pentru a construi fiecare strat. Datele sunt direcționate către stratul ascuns după ce stratul de intrare le primește.

Greutățile sunt aplicate fiecărei intrări. În straturile ascunse ale unei rețele neuronale, greutatea este o valoare care traduce datele primite. Greutățile funcționează prin înmulțirea datelor de intrare cu valoarea greutății din stratul de intrare.

Apoi începe valoarea primului strat ascuns. Datele de intrare sunt transformate și transmise celuilalt strat prin straturile ascunse. Stratul de ieșire este responsabil pentru generarea rezultatului final. Intrările și greutățile sunt multiplicate, iar rezultatul este livrat neuronilor stratului ascuns ca o sumă. Fiecărui neuron i se dă o părtinire. Pentru a calcula totalul, fiecare neuron adaugă intrările pe care le primește.

Funcționează în rețea neuronală

După aceea, valoarea trece prin funcția de activare. Rezultatul funcției de activare determină dacă un neuron este sau nu activat. Când un neuron este activ, trimite informații celorlalte straturi. Datele sunt create în rețea până când neuronul ajunge la nivelul de ieșire folosind această metodă. Propagarea directă este un alt termen pentru aceasta.

Tehnica de alimentare a datelor într-un nod de intrare și de obținere a ieșirii printr-un nod de ieșire este cunoscută ca propagare feed-forward. Când datele de intrare sunt acceptate de stratul ascuns, are loc propagarea feed-forward. Este procesat conform funcției de activare și apoi trecut la ieșire.

Rezultatul este proiectat de neuronul din stratul de ieșire cu cea mai mare probabilitate. Propagarea inversă are loc atunci când ieșirea este incorectă. Greutățile sunt inițializate la fiecare intrare în timp ce se creează o rețea neuronală. Propagarea inversă este procesul de reajustare a greutăților fiecărei intrări pentru a reduce greșelile și a oferi o ieșire mai precisă.

Tipuri de rețele neuronale

1. Perceptron

Modelul Minsky-Papert perceptron este unul dintre cele mai simple și mai vechi modele de neuroni. Este cea mai mică unitate a unei rețele neuronale care efectuează anumite calcule pentru a descoperi caracteristici sau business intelligence în datele primite. Este nevoie de intrări ponderate și aplică funcția de activare pentru a obține rezultatul final. TLU (unitatea logică de prag) este un alt nume pentru perceptron.

perceptron

Perceptron este un clasificator binar care este un sistem de învățare supravegheat care împarte datele în două grupuri. Porți logice precum AND, OR și NAND pot fi implementate cu perceptroni.

2. Rețea neuronală feed-forward

Cea mai simplă versiune a rețelelor neuronale, în care datele de intrare circulă exclusiv într-o singură direcție, trece prin noduri neuronale artificiale și iese prin nodurile de ieșire. Straturile de intrare și de ieșire sunt prezente în locuri în care straturi ascunse pot fi prezente sau nu. Ele pot fi caracterizate fie ca o rețea neuronală cu un singur strat, fie cu mai multe straturi, pe baza acestui lucru.

Numărul de straturi utilizate este determinat de complexitatea funcției. Se propagă doar înainte într-o direcție și nu se propagă înapoi. Aici, greutățile rămân constante. Intrările sunt înmulțite cu greutăți pentru a alimenta o funcție de activare. Pentru aceasta este utilizată o funcție de activare a clasificării sau o funcție de activare a treptei.

3. Perceptron multistrat

O introducere la sofisticat rețele neuronale, în care datele de intrare sunt direcționate prin mai multe straturi de neuroni artificiali. Este o rețea neuronală complet legată, deoarece fiecare nod este conectat la toți neuronii din următorul strat. Mai multe straturi ascunse, adică cel puțin trei sau mai multe straturi, sunt prezente în straturile de intrare și de ieșire.

Perceptron cu mai multe straturi

Posedă propagare bidirecțională, ceea ce înseamnă că se poate propaga atât înainte, cât și înapoi. Intrările sunt multiplicate cu greutăți și trimise la funcția de activare, unde sunt modificate prin retropropagare pentru a minimiza pierderea.

Greutățile sunt valori învățate de mașină din rețelele neuronale, pentru a spune simplu. În funcție de diferența dintre rezultatele așteptate și inputurile de formare, acestea se autoajustează. Softmax este utilizat ca funcție de activare a stratului de ieșire după funcțiile de activare neliniare.

4. Rețeaua neuronală convoluțională

Spre deosebire de matricea tradițională bidimensională, o rețea neuronală de convoluție are o configurație tridimensională a neuronilor. Primul strat este cunoscut ca strat convoluțional. Fiecare neuron din stratul convoluțional procesează doar informații dintr-o porțiune limitată a câmpului vizual. Ca un filtru, caracteristicile de intrare sunt preluate în modul lot.

Rețeaua înțelege imaginile în secțiuni și poate efectua aceste acțiuni de mai multe ori pentru a finaliza întreaga procesare a imaginii.

Rețeaua neuronală convoluțională

Imaginea este convertită din RGB sau HSI în tonuri de gri în timpul procesării. Variațiile ulterioare ale valorii pixelilor vor ajuta la detectarea marginilor, iar imaginile pot fi sortate în mai multe grupuri. Propagarea unidirecțională are loc atunci când un CNN conține unul sau mai multe straturi convoluționale urmate de pooling, iar propagarea bidirecțională are loc atunci când ieșirea stratului de convoluție este trimisă la o rețea neuronală complet conectată pentru clasificarea imaginilor.

Pentru a extrage anumite elemente ale unei imagini, se folosesc filtre. În MLP, intrările sunt ponderate și furnizate în funcția de activare. RELU este utilizat în convoluție, în timp ce MLP folosește o funcție de activare neliniară urmată de softmax. În recunoașterea imaginilor și video, analiza semantică și detectarea parafrazelor, rețelele neuronale convoluționale produc rezultate excelente.

5. Rețea de polarizare radială

Un vector de intrare este urmat de un strat de neuroni RBF și un strat de ieșire cu câte un nod pentru fiecare categorie dintr-o rețea cu funcție de bază radială. Intrarea este clasificată prin compararea cu punctele de date din setul de antrenament, unde fiecare neuron menține un prototip. Acesta este unul dintre exemplele setului de antrenament.

Rețeaua de polarizare radială

Fiecare neuron calculează distanța euclidiană dintre intrare și prototipul său atunci când un vector nou de intrare [vectorul n-dimensional pe care încercați să îl clasificați] trebuie clasificat. Dacă avem două clase, Clasa A și Clasa B, noua intrare care trebuie clasificată este mai asemănătoare cu prototipurile din clasa A decât cu prototipurile din clasa B.

Ca rezultat, ar putea fi etichetat sau clasificat ca clasa A.

6. Rețeaua neuronală recurentă

Rețelele neuronale recurente sunt concepute pentru a salva rezultatul unui strat și apoi îl alimentează înapoi în intrare pentru a ajuta la prognoza rezultatului stratului. Un feed-forward rețele neuronale este de obicei stratul inițial, urmat de un strat de rețea neuronală recurentă, unde o funcție de memorie își amintește o parte din informațiile pe care le avea în pasul de timp anterior.

Rețeaua neuronală recurentă

Acest scenariu folosește propagarea înainte. Salvează datele care vor fi necesare în viitor. În cazul în care predicția este incorectă, rata de învățare este utilizată pentru a face ajustări minore. Ca rezultat, pe măsură ce retropropagarea progresează, aceasta va deveni din ce în ce mai precisă.

aplicatii

Rețelele neuronale sunt folosite pentru a gestiona probleme de date într-o varietate de discipline; câteva exemple sunt prezentate mai jos.

Recunoaștere facială – Soluțiile de recunoaștere facială servesc ca sisteme de supraveghere eficiente. Sistemele de recunoaștere relaționează fotografiile digitale cu fețele umane. Sunt folosite în birouri pentru intrare selectivă. Astfel, sistemele verifică o față umană și o compară cu o listă de ID-uri stocate în baza sa de date.
Predicție stoc – Investițiile sunt expuse riscurilor de piață. Este practic greu de anticipat evoluțiile viitoare pe bursa extrem de volatilă. Înainte de rețelele neuronale, fazele de urs și urs în continuă schimbare erau imprevizibile. Dar ce a schimbat totul? Bineînțeles, vorbim despre rețele neuronale... Un Multilayer Perceptron MLP (un tip de sistem de inteligență artificială feedforward) este folosit pentru a crea o prognoză de stoc de succes în timp real.
Social Media – Indiferent de cât de banal ar suna, rețelele de socializare au schimbat calea mondenă a existenței. Comportamentul utilizatorilor rețelelor sociale este studiat cu ajutorul rețelelor neuronale artificiale. Pentru analiza competitivă, datele furnizate zilnic prin interacțiuni virtuale sunt adunate și examinate. Acțiunile utilizatorilor de rețele sociale sunt replicate de rețelele neuronale. Comportamentele indivizilor pot fi conectate la tiparele de cheltuieli ale oamenilor odată ce datele sunt analizate prin intermediul rețelelor de socializare. Datele din aplicațiile de social media sunt extrase folosind Multilayer Perceptron ANN.
Îngrijirea sănătății – Indivizii din lumea de astăzi folosesc beneficiile tehnologiei în industria sănătății. În domeniul sănătății, rețelele neuronale convoluționale sunt utilizate pentru detectarea cu raze X, scanări CT și ecografie. Datele imagistice medicale primite de la testele menționate mai sus sunt evaluate și apreciate folosind modele de rețele neuronale, deoarece CNN este utilizat în procesarea imaginilor. În dezvoltarea sistemelor de recunoaștere a vocii, se utilizează și rețeaua neuronală recurentă (RNN).
Meteo – Înainte de implementarea inteligenței artificiale, proiecțiile departamentului meteorologic nu au fost niciodată precise. Prognoza meteo se face în mare măsură pentru a prezice condițiile meteo care vor apărea în viitor. Previziunile meteorologice sunt utilizate pentru a anticipa probabilitatea dezastrelor naturale în perioada modernă. Prognoza meteo se face folosind perceptron multistrat (MLP), rețele neuronale convoluționale (CNN) și rețele neuronale recurente (RNN).
Apărare – Logistica, analiza atacurilor armate și locația articolelor folosesc toate rețele neuronale. De asemenea, sunt angajați în patrule aeriene și maritime, precum și pentru a gestiona drone autonome. Inteligența artificială oferă industriei de apărare impulsul de care are nevoie pentru a-și extinde tehnologia. Pentru detectarea existenței minelor subacvatice se folosesc rețelele neuronale convoluționale (CNN).

Avantaje

Chiar dacă câțiva neuroni dintr-o rețea neuronală nu funcționează corect, rețelele neuronale vor genera totuși rezultate.
Rețelele neuronale au capacitatea de a învăța în timp real și de a se adapta la setările lor în schimbare.
Rețelele neuronale pot învăța să facă o varietate de sarcini. Pentru a oferi rezultatul corect pe baza datelor furnizate.
Rețelele neuronale au puterea și capacitatea de a gestiona mai multe sarcini în același timp.

Dezavantaje

Rețelele neuronale sunt folosite pentru a rezolva probleme. Nu dezvăluie explicația din spatele „de ce și cum” a făcut judecățile pe care le-a făcut din cauza complexității rețelelor. Ca rezultat, încrederea în rețea poate fi erodata.
Componentele unei rețele neuronale sunt interdependente unele de altele. Adică, rețelele neuronale necesită (sau se bazează extrem de pe) computere cu putere de calcul suficientă.
Un proces de rețea neuronală nu are o regulă specifică (sau o regulă generală). Într-o tehnică de încercare și eroare, se stabilește o structură corectă a rețelei prin încercarea rețelei optime. Este o procedură care necesită multă reglare fină.

Concluzie

Campul de rețele neuronale se extinde rapid. Este esențial să înveți și să înțelegi conceptele din acest sector pentru a le putea face față.

Multe tipuri de rețele neuronale au fost abordate în acest articol. Puteți folosi rețelele neuronale pentru a aborda problemele de date din alte domenii dacă aflați mai multe despre această disciplină.

Introducere în rețelele neuronale

Ce este rețeaua neuronală?

Cum funcționează rețelele neuronale?