Wprowadzenie do sieci neuronowych

Spis treści[Ukryć][Pokazać]

Co to jest sieć neuronowa?
Jak działają sieci neuronowe?
Rodzaje sieci neuronowych+-
Konsultacje
Zalety
Niedogodności
Wnioski

Pierwotnie uważano, że sztuczna inteligencja (AI) to odległe marzenie, technologia przyszłości, ale już tak nie jest.

To, co kiedyś było przedmiotem badań, teraz eksploduje w prawdziwym świecie. Sztuczną inteligencję można teraz znaleźć w różnych miejscach, w tym w miejscu pracy, szkole, bankowości, szpitalach, a nawet w telefonie.

To oczy autonomicznych pojazdów, głosy Siri i Alexy, umysły odpowiedzialne za prognozowanie pogody, ręce stojące za operacjami wspomaganymi przez roboty i nie tylko.

sztuczna inteligencja (AI) staje się powszechną cechą współczesnego życia. W ciągu ostatnich kilku lat sztuczna inteligencja stała się głównym graczem w szerokim zakresie technologii informatycznych.

Wreszcie sieć neuronowa jest wykorzystywana przez sztuczną inteligencję do uczenia się nowych rzeczy.

Więc dzisiaj dowiemy się o sieciach neuronowych, jak to działa, ich rodzajach, zastosowaniach i wiele więcej.

Co to jest sieć neuronowa?

In uczenie maszynowe, sieć neuronowa to zaprogramowana programowo sieć sztucznych neuronów. Próbuje naśladować ludzki mózg, mając liczne warstwy „neuronów”, które są podobne do neuronów w naszym mózgu.

Pierwsza warstwa neuronów będzie akceptować zdjęcia, wideo, dźwięk, tekst i inne dane wejściowe. Te dane przepływają przez wszystkie poziomy, a dane wyjściowe z jednej warstwy przepływają do następnej. Ma to kluczowe znaczenie w przypadku najtrudniejszych zadań, takich jak przetwarzanie języka naturalnego na potrzeby uczenia maszynowego.

Jednak w innych przypadkach preferowane jest dążenie do kompresji systemu w celu zmniejszenia rozmiaru modelu przy jednoczesnym zachowaniu dokładności i wydajności. Przycinanie sieci neuronowej to metoda kompresji, która obejmuje usuwanie wag z wyuczonego modelu. Rozważmy sieć neuronową ze sztuczną inteligencją, która została wyszkolona w odróżnianiu ludzi od zwierząt.

Sieć neuronowa

Obraz zostanie podzielony na części jasne i ciemne przez pierwszą warstwę neuronów. Te dane zostaną przekazane do następnej warstwy, która określi położenie krawędzi.

Następna warstwa spróbuje rozpoznać formy wygenerowane przez kombinację krawędzi. Zgodnie z danymi, na których został przeszkolony, dane przejdą przez wiele warstw w podobny sposób, aby określić, czy przedstawiony obraz przedstawia człowieka, czy zwierzę.

Kiedy dane są przekazywane do sieci neuronowej, zaczyna ona je przetwarzać. Następnie dane są przetwarzane poprzez ich poziomy w celu uzyskania pożądanego rezultatu. Sieć neuronowa to maszyna, która uczy się ze strukturalnych danych wejściowych i wyświetla wyniki. Istnieją trzy rodzaje uczenia się, które mogą mieć miejsce w sieciach neuronowych:

Uczenie nadzorowane — dane wejściowe i wyjściowe są przydzielane algorytmom przy użyciu oznaczonych danych. Po nauczeniu się, jak analizować dane, prognozują zamierzony wynik.
Uczenie się bez nadzoru — ANN uczy się bez pomocy człowieka. Nie ma danych oznaczonych etykietami, a dane wyjściowe są określane na podstawie wzorców znalezionych w danych wyjściowych.
Uczenie się ze wzmocnieniem ma miejsce, gdy sieć uczy się na podstawie otrzymanych informacji zwrotnych.

Jak działają sieci neuronowe?

Sztuczne neurony są wykorzystywane w sieciach neuronowych, które są wyrafinowanymi systemami. Sztuczne neurony, znane również jako perceptrony, składają się z następujących elementów:

Wkład
Waga
stronniczość
Funkcja aktywacji
Wydajność

Warstwy neuronów tworzące sieci neuronowe. Sieć neuronowa składa się z trzech warstw:

Warstwa wejściowa
Ukryta warstwa
Warstwa wyjściowa

Dane w postaci wartości numerycznej przesyłane są do warstwy wejściowej. Ukryte warstwy sieci to te, które wykonują najwięcej obliczeń. Warstwa wyjściowa, co nie mniej ważne, prognozuje wynik. Neurony dominują nad sobą w sieci neuronowej. Neurony są używane do budowy każdej warstwy. Dane są kierowane do warstwy ukrytej po otrzymaniu ich przez warstwę wejściową.

Wagi są stosowane do każdego wejścia. W ukrytych warstwach sieci neuronowej waga jest wartością, która tłumaczy przychodzące dane. Wagi działają poprzez pomnożenie danych wejściowych przez wartość wagi w warstwie wejściowej.

Następnie rozpoczyna wartość pierwszej ukrytej warstwy. Dane wejściowe są przekształcane i przekazywane do drugiej warstwy za pośrednictwem warstw ukrytych. Za wygenerowanie efektu końcowego odpowiada warstwa wyjściowa. Wejścia i wagi są mnożone, a wynik jest dostarczany do neuronów warstwy ukrytej jako suma. Każdy neuron otrzymuje odchylenie. Aby obliczyć sumę, każdy neuron dodaje otrzymane dane wejściowe.

Działa sieć neuronowa

Następnie wartość przechodzi przez funkcję aktywacji. Wynik funkcji aktywacji określa, czy neuron jest aktywowany, czy nie. Kiedy neuron jest aktywny, wysyła informacje do innych warstw. Dane są tworzone w sieci do momentu dotarcia neuronu tą metodą do warstwy wyjściowej. Propagacja do przodu to inny termin określający to.

Technika wprowadzania danych do węzła wejściowego i uzyskiwania danych wyjściowych przez węzeł wyjściowy jest znana jako propagacja ze sprzężeniem zwrotnym. Gdy dane wejściowe zostaną zaakceptowane przez warstwę ukrytą, następuje propagacja sprzężenia zwrotnego. Jest przetwarzany zgodnie z funkcją aktywacji, a następnie przekazywany na wyjście.

Wynik jest przewidywany przez neuron w warstwie wyjściowej z najwyższym prawdopodobieństwem. Propagacja wsteczna występuje, gdy dane wyjściowe są nieprawidłowe. Wagi są inicjowane dla każdego wejścia podczas tworzenia sieci neuronowej. Propagacja wsteczna to proces ponownego dostosowywania wag każdego wejścia w celu zmniejszenia liczby błędów i zapewnienia dokładniejszego wyniku.

Rodzaje sieci neuronowych

1. Perceptron

Model perceptronu Minsky'ego-Paperta jest jednym z najprostszych i najstarszych modeli neuronów. Jest to najmniejsza jednostka sieci neuronowej, która wykonuje określone obliczenia w celu wykrycia cech lub inteligencji biznesowej w przychodzących danych. Pobiera ważone dane wejściowe i stosuje funkcję aktywacji, aby uzyskać końcowy wynik. TLU (progowa jednostka logiczna) to inna nazwa perceptronu.

perceptron

Perceptron to binarny klasyfikator będący nadzorowanym systemem uczenia się, który dzieli dane na dwie grupy. Bramki logiczne takie jak AND, OR i NAND można zaimplementować za pomocą perceptronów.

2. Sieć neuronowa typu feed-forward

Najbardziej podstawowa wersja sieci neuronowych, w której dane wejściowe przepływają wyłącznie w jednym kierunku, przechodzą przez sztuczne węzły neuronowe i wychodzą przez węzły wyjściowe. Warstwy wejściowe i wyjściowe są obecne w miejscach, w których warstwy ukryte mogą być obecne lub nie. Na tej podstawie można je scharakteryzować jako jednowarstwową lub wielowarstwową sprzężoną sieć neuronową.

Liczba użytych warstw zależy od złożoności funkcji. Rozchodzi się tylko do przodu w jednym kierunku i nie rozchodzi się do tyłu. Tutaj wagi pozostają stałe. Wejścia są mnożone przez wagi, aby zasilić funkcję aktywacji. W tym celu wykorzystuje się funkcję aktywacji klasyfikacji lub funkcję aktywacji kroku.

3. Perceptron wielowarstwowy

Wprowadzenie do wyrafinowanych sieci neuronowe, w którym dane wejściowe są kierowane przez wiele warstw sztucznych neuronów. Jest to całkowicie połączona sieć neuronowa, ponieważ każdy węzeł jest połączony ze wszystkimi neuronami w kolejnej warstwie. W warstwie wejściowej i wyjściowej występuje wiele warstw ukrytych, tj. co najmniej trzy lub więcej warstw.

Perceptron wielowarstwowy

Posiada propagację dwukierunkową, co oznacza, że może rozprzestrzeniać się zarówno do przodu, jak i do tyłu. Wejścia są mnożone przez wagi i wysyłane do funkcji aktywacji, gdzie są zmieniane przez propagację wsteczną w celu zminimalizowania strat.

Mówiąc najprościej, wagi to wartości wyuczone maszynowo z sieci neuronowych. W zależności od rozbieżności między oczekiwanymi wynikami a nakładami treningowymi, dostosowują się one samoistnie. Softmax jest używany jako funkcja aktywacji warstwy wyjściowej po nieliniowych funkcjach aktywacji.

4. Konwolucyjna sieć neuronowa

W przeciwieństwie do tradycyjnej tablicy dwuwymiarowej, konwolucyjna sieć neuronowa ma trójwymiarową konfigurację neuronów. Pierwsza warstwa jest znana jako warstwa konwolucyjna. Każdy neuron w warstwie splotowej przetwarza informacje tylko z ograniczonej części pola widzenia. Podobnie jak filtr, obiekty wejściowe są pobierane w trybie wsadowym.

Sieć rozumie obrazy w sekcjach i może wykonywać te czynności wiele razy, aby zakończyć całe przetwarzanie obrazu.

Konwolucyjna sieć neuronowa

Podczas przetwarzania obraz jest konwertowany z RGB lub HSI na skalę szarości. Dalsze zmiany wartości pikseli pomogą w wykrywaniu krawędzi, a zdjęcia można podzielić na kilka grup. Propagacja jednokierunkowa występuje, gdy CNN zawiera jedną lub więcej warstw splotowych, po których następuje łączenie, a propagacja dwukierunkowa występuje, gdy dane wyjściowe warstwy splotowej są wysyłane do w pełni połączonej sieci neuronowej w celu klasyfikacji obrazu.

Aby wyodrębnić określone elementy obrazu, stosuje się filtry. W MLP wejścia są ważone i podawane do funkcji aktywacji. RELU jest używany w splocie, podczas gdy MLP wykorzystuje nieliniową funkcję aktywacji, po której następuje softmax. W rozpoznawaniu obrazów i wideo, analizie semantycznej i wykrywaniu parafraz konwolucyjne sieci neuronowe dają doskonałe wyniki.

5. Sieć polaryzacji radialnej

Po wektorze wejściowym następuje warstwa neuronów RBF i warstwa wyjściowa z jednym węzłem dla każdej kategorii w radialnej sieci funkcyjnej. Dane wejściowe są klasyfikowane przez porównanie ich z punktami danych ze zbioru treningowego, w którym każdy neuron utrzymuje prototyp. To jeden z przykładów zestawu szkoleniowego.

Sieć odchylenia promieniowego

Każdy neuron oblicza odległość euklidesową między wejściem a jego prototypem, gdy nowy wektor wejściowy [wektor n-wymiarowy, który próbujesz sklasyfikować] musi zostać sklasyfikowany. Jeśli mamy dwie klasy, klasę A i klasę B, nowe dane wejściowe do skategoryzowania są bardziej podobne do prototypów klasy A niż do prototypów klasy B.

W rezultacie może być oznaczony lub sklasyfikowany jako klasa A.

6. Rekurencyjna sieć neuronowa

Powtarzające się sieci neuronowe mają na celu zapisywanie danych wyjściowych warstwy, a następnie wprowadzanie ich z powrotem do danych wejściowych, aby pomóc w prognozowaniu wyniku warstwy. Przekaz do przodu sieci neuronowe jest zwykle warstwą początkową, po której następuje powtarzająca się warstwa sieci neuronowej, w której funkcja pamięci zapamiętuje część informacji, które posiadała w poprzednim kroku czasowym.

Nawracająca sieć neuronowa

W tym scenariuszu używana jest propagacja do przodu. Zapisuje dane, które będą potrzebne w przyszłości. W przypadku, gdy prognoza jest błędna, wskaźnik uczenia się służy do drobnych korekt. W rezultacie, w miarę postępu propagacji wstecznej, będzie ona coraz dokładniejsza.

Konsultacje

Sieci neuronowe są wykorzystywane do rozwiązywania problemów z danymi w różnych dyscyplinach; poniżej pokazano kilka przykładów.

Rozpoznawanie twarzy — Rozwiązania do rozpoznawania twarzy służą jako skuteczne systemy nadzoru. Systemy rozpoznawania wiążą zdjęcia cyfrowe z ludzkimi twarzami. Stosowane są w biurach do selektywnego wejścia. W ten sposób systemy weryfikują ludzką twarz i porównują ją z listą identyfikatorów przechowywanych w swojej bazie danych.
Przewidywanie akcji – Inwestycje są narażone na ryzyko rynkowe. Praktycznie trudno jest przewidzieć przyszły rozwój sytuacji na niezwykle niestabilnym rynku akcji. Przed sieciami neuronowymi stale zmieniające się fazy wzrostów i spadków były nieprzewidywalne. Ale co wszystko zmieniło? Oczywiście mówimy o sieciach neuronowych… Wielowarstwowy Perceptron MLP (rodzaj systemu sztucznej inteligencji z wyprzedzeniem) służy do tworzenia udanej prognozy zapasów w czasie rzeczywistym.
Media społecznościowe – Niezależnie od tego, jak banalnie to brzmi, media społecznościowe zmieniły przyziemną ścieżkę egzystencji. Zachowanie użytkowników mediów społecznościowych jest badane za pomocą sztucznych sieci neuronowych. W celu analizy konkurencji dane dostarczane codziennie za pośrednictwem interakcji wirtualnych są gromadzone i analizowane. Działania użytkowników mediów społecznościowych są replikowane przez sieci neuronowe. Zachowania poszczególnych osób można powiązać z ich wzorcami wydatków po przeanalizowaniu danych za pośrednictwem sieci społecznościowych. Dane z aplikacji społecznościowych są wydobywane przy użyciu wielowarstwowej sieci Perceptron ANN.
Opieka zdrowotna — ludzie w dzisiejszym świecie wykorzystują zalety technologii w branży opieki zdrowotnej. W branży medycznej konwolucyjne sieci neuronowe są wykorzystywane do wykrywania promieniowania rentgenowskiego, tomografii komputerowej i ultradźwięków. Dane obrazowania medycznego otrzymane z wyżej wymienionych testów są oceniane i oceniane za pomocą modeli sieci neuronowych, ponieważ CNN jest używany do przetwarzania obrazu. W rozwoju systemów rozpoznawania głosu wykorzystywana jest również rekurencyjna sieć neuronowa (RNN).
Raport pogodowy – przed wdrożeniem sztucznej inteligencji prognozy działu meteorologicznego nigdy nie były precyzyjne. Prognozowanie pogody odbywa się głównie w celu przewidywania warunków pogodowych, które wystąpią w przyszłości. Prognozy pogody są wykorzystywane do przewidywania prawdopodobieństwa wystąpienia klęsk żywiołowych we współczesnym okresie. Prognozowanie pogody odbywa się za pomocą perceptronu wielowarstwowego (MLP), konwolucyjnych sieci neuronowych (CNN) i rekurencyjnych sieci neuronowych (RNN).
Obrona – logistyka, analiza ataków zbrojnych i lokalizacja przedmiotów wykorzystują sieci neuronowe. Są również zatrudnieni w patrolach powietrznych i morskich, a także do zarządzania autonomicznymi dronami. Sztuczna inteligencja zapewnia przemysłowi obronnemu bardzo potrzebny impuls, którego potrzebuje, aby zwiększyć skalę swojej technologii. Do wykrywania obecności min podwodnych wykorzystywane są konwolucyjne sieci neuronowe (CNN).

Zalety

Nawet jeśli kilka neuronów w sieci neuronowej nie działa prawidłowo, sieci neuronowe nadal będą generować dane wyjściowe.
Sieci neuronowe mają zdolność uczenia się w czasie rzeczywistym i dostosowywania się do zmieniających się ustawień.
Sieci neuronowe mogą nauczyć się wykonywać różne zadania. Aby zapewnić prawidłowy wynik na podstawie dostarczonych danych.
Sieci neuronowe mają siłę i zdolność do obsługi kilku zadań jednocześnie.

Niedogodności

Sieci neuronowe służą do rozwiązywania problemów. Nie ujawnia wyjaśnienia „dlaczego i jak” dokonał swoich osądów ze względu na zawiłość sieci. W rezultacie zaufanie do sieci może ulec erozji.
Komponenty sieci neuronowej są od siebie współzależne. Oznacza to, że sieci neuronowe wymagają komputerów o wystarczającej mocy obliczeniowej (lub są od nich bardzo zależne).
Proces sieci neuronowej nie ma określonej reguły (lub reguły kciuka). W technice prób i błędów poprawna struktura sieci jest ustalana poprzez próbę uzyskania optymalnej sieci. To procedura, która wymaga wielu dopracowań.

Wnioski

Pole sieci neuronowe szybko się rozwija. Kluczowe znaczenie ma poznanie i zrozumienie pojęć w tym sektorze, aby móc sobie z nimi poradzić.

W tym artykule omówiono wiele rodzajów sieci neuronowych. Możesz używać sieci neuronowych do rozwiązywania problemów z danymi w innych dziedzinach, jeśli dowiesz się więcej o tej dyscyplinie.

Wprowadzenie do sieci neuronowych

Co to jest sieć neuronowa?

Jak działają sieci neuronowe?