Въведение в невронните мрежи

Съдържание[Крия][Покажи]

Какво е невронна мрежа?
Как работят невронните мрежи?
Видове невронни мрежи+-
Приложения
Предимства
Недостатъци
Заключение

Първоначално се смяташе, че изкуственият интелект (AI) е далечна мечта, технология за бъдещето, но това вече не е така.

Това, което някога беше тема за изследване, сега експлодира в реалния свят. AI вече се намира на различни места, включително вашето работно място, училище, банкиране, болници и дори вашия телефон.

Те са очите на самоуправляващите се превозни средства, гласовете на Siri и Alexa, умовете зад прогнозата за времето, ръцете зад роботизирана хирургия и много други.

Изкуствен интелект (AI) се превръща в обичайна черта на съвременния живот. През последните няколко години AI се очертава като основен играч в широк спектър от ИТ технологии.

И накрая, невронната мрежа се използва от AI за научаване на нови неща.

Така че днес ще научим за невронните мрежи, как работят, техните видове, приложения и много други.

Какво е невронна мрежа?

In машинно обучение, невронната мрежа е софтуерно програмирана мрежа от изкуствени неврони. Той се опитва да имитира човешкия мозък, като има множество слоеве от „неврони“, които са подобни на невроните в нашия мозък.

Първият слой от неврони ще приема снимки, видео, звук, текст и други входове. Тези данни преминават през всички нива, като изходът на един слой преминава в следващия. Това е от решаващо значение за най-трудните задачи, като обработка на естествен език за машинно обучение.

Въпреки това, в други случаи, стремежът към компресиране на системата за намаляване на размера на модела, като същевременно се поддържа точност и ефективност, е за предпочитане. Подрязването на невронна мрежа е метод на компресия, който включва премахване на тежести от научен модел. Помислете за невронна мрежа с изкуствен интелект, която е обучена да различава хората от животните.

невронни мрежи

Картината ще бъде разделена на светли и тъмни части от първия слой неврони. Тези данни ще бъдат предадени в следващия слой, който ще определи къде са ръбовете.

Следващият слой ще се опита да разпознае формите, които комбинацията от ръбовете е генерирала. Според данните, върху които са били обучени, данните ще преминат през множество слоеве по подобен начин, за да се определи дали представеното от вас изображение е на човек или на животно.

Когато данните се подават в невронна мрежа, тя започва да ги обработва. След това данните се обработват чрез своите нива, за да се получи желаният резултат. Невронната мрежа е машина, която се учи от структурирано въвеждане и показва резултатите. Има три типа обучение, което може да се осъществи в невронни мрежи:

Контролирано обучение – Входовете и изходите се дават на алгоритмите с помощта на етикетирани данни. След като бъдат научени как да анализират данни, те прогнозират очаквания резултат.
Учене без надзор – ANN учи без помощта на човек. Няма етикетирани данни и изходът се решава от модели, намерени в изходните данни.
Укрепване на обучението е, когато мрежата се учи от обратната връзка, която получава.

Как работят невронните мрежи?

Изкуствените неврони се използват в невронни мрежи, които са сложни системи. Изкуствените неврони, известни също като перцептрони, се състоят от следните компоненти:

Вход
Тегло
Отклонение
Функция за активиране
Продукция

Слоевете от неврони, които изграждат невронни мрежи. Невронната мрежа се състои от три слоя:

Входен слой
Скрит слой
Изходен слой

Данните под формата на числова стойност се изпращат към входния слой. Скритите слоеве на мрежата са тези, които правят най-много изчисления. Изходният слой, не на последно място, прогнозира резултата. Невроните доминират един върху друг в невронната мрежа. Невроните се използват за изграждане на всеки слой. Данните се пренасочват към скрития слой, след като входният слой ги получи.

Теглата се прилагат към всеки вход. В рамките на скритите слоеве на невронна мрежа теглото е стойност, която превежда входящите данни. Теглата функционират чрез умножаване на входните данни по стойността на теглото във входния слой.

След това стартира стойността на първия скрит слой. Входните данни се трансформират и предават към другия слой чрез скритите слоеве. Изходният слой е отговорен за генерирането на крайния резултат. Входните данни и теглата се умножават и резултатът се предава на невроните на скрития слой като сума. На всеки неврон се дава отклонение. За да изчисли общата сума, всеки неврон добавя входовете, които получава.

Невронната мрежа работи

След това стойността преминава през функцията за активиране. Резултатът от функцията за активиране определя дали невронът е активиран или не. Когато невронът е активен, той изпраща информация към другите слоеве. Данните се създават в мрежата, докато невронът достигне изходния слой, използвайки този метод. Разпространението напред е друг термин за това.

Техниката за подаване на данни във входен възел и получаване на изхода през изходен възел е известна като разпространение напред. Когато входните данни се приемат от скрития слой, се извършва предаване на данни. Обработва се според функцията за активиране и след това се предава на изхода.

Резултатът се проектира от неврона в изходния слой с най-голяма вероятност. Обратното разпространение се случва, когато изходът е неправилен. Теглата се инициализират за всеки вход, докато се създава невронна мрежа. Обратното разпространение е процесът на пренастройване на теглата на всеки вход, за да се намалят грешките и да се осигури по-точен изход.

Видове невронни мрежи

1. Персептрон

Персептронният модел на Мински-Паперт е един от най-простите и най-старите модели на неврони. Това е най-малката единица от невронна мрежа, която извършва определени изчисления, за да открие характеристики или бизнес интелигентност във входящите данни. Той взема претеглени входове и прилага функцията за активиране, за да получи крайния резултат. TLU (прагова логическа единица) е друго име за персептрон.

Перцептрон

Perceptron е двоичен класификатор, който е система за контролирано обучение, която разделя данните на две групи. Логически порти като AND, OR и NAND могат да бъдат реализирани с персептрони.

2. Невронна мрежа с пренасочване

Най-основната версия на невронните мрежи, в която входните данни протичат изключително в една посока, преминават през изкуствени невронни възли и излизат през изходни възли. Входните и изходните слоеве присъстват на места, където могат да присъстват или не могат да присъстват скрити слоеве. Въз основа на това те могат да се характеризират като еднослойна или многослойна невронна мрежа с пренасочване.

Броят на използваните слоеве се определя от сложността на функцията. Той се разпространява само напред в една посока и не се разпространява назад. Тук теглата остават постоянни. Входните данни се умножават по тегла за захранване на функция за активиране. За това се използва функция за активиране на класификация или функция за активиране на стъпки.

3. Многослоен персептрон

Въведение в сложните невронни мрежи, при който входните данни се насочват през много слоеве от изкуствени неврони. Това е напълно свързана невронна мрежа, тъй като всеки възел е свързан с всички неврони в следващия слой. Във входния и изходния слой присъстват множество скрити слоеве, т.е. поне три или повече слоя.

Многослоен перцептрон

Той притежава двупосочно разпространение, което означава, че може да се разпространява както напред, така и назад. Входните данни се умножават по тегла и се изпращат към функцията за активиране, където се променят чрез обратно разпространение, за да се сведе до минимум загубата.

Теглата са машинно заучени стойности от невронните мрежи, казано просто. В зависимост от несъответствието между очакваните резултати и входовете за обучение, те се самонастройват. Softmax се използва като функция за активиране на изходния слой след нелинейни функции за активиране.

4. Конволюционна невронна мрежа

За разлика от традиционния двуизмерен масив, конволюционната невронна мрежа има триизмерна конфигурация от неврони. Първият слой е известен като конволюционен слой. Всеки неврон в конволюционния слой обработва информация само от ограничена част от зрителното поле. Подобно на филтър, входните функции се приемат в пакетен режим.

Мрежата разбира снимките в секции и може да извършва тези действия многократно, за да завърши цялата обработка на изображението.

Конволюционна невронна мрежа

Картината се преобразува от RGB или HSI в сиви скали по време на обработка. Допълнителни вариации в стойността на пикселите ще помогнат при откриването на ръбове и снимките могат да бъдат сортирани в няколко групи. Еднопосочното разпространение се случва, когато CNN съдържа един или повече конволюционни слоеве, последвани от обединяване, а двупосочното разпространение се случва, когато изходът на слоя на навиване се изпраща към напълно свързана невронна мрежа за класификация на изображението.

За извличане на определени елементи от изображението се използват филтри. В MLP входовете се претеглят и се подават във функцията за активиране. RELU се използва в конволюция, докато MLP използва функция за нелинейно активиране, последвана от softmax. При разпознаването на изображения и видео, семантичния анализ и откриването на парафрази, конволюционните невронни мрежи дават отлични резултати.

5. Радиална мрежа за отклонение

Входният вектор е последван от слой от RBF неврони и изходен слой с един възел за всяка категория в мрежа с радиална базисна функция. Входът се класифицира чрез сравняването му с точки от данни от набора за обучение, където всеки неврон поддържа прототип. Това е един от примерите за обучителния комплект.

Мрежа с радиално отклонение

Всеки неврон изчислява евклидовото разстояние между входа и неговия прототип, когато трябва да бъде класифициран нов входен вектор [n-мерният вектор, който се опитвате да категоризирате]. Ако имаме два класа, клас A и клас B, новият вход, който трябва да бъде категоризиран, е по-подобен на прототипите от клас A, отколкото прототипите от клас B.

В резултат на това може да бъде етикетиран или категоризиран като клас А.

6. Рекурентна невронна мрежа

Повтарящите се невронни мрежи са проектирани да запазват изхода на даден слой и след това да го подават обратно във входа, за да подпомогнат прогнозирането на резултата от слоя. Подаване напред невронна мрежа обикновено е началният слой, последван от повтарящ се слой на невронна мрежа, където функцията на паметта запомня част от информацията, която е имала в предишната времева стъпка.

Повтаряща се невронна мрежа

Този сценарий използва разпространение напред. Той спестява данни, които ще са необходими в бъдеще. В случай, че прогнозата е неправилна, скоростта на обучение се използва за извършване на малки корекции. В резултат на това с напредването на обратното разпространение то ще става все по-точно.

Приложения

Невронните мрежи се използват за справяне с проблеми с данни в различни дисциплини; някои примери са показани по-долу.

Разпознаване на лица – Решенията за разпознаване на лица служат като ефективни системи за наблюдение. Системите за разпознаване свързват цифровите снимки с човешките лица. Използват се в офиси за избирателно влизане. По този начин системите проверяват човешко лице и го сравняват със списък с идентификатори, съхранявани в неговата база данни.
Прогнозиране на запасите – Инвестициите са изложени на пазарни рискове. Практически е трудно да се предвидят бъдещи развития на изключително нестабилния фондов пазар. Преди невронните мрежи, постоянно променящите се бичи и мечи фази бяха непредвидими. Но какво промени всичко? Разбира се, говорим за невронни мрежи... Многослоен Perceptron MLP (вид система за изкуствен интелект с пренасочване) се използва за създаване на успешна прогноза за запасите в реално време.
Социална медия – Колкото и банално да звучи, социалните медии промениха светския път на съществуване. Поведението на потребителите на социални медии се изследва с помощта на изкуствени невронни мрежи. За конкурентен анализ данните, предоставяни ежедневно чрез виртуални взаимодействия, се натрупват и проверяват. Действията на потребителите на социални медии се възпроизвеждат от невронни мрежи. Поведението на хората може да бъде свързано с моделите на разходите на хората, след като данните се анализират чрез мрежите на социалните медии. Данните от приложенията за социални медии се добиват с помощта на многослоен Perceptron ANN.
Здравеопазване – Лицата в днешния свят използват предимствата на технологиите в здравната индустрия. В здравния бизнес конволюционните невронни мрежи се използват за откриване на рентгенови лъчи, CT сканиране и ултразвук. Данните за медицински изображения, получени от гореспоменатите тестове, се оценяват и оценяват с помощта на модели на невронни мрежи, тъй като CNN се използва при обработката на изображения. При разработването на системи за разпознаване на глас се използва и рекурентната невронна мрежа (RNN).
Доклад за времето – Преди внедряването на изкуствен интелект прогнозите на метеорологичния отдел никога не са били точни. Прогнозата за времето се прави до голяма степен, за да се предскажат метеорологичните условия, които ще се случат в бъдеще. Прогнозите за времето се използват, за да се предвиди вероятността от природни бедствия в съвременния период. Прогнозата за времето се извършва с помощта на многослоен персептрон (MLP), конволюционни невронни мрежи (CNN) и повтарящи се невронни мрежи (RNN).
Отбрана – Логистиката, анализът на въоръжено нападение и местоположението на артикули използват невронни мрежи. Те също са наети във въздушни и морски патрули, както и за управление на автономни дронове. Изкуственият интелект дава на отбранителната индустрия така необходимия тласък, от който се нуждае, за да разшири своята технология. За откриване на съществуването на подводни мини се използват конволюционни невронни мрежи (CNN).

Предимства

Дори ако няколко неврона в невронна мрежа не функционират правилно, невронните мрежи все още ще генерират изходи.
Невронните мрежи имат способността да се учат в реално време и да се адаптират към променящите се настройки.
Невронните мрежи могат да се научат да изпълняват различни задачи. Да осигури правилен резултат въз основа на предоставените данни.
Невронните мрежи имат силата и способността да се справят с няколко задачи едновременно.

Недостатъци

Невронните мрежи се използват за решаване на проблеми. Той не разкрива обяснението зад „защо и как“ е направил преценките, които е направил поради сложността на мрежите. В резултат на това доверието в мрежата може да бъде ерозирано.
Компонентите на невронната мрежа са взаимозависими един от друг. Това означава, че невронните мрежи изискват (или са изключително зависими от) компютри с достатъчна изчислителна мощност.
Процесът на невронна мрежа няма конкретно правило (или правило). При техника на проба-грешка се установява правилна мрежова структура чрез опит за оптимална мрежа. Това е процедура, която изисква много фина настройка.

Заключение

В областта на невронни мрежи бързо се разширява. Изключително важно е да научите и разберете концепциите в този сектор, за да можете да се справяте с тях.

Многото видове невронни мрежи са разгледани в тази статия. Можете да използвате невронни мрежи за справяне с проблеми с данни в други области, ако научите повече за тази дисциплина.

Въведение в невронните мрежи

Какво е невронна мрежа?

Как работят невронните мрежи?