Спочатку вважалося, що штучний інтелект (ШІ) — це далека мрія, технологія майбутнього, але це вже не так.
Те, що колись було темою дослідження, зараз вибухає в реальному світі. ШІ тепер можна знайти в різних місцях, включаючи ваше робоче місце, школу, банківську службу, лікарні і навіть телефон.
Це очі самокерованих транспортних засобів, голоси Сірі та Алекси, уми, які стоять за прогнозом погоди, руки, що стоять за роботизованою хірургією тощо.
штучний інтелект (AI) стає звичайною особливістю сучасного життя. За останні кілька років штучний інтелект став основним гравцем у широкому спектрі ІТ-технологій.
Нарешті, нейронна мережа використовується ШІ для вивчення нових речей.
Тому сьогодні ми дізнаємося про нейронні мережі, як вони працюють, їх типи, застосування та багато іншого.
Що таке нейронна мережа?
In навчання за допомогою машини, нейронна мережа – це програмно-програмована мережа штучних нейронів. Він намагається імітувати людський мозок, маючи численні шари «нейронів», подібних до нейронів нашого мозку.
Перший шар нейронів прийматиме фотографії, відео, звук, текст та інші дані. Ці дані протікають через усі рівні, а вихідні дані одного шару перетікають у наступний. Це важливо для найскладніших завдань, таких як обробка природної мови для машинного навчання.
Однак в інших випадках бажано прагнути до стиснення системи для зменшення розміру моделі при збереженні точності та ефективності. Обрізання нейронної мережі — це метод стиснення, який включає видалення ваг із вивченої моделі. Розглянемо нейронну мережу зі штучним інтелектом, яку навчили відрізняти людей від тварин.
Перший шар нейронів розділить картинку на світлу і темну. Ці дані будуть передані в наступний шар, який визначить, де знаходяться краї.
Наступний шар спробує розпізнати форми, які породила комбінація країв. Відповідно до даних, на яких вони були підготовлені, дані будуть проходити крізь численні шари подібним чином, щоб визначити, чи зображено вами зображення людини чи тварини.
Коли дані передаються в нейронну мережу, вона починає їх обробляти. Після цього дані обробляються через рівні для отримання бажаного результату. Нейронна мережа – це машина, яка навчається на структурованому введенні та відображає результати. Існує три типи навчання, яке може відбуватися в нейронних мережах:
- Навчання з наглядом – вхідні та вихідні дані надаються алгоритмам за допомогою позначених даних. Після того, як їх навчили аналізувати дані, вони прогнозують очікуваний результат.
- Навчання без нагляду – ШНМ навчається без допомоги людини. Немає позначених даних, а вихідні дані визначаються шаблонами, знайденими у вихідних даних.
- Навчання зміцненню коли мережа вчиться на отриманому зворотному зв’язку.
Як працюють нейронні мережі?
Штучні нейрони використовуються в нейронних мережах, які є складними системами. Штучні нейрони, також відомі як персептрони, складаються з таких компонентів:
- вхід
- вага
- Зсув
- Функція активації
- Вихід
Шари нейронів, які утворюють нейронні мережі. Нейронна мережа складається з трьох шарів:
- Вхідний шар
- Прихований шар
- Вихідний шар
Дані у вигляді числового значення відправляються на вхідний шар. Найбільше обчислень виконують приховані шари мережі. Вихідний шар, не в останню чергу, прогнозує результат. Нейрони домінують один над одним у нейронній мережі. Для побудови кожного шару використовуються нейрони. Дані спрямовуються до прихованого шару після того, як їх отримує вхідний шар.
До кожного входу застосовуються ваги. У прихованих шарах нейронної мережі вага — це значення, яке транслює вхідні дані. Вагові показники функціонують шляхом множення вхідних даних на значення ваги у вхідному шарі.
Потім починається значення першого прихованого шару. Вхідні дані трансформуються та передаються іншому шару через приховані шари. Вихідний шар відповідає за генерацію кінцевого результату. Вхідні дані та ваги перемножуються, і результат передається нейронам прихованого шару у вигляді суми. Кожному нейрону надано зміщення. Щоб обчислити загальну суму, кожен нейрон додає отримані вхідні дані.
Після цього значення передається через функцію активації. Результат функції активації визначає, чи активований нейрон. Коли нейрон активний, він надсилає інформацію іншим шарам. Дані створюються в мережі, поки нейрон не досягне вихідного шару за допомогою цього методу. Поширення вперед — це ще один термін для цього.
Техніка подачі даних у вхідний вузол і отримання вихідних даних через вихідний вузол відома як пряме поширення. Коли вхідні дані приймаються прихованим шаром, відбувається пряме поширення. Він обробляється відповідно до функції активації, а потім передається на вихід.
Результат проектується нейроном у вихідному шарі з найбільшою ймовірністю. Зворотне поширення відбувається, коли вихід неправильний. Під час створення нейронної мережі для кожного входу ініціалізуються ваги. Зворотне поширення – це процес коригування ваги кожного введення, щоб зменшити кількість помилок і забезпечити більш точний вихід.
Типи нейронних мереж
1. Персептрон
Модель персептрона Мінського-Паперта є однією з найпростіших і найстаріших моделей нейронів. Це найменша одиниця нейронної мережі, яка виконує певні обчислення для виявлення характеристик або бізнес-аналітики у вхідних даних. Він приймає зважені вхідні дані та застосовує функцію активації, щоб отримати кінцевий результат. TLU (порогова логічна одиниця) — це інша назва персептрона.
Perceptron — це двійковий класифікатор, який являє собою контрольовану систему навчання, яка поділяє дані на дві групи. Логічні ворота такі як І, АБО та NAND можуть бути реалізовані за допомогою персептронів.
2. Нейронна мережа з прямим зв'язком
Найпростіший варіант нейронних мереж, в якому вхідні дані протікають виключно в одному напрямку, проходять через штучні нейронні вузли і виходять через вихідні вузли. Вхідні та вихідні шари присутні в місцях, де приховані шари можуть бути або не бути присутніми. На основі цього їх можна охарактеризувати як одношарову або багатошарову нейронну мережу з прямим зв’язком.
Кількість використовуваних шарів визначається складністю функції. Він поширюється тільки вперед в одному напрямку і не поширюється назад. Тут ваги залишаються незмінними. Вхідні дані помножуються на ваги, щоб подати функцію активації. Для цього використовується функція активації класифікації або функція крокової активації.
3. Багатошаровий персептрон
Вступ до витонченого нейронні мережі, у якому вхідні дані направляються через багато шарів штучних нейронів. Це повністю пов’язана нейронна мережа, оскільки кожен вузол пов’язаний з усіма нейронами наступного рівня. Кілька прихованих шарів, тобто щонайменше три або більше шарів, присутні у вхідному та вихідному шарах.
Він має двонаправлене поширення, що означає, що він може поширюватися як вперед, так і назад. Вхідні дані помножуються на ваги та надсилаються до функції активації, де вони змінюються шляхом зворотного поширення, щоб мінімізувати втрати.
Простіше кажучи, ваги — це значення, отримані машинним шляхом від нейронних мереж. Залежно від невідповідності між очікуваними результатами та вхідними матеріалами для навчання вони самостійно коригуються. Softmax використовується як функція активації вихідного рівня після нелінійних функцій активації.
4. Згортка нейронна мережа
На відміну від традиційного двовимірного масиву, нейронна мережа згортки має тривимірну конфігурацію нейронів. Перший шар відомий як згортковий шар. Кожен нейрон у згортковому шарі обробляє інформацію лише з обмеженої частини поля зору. Подібно фільтру, функції введення використовуються в пакетному режимі.
Мережа розпізнає зображення в розділах і може виконувати ці дії багато разів, щоб завершити всю обробку зображення.
Під час обробки зображення перетворюється з RGB або HSI у відтінки сірого. Подальші варіації значення пікселів допоможуть виявити краї, а зображення можна сортувати на кілька груп. Однонаправлене розповсюдження відбувається, коли CNN містить один або кілька згорткових шарів з подальшим об’єднанням, а двонаправлене поширення відбувається, коли вихідні дані шару згортки надсилаються до повністю підключеної нейронної мережі для класифікації зображень.
Щоб виділити певні елементи зображення, використовуються фільтри. У MLP вхідні дані зважуються та надходять у функцію активації. RELU використовується для згортки, тоді як MLP використовує функцію нелінійної активації, за якою слід softmax. Згорткові нейронні мережі дають чудові результати у розпізнаванні зображень і відео, семантичному аналізі та виявленні парафразів.
5. Радіальна мережа зміщення
За вхідним вектором слідує шар нейронів RBF і вихідний шар з одним вузлом для кожної категорії в мережі радіальних базових функцій. Вхідні дані класифікуються шляхом порівняння з даними з навчального набору, де кожен нейрон підтримує прототип. Це один із прикладів навчального набору.
Кожен нейрон обчислює евклідову відстань між вхідним сигналом і його прототипом, коли новий вхідний вектор [n-вимірний вектор, який ви намагаєтеся категоризувати] має бути класифікований. Якщо у нас є два класи, клас A і клас B, нові вхідні дані, які потрібно класифікувати, більше схожі на прототипи класу A, ніж на прототипи класу B.
У результаті він може бути позначений або класифікований як клас А.
6. Рекурентна нейронна мережа
Повторювані нейронні мережі призначені для збереження вихідних даних шару, а потім передачі їх назад у вхідні дані, щоб допомогти спрогнозувати результат шару. Подача вперед нейронної мережі зазвичай це початковий рівень, за яким слідує повторюваний рівень нейронної мережі, де функція пам’яті запам’ятовує частину інформації, яку вона мала на попередньому кроці часу.
Цей сценарій використовує пряме поширення. Це зберігає дані, які знадобляться в майбутньому. У випадку, якщо прогноз неправильний, швидкість навчання використовується для внесення незначних коригувань. В результаті, у міру розвитку зворотного поширення воно буде ставати все точнішим.
додатків
Нейронні мережі використовуються для вирішення проблем з даними в різних дисциплінах; деякі приклади наведено нижче.
- Розпізнавання обличчя – Рішення для розпізнавання обличчя служать ефективними системами спостереження. Системи розпізнавання пов'язують цифрові фотографії з людськими обличчями. Вони використовуються в офісах для вибіркового входу. Таким чином, системи перевіряють людське обличчя і порівнюють його зі списком ідентифікаторів, що зберігаються в її базі даних.
- Прогноз акцій – інвестиції піддаються ринковим ризикам. Практично важко передбачити майбутні події на надзвичайно нестабільному фондовому ринку. До нейронних мереж постійно змінювані бичачі та ведмежі фази були непередбачуваними. Але що все змінило? Звичайно, ми говоримо про нейронні мережі… Багатошаровий Perceptron MLP (тип системи штучного інтелекту з прямим зв’язком) використовується для створення успішного прогнозу запасів у реальному часі.
- Соціальні мережі – Як би банально це не звучало, соціальні мережі змінили буденний шлях існування. Поведінка користувачів соцмереж вивчається за допомогою штучних нейронних мереж. Для конкурентного аналізу дані, що надходять щодня через віртуальні взаємодії, накопичуються та перевіряються. Дії користувачів соцмереж тиражуються нейронними мережами. Після аналізу даних у соціальних мережах поведінку людей можна пов’язати з моделями витрат людей. Дані з додатків соціальних мереж видобуваються за допомогою багатошарового Perceptron ANN.
- Охорона здоров’я. У сучасному світі люди використовують переваги технологій у галузі охорони здоров’я. У сфері охорони здоров’я згорткові нейронні мережі використовуються для виявлення рентгенівських променів, КТ та ультразвуку. Дані медичної візуалізації, отримані від вищезгаданих тестів, оцінюються та оцінюються за допомогою нейронних моделей, оскільки CNN використовується для обробки зображень. При розробці систем розпізнавання голосу також використовується рекурентна нейронна мережа (RNN).
- Звіт про погоду – До впровадження штучного інтелекту прогнози метеорологічного відділу ніколи не були точними. Прогноз погоди робиться в основному для того, щоб передбачити погодні умови, які відбуватимуться в майбутньому. Прогнози погоди використовуються, щоб передбачити ймовірність стихійних лих у сучасний період. Прогноз погоди виконується за допомогою багатошарового персептрона (MLP), згорткових нейронних мереж (CNN) і рекурентних нейронних мереж (RNN).
- Оборона – логістика, аналіз збройного нападу та розташування предметів використовують нейронні мережі. Вони також працюють у повітряному та морському патруліванні, а також для управління автономними безпілотниками. Штучний інтелект дає оборонній промисловості необхідний імпульс, необхідний для розширення своїх технологій. Для виявлення існування підводних мін використовуються згорткові нейронні мережі (CNN).
Переваги
- Навіть якщо кілька нейронів нейронної мережі не функціонують належним чином, нейронні мережі все одно будуть генерувати вихідні дані.
- Нейронні мережі мають здатність навчатися в режимі реального часу та адаптуватися до змінних налаштувань.
- Нейронні мережі можуть навчитися виконувати різноманітні завдання. Надати правильний результат на основі наданих даних.
- Нейронні мережі мають силу та здатність виконувати декілька завдань одночасно.
Недоліки
- Для вирішення завдань використовуються нейронні мережі. У ньому не розкривається пояснення «чому і як» було прийнято рішення через складність мереж. В результаті довіра до мережі може бути підірвана.
- Компоненти нейронної мережі взаємозалежні один від одного. Тобто нейронні мережі вимагають (або надзвичайно залежать від них) комп’ютерів із достатньою обчислювальною потужністю.
- Процес нейронної мережі не має певного правила (або емпіричного правила). У техніці проб і помилок правильна структура мережі встановлюється шляхом спроби оптимальної мережі. Це процедура, яка вимагає багато тонкого налаштування.
Висновок
Поле Росії нейронні мережі швидко розширюється. Дуже важливо вивчити та зрозуміти концепції в цьому секторі, щоб мати змогу з ними працювати.
У цій статті розглянуто багато типів нейронних мереж. Ви можете використовувати нейронні мережі для вирішення проблем із даними в інших областях, якщо ви дізнаєтеся більше про цю дисципліну.
залишити коментар