인공 지능(AI)은 원래 먼 꿈, 미래를 위한 기술로 생각되었지만 더 이상 그렇지 않습니다.
한때 연구 주제였던 것이 이제 현실 세계에서 폭발하고 있습니다. AI는 이제 직장, 학교, 은행, 병원, 심지어 휴대전화까지 다양한 장소에서 볼 수 있습니다.
그들은 자율주행 차량의 눈, Siri와 Alexa의 목소리, 일기예보 뒤에 숨은 마음, 로봇 보조 수술 뒤에 숨은 손 등입니다.
인공 지능 (AI)는 현대 생활의 흔한 특징이 되고 있습니다. 지난 몇 년 동안 AI는 광범위한 IT 기술의 주요 역할로 부상했습니다.
마지막으로 AI는 신경망을 사용하여 새로운 것을 학습합니다.
그래서 오늘 우리는 신경망, 작동 방식, 유형, 응용 프로그램 등에 대해 배울 것입니다.
신경망이란 무엇입니까?
In 기계 학습, 신경망은 인공 뉴런의 소프트웨어 프로그래밍 네트워크입니다. 그것은 우리 뇌의 뉴런과 유사한 "뉴런"의 수많은 층을 가짐으로써 인간의 뇌를 모방하려고 합니다.
뉴런의 첫 번째 레이어는 사진, 비디오, 사운드, 텍스트 및 기타 입력을 받아들입니다. 이 데이터는 한 계층의 출력이 다음 계층으로 흐르는 모든 수준을 통해 흐릅니다. 이는 기계 학습을 위한 자연어 처리와 같은 가장 어려운 작업에 중요합니다.
그러나 다른 경우에는 정확도와 효율성을 유지하면서 모델 크기를 줄이기 위해 시스템 압축을 목표로 하는 것이 좋습니다. 신경망 가지치기는 학습된 모델에서 가중치를 제거하는 것을 포함하는 압축 방법입니다. 사람과 동물을 구별하도록 훈련된 인공 지능 신경망을 생각해 보십시오.
그림은 뉴런의 첫 번째 레이어에 의해 밝은 부분과 어두운 부분으로 나뉩니다. 이 데이터는 가장자리의 위치를 결정하는 다음 레이어로 전달됩니다.
다음 레이어는 가장자리의 조합이 생성한 형태를 인식하려고 합니다. 훈련된 데이터에 따르면 데이터는 유사한 방식으로 수많은 레이어를 통과하여 제시한 이미지가 사람인지 동물인지 판별합니다.
데이터가 신경망에 제공되면 처리를 시작합니다. 그런 다음 원하는 결과를 얻기 위해 해당 수준을 통해 데이터가 처리됩니다. 신경망은 구조화된 입력에서 학습하고 결과를 표시하는 기계입니다. 신경망에서 발생할 수 있는 학습에는 세 가지 유형이 있습니다.
- 지도 학습 – 레이블이 지정된 데이터를 사용하여 입력 및 출력이 알고리즘에 제공됩니다. 데이터 분석 방법을 배운 후 의도한 결과를 예측합니다.
- 비지도 학습 – ANN은 사람의 도움 없이 학습합니다. 레이블이 지정된 데이터가 없으며 출력 데이터에서 찾은 패턴에 따라 출력이 결정됩니다.
- 강화 학습 네트워크가 수신한 피드백에서 학습하는 경우입니다.
신경망은 어떻게 작동합니까?
인공 뉴런은 정교한 시스템인 신경망에 사용됩니다. 퍼셉트론이라고도 하는 인공 뉴런은 다음 구성요소로 구성됩니다.
- 입력
- 무게
- 편견
- 활성화 기능
- 산출
신경망을 구성하는 뉴런 층. 신경망은 XNUMX개의 레이어로 구성됩니다.
- 입력 레이어
- 은닉층
- 출력 레이어
숫자 값 형태의 데이터가 입력 레이어로 전송됩니다. 네트워크의 은닉 계층은 가장 많은 계산을 수행하는 계층입니다. 마지막으로 출력 레이어는 결과를 예측합니다. 뉴런은 신경망에서 서로를 지배합니다. 뉴런은 각 레이어를 구성하는 데 사용됩니다. 입력 레이어가 데이터를 가져온 후 데이터가 은닉 레이어로 라우팅됩니다.
가중치는 각 입력에 적용됩니다. 신경망의 은닉층 내에서 가중치는 들어오는 데이터를 변환하는 값입니다. 가중치는 입력 데이터에 입력 레이어의 가중치 값을 곱하여 기능합니다.
그런 다음 첫 번째 숨겨진 레이어의 값을 시작합니다. 입력 데이터는 변환되어 숨겨진 레이어를 통해 다른 레이어로 전달됩니다. 출력 레이어는 최종 결과를 생성하는 역할을 합니다. 입력과 가중치를 곱하고 그 결과를 합으로 은닉층 뉴런에 전달합니다. 각 뉴런에는 편향이 주어집니다. 합계를 계산하기 위해 각 뉴런은 수신한 입력을 더합니다.
그 후 값은 활성화 함수를 통해 전달됩니다. 활성화 함수의 결과는 뉴런의 활성화 여부를 결정합니다. 뉴런이 활성화되면 다른 계층으로 정보를 보냅니다. 이 방법을 사용하여 뉴런이 출력 계층에 도달할 때까지 네트워크에서 데이터가 생성됩니다. 순방향 전파는 이에 대한 또 다른 용어입니다.
데이터를 입력 노드에 공급하고 출력 노드를 통해 출력을 얻는 기술을 피드 포워드 전파라고 합니다. 입력 데이터가 은닉층에 의해 받아들여지면 피드포워드 전파가 발생합니다. 활성화 함수에 따라 처리된 다음 출력으로 전달됩니다.
결과는 가장 높은 확률로 출력 레이어의 뉴런에 의해 투영됩니다. 역전파는 출력이 올바르지 않을 때 발생합니다. 가중치는 신경망을 생성하는 동안 각 입력에 초기화됩니다. 역전파는 실수를 줄이고 더 정확한 출력을 제공하기 위해 각 입력의 가중치를 재조정하는 프로세스입니다.
신경망의 유형
1. 퍼셉트론
Minsky-Papert 퍼셉트론 모델은 가장 간단하고 오래된 뉴런 모델 중 하나입니다. 들어오는 데이터에서 특성이나 비즈니스 인텔리전스를 발견하기 위해 특정 계산을 수행하는 신경망의 가장 작은 단위입니다. 가중 입력을 취하고 활성화 함수를 적용하여 최종 결과를 얻습니다. TLU(임계 논리 장치)는 퍼셉트론의 다른 이름입니다.
퍼셉트론은 데이터를 두 그룹으로 나누는 지도 학습 시스템인 이진 분류기입니다. 로직 게이트 AND, OR 및 NAND와 같은 것은 퍼셉트론으로 구현할 수 있습니다.
2. 피드포워드 신경망
입력 데이터가 한 방향으로만 흐르는 가장 기본적인 신경망 버전은 인공 신경 노드를 거쳐 출력 노드를 통해 나옵니다. 입력 및 출력 레이어는 숨겨진 레이어가 있을 수도 있고 없을 수도 있는 위치에 있습니다. 이를 기반으로 단층 또는 다층 피드포워드 신경망으로 특징지을 수 있습니다.
사용되는 레이어의 수는 함수의 복잡성에 따라 결정됩니다. 한 방향으로만 앞으로 전파되고 뒤로 전파되지 않습니다. 여기서 가중치는 일정하게 유지됩니다. 활성화 함수를 공급하기 위해 입력에 가중치를 곱합니다. 이를 위해 분류 활성화 함수 또는 단계 활성화 함수가 사용됩니다.
3. 다층 퍼셉트론
세련된 입문서 신경망, 입력 데이터가 인공 뉴런의 많은 레이어를 통해 라우팅됩니다. 모든 노드가 다음 레이어의 모든 뉴런에 연결되어 있기 때문에 완전히 연결된 신경망입니다. 다중 은닉층, 즉 적어도 XNUMX개 이상의 층이 입력층과 출력층에 존재한다.
양방향 전파를 가지고 있어 앞뒤로 전파할 수 있습니다. 입력은 가중치를 곱하고 활성화 함수로 전송되며, 여기서 손실을 최소화하기 위해 역전파를 통해 변경됩니다.
가중치는 간단히 말해서 신경망에서 머신 러닝된 값입니다. 예상 출력과 훈련 입력 간의 차이에 따라 자체 조정됩니다. Softmax는 비선형 활성화 함수 이후에 출력층 활성화 함수로 사용됩니다.
4. 컨볼루션 신경망
기존의 XNUMX차원 배열과 달리 컨볼루션 신경망은 뉴런의 XNUMX차원 구성을 가지고 있습니다. 첫 번째 레이어는 컨볼루션 레이어로 알려져 있습니다. 컨볼루션 계층의 각 뉴런은 시야의 제한된 부분에서만 정보를 처리합니다. 필터와 마찬가지로 입력 기능은 배치 모드에서 가져옵니다.
네트워크는 섹션의 사진을 이해하고 이러한 작업을 여러 번 수행하여 전체 이미지 처리를 완료할 수 있습니다.
처리하는 동안 사진이 RGB 또는 HSI에서 그레이스케일로 변환됩니다. 픽셀 값의 추가 변화는 가장자리를 감지하는 데 도움이 되며 사진을 여러 그룹으로 정렬할 수 있습니다. 단방향 전파는 CNN이 하나 이상의 컨볼루션 레이어와 풀링을 포함할 때 발생하고 양방향 전파는 이미지 분류를 위해 컨볼루션 레이어의 출력이 완전히 연결된 신경망으로 전송될 때 발생합니다.
이미지의 특정 요소를 추출하기 위해 필터가 사용됩니다. MLP에서 입력은 가중치가 부여되어 활성화 함수에 제공됩니다. RELU는 컨볼루션에 사용되는 반면 MLP는 비선형 활성화 함수 다음에 softmax를 사용합니다. 사진 및 비디오 인식, 의미론적 구문 분석 및 의역 감지에서 컨볼루션 신경망은 우수한 결과를 생성합니다.
5. 방사형 바이어스 네트워크
입력 벡터 다음에는 방사형 기저 기능 네트워크의 각 범주에 대해 하나의 노드가 있는 RBF 뉴런 레이어와 출력 레이어가 옵니다. 입력은 각 뉴런이 프로토타입을 유지하는 훈련 세트의 데이터 포인트와 비교하여 분류됩니다. 이것은 훈련 세트의 예 중 하나입니다.
각 뉴런은 새로운 입력 벡터[분류하려는 n차원 벡터]를 분류해야 할 때 입력과 프로토타입 사이의 유클리드 거리를 계산합니다. 클래스 A와 클래스 B의 두 가지 클래스가 있는 경우 분류할 새 입력은 클래스 B 프로토타입보다 클래스 A 프로토타입과 더 유사합니다.
결과적으로 클래스 A로 분류되거나 분류될 수 있습니다.
6. 순환 신경망
Recurrent Neural Networks는 계층의 출력을 저장한 다음 계층의 결과를 예측하는 데 도움이 되도록 다시 입력에 피드백하도록 설계되었습니다. 피드포워드 신경망 는 일반적으로 초기 계층이고, 그 뒤에는 순환 신경망 계층이 있으며, 여기서 메모리 기능은 이전 시간 단계에서 가지고 있던 정보의 일부를 기억합니다.
이 시나리오는 순방향 전파를 사용합니다. 미래에 필요할 데이터를 저장합니다. 예측이 잘못된 경우 학습률을 사용하여 약간의 조정을 수행합니다. 결과적으로 역전파가 진행됨에 따라 점점 더 정확해질 것입니다.
어플리케이션
신경망은 다양한 분야에서 데이터 문제를 처리하는 데 사용됩니다. 몇 가지 예가 아래에 나와 있습니다.
- 안면 인식 – 안면 인식 솔루션은 효과적인 감시 시스템 역할을 합니다. 인식 시스템은 디지털 사진을 사람의 얼굴과 연관시킵니다. 사무실에서 선별진료용으로 사용합니다. 따라서 시스템은 사람의 얼굴을 확인하고 이를 데이터베이스에 저장된 ID 목록과 비교합니다.
- 주식 예측 – 투자는 시장 위험에 노출됩니다. 극도로 변동성이 큰 주식 시장에서 미래의 발전을 예측하는 것은 사실상 어렵습니다. 신경망 이전에는 끊임없이 변화하는 강세 및 약세 단계를 예측할 수 없었습니다. 그러나 무엇이 모든 것을 바꾸었습니까? 물론, 우리는 신경망에 대해 이야기하고 있습니다. 실시간으로 성공적인 주식 예측을 생성하기 위해 Multilayer Perceptron MLP(피드포워드 인공 지능 시스템의 일종)가 사용됩니다.
- 소셜 미디어 – 아무리 진부하게 들릴지라도 소셜 미디어는 평범한 존재의 길을 바꾸어 놓았습니다. 인공 신경망을 사용하여 소셜 미디어 사용자의 행동을 연구합니다. 경쟁 분석을 위해 가상 인터랙션을 통해 매일 공급되는 데이터를 쌓아 검토합니다. 소셜 미디어 사용자의 행동은 신경망에 의해 복제됩니다. 데이터가 소셜 미디어 네트워크를 통해 분석되면 개인의 행동은 사람들의 지출 패턴과 연결될 수 있습니다. 소셜 미디어 애플리케이션의 데이터는 Multilayer Perceptron ANN을 사용하여 마이닝됩니다.
- 의료 – 오늘날의 개인은 의료 산업에서 기술의 이점을 활용하고 있습니다. 의료 사업에서 Convolutional Neural Networks는 X-ray 감지, CT 스캔 및 초음파에 사용됩니다. 앞서 언급한 테스트에서 수신한 의료 영상 데이터는 CNN이 영상 처리에 사용되는 것처럼 신경망 모델을 사용하여 평가 및 평가됩니다. 음성 인식 시스템의 개발에는 RNN(Recurrent Neural Network)도 사용됩니다.
- 기상 보고 – 인공 지능이 구현되기 전에는 기상청의 예측이 정확하지 않았습니다. 일기 예보는 주로 미래에 발생할 기상 조건을 예측하기 위해 수행됩니다. 기상예보는 현대의 자연재해 발생 가능성을 예측하는 데 활용되고 있다. 기상 예측은 다층 퍼셉트론(MLP), 컨볼루션 신경망(CNN) 및 순환 신경망(RNN)을 사용하여 수행됩니다.
- 방어 - 물류, 무장 공격 분석 및 항목 위치는 모두 신경망을 사용합니다. 그들은 또한 항공 및 해상 순찰과 자율 드론을 관리하는 데 고용됩니다. 인공 지능은 방위 산업이 기술을 확장하는 데 필요한 지원을 제공하고 있습니다. 수중 지뢰의 존재를 탐지하기 위해 CNN(Convolutional Neural Networks)이 사용됩니다.
장점
- 신경망의 일부 뉴런이 제대로 작동하지 않더라도 신경망은 여전히 출력을 생성합니다.
- 신경망은 실시간으로 학습하고 변화하는 설정에 적응할 수 있습니다.
- 신경망은 다양한 작업을 수행하는 방법을 배울 수 있습니다. 제공된 데이터를 기반으로 올바른 결과를 제공합니다.
- 신경망은 동시에 여러 작업을 처리할 수 있는 강점과 능력을 가지고 있습니다.
단점
- 신경망은 문제를 해결하는 데 사용됩니다. 네트워크의 복잡성으로 인해 "왜, 어떻게" 판단했는지에 대한 설명은 공개하지 않습니다. 결과적으로 네트워크 신뢰가 손상될 수 있습니다.
- 신경망의 구성 요소는 서로 상호 의존적입니다. 즉, 신경망은 충분한 컴퓨팅 성능을 갖춘 컴퓨터를 요구(또는 극도로 의존)합니다.
- 신경망 프로세스에는 특정 규칙(또는 경험 법칙)이 없습니다. 시행착오 기법에서는 최적의 네트워크를 시도하여 올바른 네트워크 구조를 설정합니다. 많은 미세 조정이 필요한 절차입니다.
결론
분야 신경망 빠르게 확대되고 있습니다. 이 분야의 개념을 배우고 이해하는 것이 중요합니다.
이 기사에서는 다양한 유형의 신경망을 다뤘습니다. 이 분야에 대해 더 많이 배우면 신경망을 사용하여 다른 분야의 데이터 문제를 해결할 수 있습니다.
댓글을 남겨주세요.