30개 이상의 딥 러닝 인터뷰 질문

차례[숨다][보여 주다]

1. 딥러닝이란 정확히 무엇인가요?
2. 딥 러닝과 머신 러닝의 차이점은 무엇입니까?
3. 신경망에 대한 현재 이해는 무엇입니까?
4. 퍼셉트론이란 정확히 무엇입니까?
5. 심층 신경망이란 정확히 무엇입니까?
6. 다층 퍼셉트론(MLP)이란 정확히 무엇입니까?
7. 신경망에서 활성화 함수는 어떤 목적을 수행합니까?
8. 경사하강법이란 정확히 무엇입니까?
9. 비용 함수는 정확히 무엇입니까?
10. 깊은 네트워크가 얕은 네트워크보다 성능이 더 좋은 방법은 무엇입니까?
11. 순방향 전파를 설명하십시오.
12. 역전파란 무엇입니까?
13. 딥 러닝의 맥락에서 그래디언트 클리핑을 어떻게 이해합니까?
14. Softmax 및 ReLU 기능은 무엇입니까?
15. 모든 가중치를 0으로 설정한 상태에서 신경망 모델을 훈련할 수 있습니까?
16. Epoch를 배치 및 반복과 구별하는 것은 무엇입니까?
17. 배치 정규화 및 드롭아웃이란 무엇입니까?
18. 확률적 그라디언트 디센트와 배치 그라디언트 디센트를 구분하는 것은 무엇입니까?
19. 신경망에 비선형성을 포함하는 것이 왜 중요한가요?
20. 딥 러닝에서 텐서는 무엇입니까?
21. 딥러닝 모델의 활성화 함수를 어떻게 선택하시겠습니까?
22. CNN은 무엇을 의미합니까?
23. 많은 CNN 레이어는 무엇입니까?
24. 과대적합과 과소적합의 영향은 무엇이며 어떻게 피할 수 있습니까?
25. 딥러닝에서 RNN이란 무엇입니까?
26. 아담 옵티마이저에 대해 설명하라
27. 딥 오토인코더: 무엇입니까?
28. Tensorflow에서 Tensor는 무엇을 의미합니까?
29. 계산 그래프에 대한 설명
30. 생성적 적대 네트워크(GAN): 무엇입니까?
31. 아키텍처를 설계할 때 신경망에 포함할 뉴런과 은닉층의 수를 어떻게 선택합니까?
32. 심층 강화 학습에는 어떤 종류의 신경망이 사용됩니까?
결론

딥 러닝은 완전히 새로운 아이디어가 아닙니다. 인공 신경망은 딥 러닝으로 알려진 기계 학습 하위 집합의 유일한 기초 역할을 합니다.

딥 러닝은 신경망이 인간의 두뇌를 모방하도록 만들어졌기 때문에 인간의 두뇌를 모방한 것입니다.

한동안 이런 일이 있었습니다. 오늘날 우리는 처리 능력이나 데이터가 지금만큼 많지 않기 때문에 모두가 그것에 대해 이야기하고 있습니다.

지난 20년 동안 처리 능력의 급격한 증가로 인해 딥 러닝과 머신 러닝이 등장했습니다.

깊은 학습

꿈의 직업을 찾을 때 직면할 수 있는 모든 질문에 대비할 수 있도록 이 게시물은 간단한 것부터 복잡한 것까지 다양한 딥 러닝 면접 질문을 안내합니다.

1. 딥러닝이란 정확히 무엇인가요?

참석하는 경우 깊은 학습 인터뷰를 하면 딥 러닝이 무엇인지 의심할 여지 없이 이해하게 될 것입니다. 그러나 면접관은 귀하가 이 질문에 대한 답변으로 삽화와 함께 자세한 답변을 제공하기를 기대합니다.

훈련하기 위해서는 신경망 딥 러닝의 경우 상당한 양의 조직화되거나 구조화되지 않은 데이터를 사용해야 합니다. 숨겨진 패턴과 특성을 찾기 위해 복잡한 절차(예: 고양이 이미지와 강아지 이미지 구별)를 수행합니다.

2. 딥 러닝과 머신 러닝의 차이점은 무엇입니까?

기계 학습으로 알려진 인공 지능의 한 분야로서 우리는 데이터와 통계 및 알고리즘 기술을 사용하여 컴퓨터를 훈련하여 시간이 지남에 따라 더 나아질 수 있도록 합니다.

의 측면으로 기계 학습, 딥 러닝은 인간의 두뇌에서 볼 수 있는 신경망 아키텍처를 모방합니다.

3. 신경망에 대한 현재 이해는 무엇입니까?

신경망으로 알려진 인공 시스템은 인체에서 발견되는 유기적 신경망과 매우 유사합니다.

방법과 유사한 기술을 사용하여 인간의 뇌 기능에서 신경망은 데이터 조각에서 기본 상관 관계를 식별하는 것을 목표로 하는 알고리즘 모음입니다.

이러한 시스템은 작업별 규칙을 따르지 않고 다양한 데이터 세트와 예제에 노출되어 작업별 지식을 얻습니다.

아이디어는 이러한 데이터 세트에 대한 사전 프로그래밍된 이해를 갖는 대신 시스템이 제공된 데이터와 구별되는 특성을 학습한다는 것입니다.

신경망에서 가장 일반적으로 사용되는 세 가지 네트워크 계층은 다음과 같습니다.

입력 레이어
은닉층
출력 레이어

4. 퍼셉트론이란 정확히 무엇입니까?

인간의 뇌에서 발견되는 생물학적 뉴런은 퍼셉트론과 비슷합니다. 퍼셉트론은 여러 입력을 수신한 다음 수많은 변환과 기능을 수행하고 출력을 생성합니다.

퍼셉트론이라는 선형 모델이 이진 분류에 사용됩니다. 각각 다른 가중치를 갖는 다양한 입력으로 뉴런을 시뮬레이션합니다.

뉴런은 이러한 가중치 입력을 사용하여 함수를 계산하고 결과를 출력합니다.

5. 심층 신경망이란 정확히 무엇입니까?

심층 신경망은 입력 계층과 출력 계층(DNN) 사이에 여러 계층이 있는 인공 신경망(ANN)입니다.

심층 신경망은 심층 아키텍처 신경망입니다. "깊은"이라는 단어는 단일 계층에 많은 수준과 단위가 있는 기능을 나타냅니다. 더 많은 수준의 패턴을 캡처하기 위해 더 많은 레이어를 추가하여 더 정확한 모델을 생성할 수 있습니다.

6. 다층 퍼셉트론(MLP)이란 정확히 무엇입니까?

입력, 은닉 및 출력 레이어는 신경망과 마찬가지로 MLP에 존재합니다. 하나 이상의 은닉층이 있는 단층 퍼셉트론과 유사하게 구축됩니다.

단일 레이어 퍼셉트론의 이진 출력은 선형 분리 가능한 클래스(0,1)만 분류할 수 있는 반면 MLP는 비선형 클래스를 분류할 수 있습니다.

7. 신경망에서 활성화 함수는 어떤 목적을 수행합니까?

활성화 함수는 뉴런이 가장 기본적인 수준에서 활성화되어야 하는지 여부를 결정합니다. 모든 활성화 함수는 입력과 편향의 가중치 합을 입력으로 받아들일 수 있습니다. 활성화 함수에는 단계 함수, Sigmoid, ReLU, Tanh 및 Softmax가 포함됩니다.

8. 경사하강법이란 정확히 무엇입니까?

비용 함수 또는 오류를 최소화하는 가장 좋은 방법은 경사하강법입니다. 함수의 로컬-글로벌 최소값을 찾는 것이 목표입니다. 이것은 모델이 오류를 최소화하기 위해 따라야 하는 경로를 지정합니다.

9. 비용 함수는 정확히 무엇입니까?

비용 함수는 모델의 성능을 평가하는 지표입니다. "손실" 또는 "오류"라고도 합니다. 역전파 동안 출력 레이어의 오류를 계산하는 데 사용됩니다.

우리는 그 부정확성을 신경망을 통해 다시 푸시함으로써 신경망의 훈련 프로세스를 발전시키기 위해 이용합니다.

10. 깊은 네트워크가 얕은 네트워크보다 성능이 더 좋은 방법은 무엇입니까?

입력 및 출력 레이어 외에 신경망에 은닉 레이어가 추가됩니다. 입력 레이어와 출력 레이어 사이에 얕은 신경망은 단일 은닉 레이어를 사용하는 반면 심층 신경망은 여러 수준을 사용합니다.

얕은 네트워크는 모든 기능에 적합하기 위해 여러 매개변수가 필요합니다. 심층 네트워크는 여러 계층을 포함하기 때문에 적은 수의 매개변수로도 함수에 더 적합할 수 있습니다.

음성 인식이든 그림 인식이든 관계없이 모든 유형의 데이터 모델링 작업에서 다용도로 인해 딥 네트워크가 선호됩니다.

11. 순방향 전파를 설명하십시오.

입력은 전달 전파로 알려진 프로세스에서 가중치와 함께 매립 계층으로 전송됩니다.

활성화 함수의 출력은 처리가 다음 레이어로 넘어갈 수 있기 전에 각 매몰 레이어에서 계산됩니다.

프로세스는 입력 계층에서 시작하여 최종 출력 계층으로 진행하므로 이름이 순방향 전파입니다.

12. 역전파란 무엇입니까?

가중치와 편향이 신경망에서 조정될 때 역전파는 먼저 값이 어떻게 변하는지 관찰하여 비용 함수를 줄이는 데 사용됩니다.

각 숨겨진 레이어의 기울기를 이해하면 이 변경 사항을 간단하게 계산할 수 있습니다.

역전파(backpropagation)라고 하는 프로세스는 출력 계층에서 시작하여 입력 계층으로 뒤로 이동합니다.

13. 딥 러닝의 맥락에서 그래디언트 클리핑을 어떻게 이해합니까?

그라디언트 클리핑은 역전파 동안 발생하는 그라디언트 폭발 문제를 해결하기 위한 방법입니다.

그라디언트 폭발은 훈련 중에 그라디언트가 너무 커져 모델이 불안정해질 때 발생하는 문제입니다. 그래디언트가 예상 범위를 넘으면 그래디언트 값이 요소별로 미리 정의된 최소값 또는 최대값으로 푸시됩니다.

그라디언트 클리핑은 훈련 중 신경망의 수치적 안정성을 향상시키지만 모델의 성능에는 최소한의 영향을 미칩니다.

14. Softmax 및 ReLU 기능은 무엇입니까?

Softmax라는 활성화 함수는 0과 1 사이의 출력을 생성합니다. 각 출력은 모든 출력의 합이 XNUMX이 되도록 분할됩니다. 출력 레이어의 경우 Softmax가 자주 사용됩니다.

ReLU라고도 하는 Rectified Linear Unit은 가장 많이 사용되는 활성화 함수입니다. X가 양수이면 X를 출력하고 그렇지 않으면 XNUMX을 출력합니다. ReLU는 매립층에 정기적으로 적용됩니다.

15. 모든 가중치를 0으로 설정한 상태에서 신경망 모델을 훈련할 수 있습니까?

신경망은 주어진 작업을 완료하는 법을 배우지 않으므로 모든 가중치를 0으로 초기화하여 모델을 훈련하는 것은 불가능합니다.

모든 가중치가 1으로 초기화되면 도함수는 W[XNUMX]의 모든 가중치에 대해 동일하게 유지되어 뉴런이 동일한 기능을 반복적으로 학습하게 됩니다.

단순히 가중치를 0으로 초기화하는 것이 아니라 모든 형태의 상수로 초기화하면 수준 이하의 결과가 나올 수 있습니다.

16. Epoch를 배치 및 반복과 구별하는 것은 무엇입니까?

데이터 세트 및 경사 하강법 처리의 다양한 형태에는 배치, 반복 및 에포크가 포함됩니다. Epoch에는 전체 데이터 세트가 있는 신경망을 통해 순방향 및 역방향 모두가 포함됩니다.

한 번의 시도로 전달하기에는 너무 커서 신뢰할 수 있는 결과를 제공하기 위해 데이터 세트를 여러 번 전달하는 경우가 많습니다.

신경망을 통해 소량의 데이터를 반복적으로 실행하는 이러한 관행을 반복이라고 합니다. 데이터 세트가 신경망을 성공적으로 통과하도록 보장하기 위해 일괄 처리라고 하는 여러 일괄 처리 또는 하위 집합으로 나눌 수 있습니다.

데이터 수집 크기에 따라 에포크, 반복 및 배치 크기의 세 가지 방법 모두 기본적으로 경사 하강법 알고리즘.

17. 배치 정규화 및 드롭아웃이란 무엇입니까?

Dropout은 보이는 네트워크 유닛과 숨겨진 네트워크 유닛을 모두 무작위로 제거하여 데이터 과적합을 방지합니다(일반적으로 노드의 20% 삭제). 네트워크를 수렴하는 데 필요한 반복 횟수를 두 배로 늘립니다.

각 계층의 입력을 정규화하여 평균 출력 활성화가 XNUMX이고 표준 편차가 XNUMX이 되도록 배치 정규화는 신경망의 성능과 안정성을 향상시키는 전략입니다.

18. 확률적 그라디언트 디센트와 배치 그라디언트 디센트를 구분하는 것은 무엇입니까?

배치 경사하강법:

전체 데이터 세트는 배치 그라디언트에 대한 그라디언트를 구성하는 데 사용됩니다.
엄청난 양의 데이터와 천천히 업데이트되는 가중치로 인해 수렴이 어렵습니다.

확률적 경사하강법:

확률적 기울기는 단일 샘플을 사용하여 기울기를 계산합니다.
더 빈번한 가중치 변경으로 인해 배치 기울기보다 훨씬 더 빨리 수렴됩니다.

19. 신경망에 비선형성을 포함하는 것이 왜 중요한가요?

레이어가 아무리 많아도 신경망은 비선형성이 없으면 퍼셉트론처럼 작동하여 출력이 입력에 선형적으로 종속됩니다.

다시 말해, n개의 레이어와 m개의 은닉 유닛과 선형 활성화 함수가 있는 신경망은 은닉 레이어가 없고 선형 분리 경계만 감지하는 기능이 있는 선형 신경망과 동일합니다.

비선형성이 없으면 신경망은 복잡한 문제를 해결하고 입력을 정확하게 분류할 수 없습니다.

20. 딥 러닝에서 텐서는 무엇입니까?

텐서로 알려진 다차원 배열은 행렬과 벡터의 일반화 역할을 합니다. 딥러닝을 위한 중요한 데이터 구조입니다. 기본 데이터 유형의 N차원 배열은 텐서를 나타내는 데 사용됩니다.

텐서의 모든 구성 요소는 동일한 데이터 유형을 가지며 이 데이터 유형은 항상 알려져 있습니다. 모양의 한 부분, 즉 차원이 몇 개이고 각 차원이 얼마나 큰지만 알 수 있습니다.

입력도 완전히 알려진 상황에서 대부분의 연산은 완전히 알려진 텐서를 생성합니다. 다른 경우에는 그래프 실행 중에만 텐서 형식을 설정할 수 있습니다.

21. 딥러닝 모델의 활성화 함수를 어떻게 선택하시겠습니까?

예상해야 하는 결과가 실제라면 선형 활성화 함수를 사용하는 것이 합리적입니다.
예측해야 하는 출력이 이진 클래스 확률인 경우 Sigmoid 함수를 사용해야 합니다.
예상 출력에 두 가지 분류가 포함된 경우 Tanh 함수를 사용할 수 있습니다.
ReLU 함수는 계산이 용이하여 다양한 상황에 적용할 수 있습니다.

22. CNN은 무엇을 의미합니까?

시각적 이미지 평가를 전문으로 하는 심층 신경망에는 합성곱 신경망(CNN 또는 ConvNet)이 포함됩니다. 여기서 벡터가 입력을 나타내는 신경망이 아니라 입력은 다중 채널 그림입니다.

다층 퍼셉트론은 전처리가 거의 필요하지 않은 CNN에서 특별한 방식으로 사용됩니다.

23. 많은 CNN 레이어는 무엇입니까?

컨볼루션 레이어: 메인 레이어는 다양한 학습 가능한 필터와 수용 필드가 있는 컨볼루션 레이어입니다. 이 초기 계층은 입력 데이터를 받아 특성을 추출합니다.

ReLU 레이어: 네트워크를 비선형으로 만들어 음의 픽셀을 XNUMX으로 만듭니다.

풀링 계층: 처리 및 네트워크 설정을 최소화하여 풀링 계층은 표현의 공간 크기를 점차적으로 최소화합니다. Max pooling은 가장 많이 사용되는 pooling 방법이다.

24. 과대적합과 과소적합의 영향은 무엇이며 어떻게 피할 수 있습니까?

모델이 학습 데이터의 복잡성과 노이즈를 학습하여 모델의 새로운 데이터 사용에 부정적인 영향을 미칠 때 이를 과적합이라고 합니다.

목표 함수를 학습하는 동안 더 적응할 수 있는 비선형 모델에서 발생할 가능성이 더 높습니다. 모델은 자동차와 트럭을 감지하도록 훈련될 수 있지만 특정 상자 형태의 차량만 식별할 수 있습니다.

한 종류의 트럭에 대해서만 훈련을 받았기 때문에 평판 트럭을 감지하지 못할 수도 있습니다. 훈련 데이터에서 모델은 잘 작동하지만 실제 세계에서는 작동하지 않습니다.

under-fitting 모델은 데이터에 대해 충분히 훈련되지 않았거나 새로운 정보로 일반화할 수 없는 모델을 나타냅니다. 이는 불충분하거나 부정확한 데이터로 모델을 훈련할 때 자주 발생합니다.

정확도와 성능은 모두 underfitting으로 인해 손상됩니다.

데이터를 재샘플링하여 모델 정확도(K-겹 교차 검증)를 추정하고 검증 데이터 세트를 사용하여 모델을 평가하는 것은 과적합 및 과소적합을 피하는 두 가지 방법입니다.

25. 딥러닝에서 RNN이란 무엇입니까?

인공 신경망의 일반적인 다양성인 순환 신경망(RNN)은 약어 RNN을 사용합니다. 그들은 무엇보다도 게놈, 필기, 텍스트 및 데이터 시퀀스를 처리하는 데 사용됩니다. 필요한 훈련을 위해 RNN은 역전파를 사용합니다.

26. 아담 옵티마이저에 대해 설명하라

적응 모멘텀이라고도 하는 아담 옵티마이저는 희소 기울기가 있는 노이즈 상황을 처리하기 위해 개발된 최적화 기술입니다.

더 빠른 수렴을 위해 매개변수별 업데이트를 제공하는 것 외에도 Adam 옵티마이저는 모멘텀을 통해 수렴을 향상시켜 모델이 안장점에 갇히지 않도록 합니다.

27. 딥 오토인코더: 무엇입니까?

Deep autoencoder는 일반적으로 네트워크의 절반을 인코딩하는 데 XNUMX개 또는 XNUMX개의 얕은 계층을 포함하고 디코딩 절반에 대해 XNUMX개 또는 XNUMX개의 계층으로 구성된 또 다른 세트를 포함하는 두 개의 대칭적 심층 신뢰 네트워크의 집합적인 이름입니다.

이러한 계층은 깊은 믿음 네트워크의 기초를 형성하고 Boltzmann 기계에 의해 제한됩니다. 각 RBM 후에 딥 오토인코더는 데이터 세트 MNIST에 이진 변경 사항을 적용합니다.

RBM보다 Gaussian rectified 변환이 선호되는 다른 데이터 세트에서도 사용할 수 있습니다.

28. Tensorflow에서 Tensor는 무엇을 의미합니까?

이것은 정기적으로 묻는 또 다른 딥 러닝 인터뷰 질문입니다. 텐서는 고차원 배열로 시각화되는 수학적 개념입니다.

텐서는 신경망에 대한 입력으로 제공되고 다양한 차원과 순위를 갖는 이러한 데이터 배열입니다.

29. 계산 그래프에 대한 설명

TensorFlow의 기초는 계산 그래프의 구성입니다. 각 노드는 노드 네트워크에서 기능하며, 여기서 노드는 수학적 연산을 나타내고 에지는 텐서를 나타냅니다.

데이터가 그래프 형태로 흐르기 때문에 "DataFlow Graph"라고도 합니다.

30. 생성적 적대 네트워크(GAN): 무엇입니까?

딥 러닝에서 생성 모델링은 생성적 적대 네트워크를 사용하여 수행됩니다. 입력 데이터의 패턴을 식별하여 결과를 생성하는 감독되지 않은 작업입니다.

판별자는 생성기에서 생성된 인스턴스를 분류하는 데 사용되는 반면 생성기는 새 예제를 생성하는 데 사용됩니다.

31. 아키텍처를 설계할 때 신경망에 포함할 뉴런과 은닉층의 수를 어떻게 선택합니까?

비즈니스 과제가 주어지면 신경망 아키텍처를 구성하는 데 필요한 정확한 뉴런 및 은닉 레이어 수는 어렵고 빠른 규칙으로 결정할 수 없습니다.

신경망에서 은닉층의 크기는 입력층과 출력층의 중간 정도에 있어야 합니다.

다음과 같은 몇 가지 간단한 방법으로 신경망 설계를 만드는 데 앞서 시작할 수 있습니다.

유사한 실제 환경에서 신경망에 대한 이전 경험을 기반으로 특정 데이터 세트에 대해 어떤 것이 가장 잘 수행되는지 확인하기 위해 몇 가지 기본적인 체계적인 테스트를 시작하는 것이 모든 고유한 실제 예측 모델링 문제를 해결하는 가장 좋은 방법입니다.

네트워크 구성은 문제 영역에 대한 지식과 이전 신경망 경험을 기반으로 선택할 수 있습니다. 신경망의 설정을 평가할 때 관련 문제에 사용된 계층과 뉴런의 수를 시작하는 것이 좋습니다.

신경망의 복잡성은 단순한 신경망 설계부터 시작하여 예상 출력과 정확도를 기반으로 점진적으로 증가해야 합니다.

32. 심층 강화 학습에는 어떤 종류의 신경망이 사용됩니까?

강화 학습이라고 하는 기계 학습 패러다임에서 모델은 실제 사물과 마찬가지로 누적 보상의 개념을 최대화하는 역할을 합니다.
게임과 자율주행차는 모두 다음과 같은 문제로 설명됩니다. 강화 학습.
표시할 문제가 게임인 경우 화면이 입력으로 사용됩니다. 다음 단계에 대한 출력을 생성하기 위해 알고리즘은 픽셀을 입력으로 사용하고 여러 계층의 컨볼루션 신경망을 통해 처리합니다.
호의적이든 나쁘든 모델의 행동 결과는 강화 역할을 합니다.

결론

딥 러닝은 거의 모든 산업 분야에서 응용 프로그램을 통해 수년에 걸쳐 인기를 얻었습니다.

기업은 딥 러닝 및 머신 러닝 접근 방식을 사용하여 인간 행동을 복제하는 모델을 설계할 수 있는 유능한 전문가를 점점 더 찾고 있습니다.

기술을 높이고 이러한 첨단 기술에 대한 지식을 유지하는 응시자는 매력적인 보수로 다양한 작업 기회를 찾을 수 있습니다.

가장 자주 요청되는 딥 러닝 인터뷰 질문 중 일부에 응답하는 방법에 대한 강력한 이해를 얻었으므로 이제 인터뷰를 시작할 수 있습니다. 목표에 따라 다음 단계를 수행하십시오.

해시독스 방문하기 인터뷰 시리즈 인터뷰를 준비하기 위해.