30+ คำถามสัมภาษณ์การเรียนรู้เชิงลึกยอดนิยม

สารบัญ[ซ่อน][แสดง]

1. Deep Learning คืออะไรกันแน่?
2. อะไรที่ทำให้ Deep Learning แตกต่างจาก Machine Learning?
3. ความเข้าใจในปัจจุบันของคุณเกี่ยวกับโครงข่ายประสาทเทียมคืออะไร?
4. การรับรู้คืออะไรกันแน่?
5. โครงข่ายประสาทเทียมลึกคืออะไรกันแน่?
6. Multilayer Perceptron (MLP) คืออะไร?
7. ฟังก์ชันการเปิดใช้งานมีจุดประสงค์อะไรในโครงข่ายประสาทเทียม?
8. Gradient Descent คืออะไรกันแน่?
9. ฟังก์ชันต้นทุนคืออะไรกันแน่?
10. เครือข่ายลึกจะมีประสิทธิภาพดีกว่าเครือข่ายตื้นได้อย่างไร
11. อธิบายการขยายพันธุ์ไปข้างหน้า
12. backpropagation คืออะไร?
13. ในบริบทของการเรียนรู้อย่างลึกซึ้ง คุณจะเข้าใจการไล่ระดับคลิปได้อย่างไร
14. ฟังก์ชัน Softmax และ ReLU คืออะไร?
15. โมเดลโครงข่ายประสาทเทียมสามารถฝึกโดยตั้งค่าตุ้มน้ำหนักทั้งหมดเป็น 0 ได้หรือไม่?
16. อะไรที่แตกต่างระหว่างยุคจากแบทช์และการวนซ้ำ?
17. Batch Normalization และ Dropout คืออะไร?
18. สิ่งที่แยก Stochastic Gradient Descent ออกจาก Batch Gradient Descent?
19. เหตุใดการรวมความไม่เชิงเส้นในโครงข่ายประสาทจึงสำคัญ
20. เทนเซอร์ในการเรียนรู้เชิงลึกคืออะไร?
21. คุณจะเลือกฟังก์ชันการเปิดใช้งานสำหรับโมเดลการเรียนรู้เชิงลึกอย่างไร
22. คุณหมายถึงอะไรโดย CNN?
23. CNN มีกี่ชั้น?
24. อะไรคือผลกระทบของการสวมใส่มากเกินไปและน้อยเกินไป และคุณจะหลีกเลี่ยงได้อย่างไร?
25. ในการเรียนรู้อย่างลึกซึ้ง RNN คืออะไร?
26. อธิบาย Adam Optimizer
27. ตัวเข้ารหัสอัตโนมัติแบบลึก: มันคืออะไร?
28. เทนเซอร์หมายถึงอะไรในเทนเซอร์โฟลว์?
29. คำอธิบายของกราฟคำนวณ
30. Generative Adversarial Network (GANs): มันคืออะไร?
31. คุณจะเลือกจำนวนเซลล์ประสาทและเลเยอร์ที่ซ่อนอยู่เพื่อรวมไว้ในโครงข่ายประสาทเทียมในขณะที่คุณออกแบบสถาปัตยกรรมอย่างไร
32. โครงข่ายประสาทชนิดใดที่ใช้โดยการเรียนรู้การเสริมแรงเชิงลึก?
สรุป

การเรียนรู้เชิงลึกไม่ใช่แนวคิดใหม่เอี่ยม โครงข่ายประสาทเทียมทำหน้าที่เป็นรากฐานเดียวของชุดย่อยการเรียนรู้ของเครื่องที่เรียกว่าการเรียนรู้เชิงลึก

การเรียนรู้เชิงลึกเป็นการเลียนแบบสมองของมนุษย์ เช่นเดียวกับโครงข่ายประสาทเทียม เนื่องจากถูกสร้างขึ้นเพื่อเลียนแบบสมองของมนุษย์

มีสิ่งนี้มาระยะหนึ่งแล้ว ทุกวันนี้ ทุกคนกำลังพูดถึงเรื่องนี้ เนื่องจากเราไม่มีพลังในการประมวลผลหรือข้อมูลมากพอๆ กับตอนนี้

ในช่วง 20 ปีที่ผ่านมา การเรียนรู้เชิงลึกและการเรียนรู้ของเครื่องได้เกิดขึ้นจากความสามารถในการประมวลผลที่เพิ่มขึ้นอย่างมาก

การเรียนรู้ลึก ๆ

เพื่อช่วยคุณในการเตรียมตัวสำหรับคำถามใด ๆ ที่คุณอาจเผชิญเมื่อมองหางานในฝันของคุณ โพสต์นี้จะแนะนำคุณเกี่ยวกับคำถามสัมภาษณ์เชิงลึกจำนวนหนึ่ง ตั้งแต่ง่ายไปจนถึงซับซ้อน

1. Deep Learning คืออะไรกันแน่?

หากคุณกำลังเข้าร่วม a การเรียนรู้ลึก ๆ สัมภาษณ์ คุณไม่ต้องสงสัยเลยว่าการเรียนรู้เชิงลึกคืออะไร อย่างไรก็ตาม ผู้สัมภาษณ์คาดหวังให้คุณตอบกลับโดยละเอียดพร้อมภาพประกอบเพื่อตอบคำถามนี้

เพื่อฝึกฝน เครือข่ายประสาทเทียม สำหรับการเรียนรู้เชิงลึก ต้องใช้ข้อมูลที่มีการจัดหรือไม่มีโครงสร้างจำนวนมาก ในการค้นหารูปแบบและลักษณะเฉพาะที่ซ่อนอยู่ มีขั้นตอนที่ซับซ้อน (เช่น แยกแยะภาพแมวกับสุนัข)

2. อะไรที่ทำให้ Deep Learning แตกต่างจาก Machine Learning?

ในฐานะสาขาของปัญญาประดิษฐ์ที่เรียกว่าการเรียนรู้ของเครื่อง เราฝึกอบรมคอมพิวเตอร์โดยใช้ข้อมูล เทคนิคทางสถิติและอัลกอริทึม เพื่อให้คอมพิวเตอร์ทำงานได้ดีขึ้นเมื่อเวลาผ่านไป

ในส่วนของ เรียนรู้เครื่องการเรียนรู้เชิงลึกเลียนแบบสถาปัตยกรรมโครงข่ายประสาทเทียมที่เห็นในสมองของมนุษย์

3. ความเข้าใจในปัจจุบันของคุณเกี่ยวกับโครงข่ายประสาทเทียมคืออะไร?

ระบบประดิษฐ์ที่เรียกว่าโครงข่ายประสาทเทียมคล้ายกับโครงข่ายประสาทอินทรีย์ที่พบในร่างกายมนุษย์อย่างใกล้ชิด

โดยใช้เทคนิคที่คล้ายกับว่า สมองมนุษย์ โครงข่ายประสาทเทียมคือชุดของอัลกอริธึมที่มีจุดมุ่งหมายเพื่อระบุความสัมพันธ์ที่ซ่อนอยู่ในชิ้นส่วนของข้อมูล

ระบบเหล่านี้ได้รับความรู้เฉพาะงานโดยเปิดเผยชุดข้อมูลและตัวอย่างต่างๆ แทนที่จะปฏิบัติตามกฎเฉพาะงานใดๆ

แนวคิดก็คือแทนที่จะมีความเข้าใจที่ตั้งโปรแกรมไว้ล่วงหน้าของชุดข้อมูลเหล่านี้ ระบบจะเรียนรู้ลักษณะที่แตกต่างออกจากข้อมูลที่ป้อน

เลเยอร์เครือข่ายสามชั้นที่ใช้บ่อยที่สุดใน Neural Networks มีดังนี้:

ชั้นอินพุต
ชั้นที่ซ่อนอยู่
ชั้นเอาท์พุท

4. การรับรู้คืออะไรกันแน่?

เซลล์ประสาททางชีววิทยาที่พบในสมองของมนุษย์เปรียบได้กับการรับรู้ เพอร์เซปตรอนได้รับอินพุตหลายตัว ซึ่งจะทำการแปลงและทำหน้าที่ต่างๆ มากมาย และสร้างเอาต์พุต

แบบจำลองเชิงเส้นที่เรียกว่า Perceptron ใช้ในการจำแนกประเภทไบนารี มันจำลองเซลล์ประสาทที่มีอินพุตที่หลากหลาย แต่ละอันมีน้ำหนักต่างกัน

เซลล์ประสาทจะคำนวณฟังก์ชันโดยใช้อินพุตแบบถ่วงน้ำหนักและส่งออกผลลัพธ์

5. โครงข่ายประสาทเทียมลึกคืออะไรกันแน่?

Deep Neural Network คือ โครงข่ายประสาทเทียม (ANN) ที่มีเลเยอร์หลายชั้นระหว่างชั้นอินพุตและเอาต์พุต (DNN)

โครงข่ายประสาทเทียมเชิงลึกเป็นโครงข่ายประสาทเทียมแบบสถาปัตยกรรมลึก คำว่า "ลึก" หมายถึงการทำงานที่มีหลายระดับและหน่วยในชั้นเดียว สามารถสร้างแบบจำลองที่แม่นยำยิ่งขึ้นได้โดยการเพิ่มเลเยอร์ที่ใหญ่ขึ้นเรื่อยๆ เพื่อจับรูปแบบในระดับที่มากขึ้น

6. Multilayer Perceptron (MLP) คืออะไร?

เลเยอร์อินพุต ซ่อน และเอาต์พุตมีอยู่ใน MLP เหมือนกับในโครงข่ายประสาทเทียม มันถูกสร้างขึ้นคล้ายกับ perceptron ชั้นเดียวที่มีชั้นที่ซ่อนอยู่อย่างน้อยหนึ่งชั้น

เอาต์พุตไบนารีของ perceptron เลเยอร์เดียวสามารถจัดหมวดหมู่คลาสที่แยกได้เชิงเส้น (0,1) เท่านั้น ในขณะที่ MLP สามารถจำแนกคลาสที่ไม่เป็นเชิงเส้นได้

7. ฟังก์ชันการเปิดใช้งานมีจุดประสงค์อะไรในโครงข่ายประสาทเทียม?

ฟังก์ชันกระตุ้นกำหนดว่าเซลล์ประสาทควรกระตุ้นที่ระดับพื้นฐานที่สุดหรือไม่ ฟังก์ชันการเปิดใช้งานใดๆ สามารถยอมรับผลรวมถ่วงน้ำหนักของอินพุตบวกอคติเป็นอินพุตได้ ฟังก์ชันการเปิดใช้งานประกอบด้วยฟังก์ชันขั้นตอน, Sigmoid, ReLU, Tanh และ Softmax

8. Gradient Descent คืออะไรกันแน่?

วิธีที่ดีที่สุดในการย่อฟังก์ชันต้นทุนหรือข้อผิดพลาดให้น้อยที่สุดคือการไล่ระดับลง เป้าหมายคือการค้นหาค่าต่ำสุดในระดับท้องถิ่นและระดับสากลของฟังก์ชัน ระบุเส้นทางที่โมเดลควรปฏิบัติตามเพื่อลดข้อผิดพลาด

9. ฟังก์ชันต้นทุนคืออะไรกันแน่?

ฟังก์ชันต้นทุนเป็นตัววัดเพื่อประเมินว่าแบบจำลองของคุณทำงานได้ดีเพียงใด บางครั้งเรียกว่า "การสูญเสีย" หรือ "ข้อผิดพลาด" ในระหว่างการขยายพันธุ์ย้อนหลัง จะใช้ในการคำนวณข้อผิดพลาดของเลเยอร์เอาต์พุต

เราใช้ประโยชน์จากความไม่ถูกต้องดังกล่าวเพื่อส่งเสริมกระบวนการฝึกอบรมของโครงข่ายประสาทเทียมโดยการผลักดันกลับผ่านโครงข่ายประสาทเทียม

10. เครือข่ายลึกจะมีประสิทธิภาพดีกว่าเครือข่ายตื้นได้อย่างไร

เลเยอร์ที่ซ่อนอยู่จะถูกเพิ่มไปยังโครงข่ายประสาทเทียม นอกเหนือจากเลเยอร์อินพุตและเอาต์พุต ระหว่างชั้นอินพุตและเอาต์พุต โครงข่ายประสาทเทียมแบบตื้นใช้เลเยอร์ที่ซ่อนอยู่เพียงชั้นเดียว ในขณะที่โครงข่ายประสาทแบบลึกใช้หลายระดับ

เครือข่ายตื้นต้องใช้พารามิเตอร์หลายตัวเพื่อให้พอดีกับฟังก์ชันใดๆ เครือข่ายระดับลึกสามารถทำงานได้ดีกว่าแม้จะมีพารามิเตอร์จำนวนน้อยเนื่องจากมีหลายเลเยอร์

ตอนนี้เครือข่ายระดับลึกเป็นที่ต้องการเนื่องจากความเก่งกาจในการทำงานกับการสร้างแบบจำลองข้อมูลทุกประเภท ไม่ว่าจะเป็นสำหรับการรู้จำเสียงพูดหรือภาพ

11. อธิบายการขยายพันธุ์ไปข้างหน้า

อินพุตจะถูกส่งพร้อมกับน้ำหนักไปยังชั้นที่ฝังอยู่ในกระบวนการที่เรียกว่าการส่งต่อ

เอาต์พุตของฟังก์ชันการเปิดใช้งานจะคำนวณในแต่ละเลเยอร์ที่ฝังไว้ ก่อนที่การประมวลผลจะไปยังเลเยอร์ถัดไปได้

กระบวนการเริ่มต้นที่ชั้นอินพุตและดำเนินไปจนถึงชั้นเอาต์พุตขั้นสุดท้าย จึงเป็นชื่อที่ส่งต่อ

12. backpropagation คืออะไร?

เมื่อมีการปรับน้ำหนักและอคติในโครงข่ายประสาทเทียม Backpropagation จะใช้เพื่อลดฟังก์ชันต้นทุนโดยสังเกตว่ามูลค่าเปลี่ยนแปลงไปอย่างไรก่อน

การทำความเข้าใจการไล่ระดับสีในแต่ละเลเยอร์ที่ซ่อนอยู่ทำให้การคำนวณการเปลี่ยนแปลงนี้ทำได้ง่าย

กระบวนการที่เรียกว่า backpropagation เริ่มต้นที่เลเยอร์เอาต์พุตและเลื่อนย้อนกลับไปยังเลเยอร์อินพุต

13. ในบริบทของการเรียนรู้อย่างลึกซึ้ง คุณจะเข้าใจการไล่ระดับคลิปได้อย่างไร

Gradient Clipping เป็นวิธีการแก้ปัญหาการไล่สีแบบระเบิดที่เกิดขึ้นระหว่างการขยายพันธุ์ด้านหลัง (สภาพที่การไล่ระดับสีที่ไม่ถูกต้องมีนัยสำคัญสะสมเมื่อเวลาผ่านไป นำไปสู่การปรับน้ำหนักโมเดลโครงข่ายประสาทเทียมอย่างมีนัยสำคัญระหว่างการฝึก)

การไล่ระดับสีแบบระเบิดเป็นปัญหาที่เกิดขึ้นเมื่อการไล่ระดับสีมีขนาดใหญ่เกินไประหว่างการฝึก ทำให้โมเดลไม่เสถียร หากการไล่ระดับสีข้ามช่วงที่คาดไว้ ค่าการไล่ระดับสีจะถูกผลักทีละองค์ประกอบเป็นค่าต่ำสุดหรือสูงสุดที่กำหนดไว้ล่วงหน้า

การไล่สีแบบไล่โทนสีช่วยเพิ่มความเสถียรเชิงตัวเลขของโครงข่ายประสาทเทียมระหว่างการฝึก แต่มีผลกระทบต่อประสิทธิภาพของโมเดลเพียงเล็กน้อย

14. ฟังก์ชัน Softmax และ ReLU คืออะไร?

ฟังก์ชันการเปิดใช้งานที่เรียกว่า Softmax จะสร้างเอาต์พุตในช่วงระหว่าง 0 ถึง 1 เอาต์พุตแต่ละรายการจะถูกแบ่งออก เพื่อให้ผลรวมของเอาต์พุตทั้งหมดเป็นหนึ่ง สำหรับเลเยอร์เอาต์พุต มักใช้ Softmax

Rectified Linear Unit หรือบางครั้งเรียกว่า ReLU เป็นฟังก์ชันการเปิดใช้งานที่ใช้มากที่สุด ถ้า X เป็นค่าบวก มันจะให้ค่า X มิฉะนั้น มันจะให้ค่าเป็นศูนย์ ReLU ถูกนำไปใช้กับชั้นที่ฝังอยู่เป็นประจำ

15. โมเดลโครงข่ายประสาทเทียมสามารถฝึกโดยตั้งค่าตุ้มน้ำหนักทั้งหมดเป็น 0 ได้หรือไม่?

โครงข่ายประสาทเทียมจะไม่มีวันเรียนรู้ที่จะทำงานให้สำเร็จ ดังนั้นจึงเป็นไปไม่ได้ที่จะฝึกแบบจำลองโดยการเริ่มต้นน้ำหนักทั้งหมดเป็น 0

อนุพันธ์จะยังคงเหมือนเดิมสำหรับทุกน้ำหนักใน W [1] ถ้าน้ำหนักทั้งหมดเริ่มต้นเป็นศูนย์ ซึ่งจะส่งผลให้เซลล์ประสาทเรียนรู้คุณลักษณะเดียวกันซ้ำๆ

ไม่เพียงแค่การเริ่มต้นน้ำหนักเป็น 0 แต่ค่าคงที่รูปแบบใดก็ตามมีแนวโน้มที่จะส่งผลให้เกิดผลลัพธ์ที่ต่ำกว่ามาตรฐาน

16. อะไรที่แตกต่างระหว่างยุคจากแบทช์และการวนซ้ำ?

รูปแบบต่างๆ ของการประมวลผลชุดข้อมูลและเทคนิคการไล่ระดับสีรวมถึงแบทช์ การวนซ้ำ และยุค Epoch เกี่ยวข้องกับโครงข่ายประสาทเทียมแบบครั้งเดียวผ่านชุดข้อมูลเต็มรูปแบบ ทั้งแบบไปข้างหน้าและข้างหลัง

เพื่อให้ได้ผลลัพธ์ที่เชื่อถือได้ ชุดข้อมูลมักถูกส่งหลายครั้ง เนื่องจากมีขนาดใหญ่เกินกว่าจะผ่านในครั้งเดียว

แนวปฏิบัติในการเรียกใช้ข้อมูลจำนวนเล็กน้อยซ้ำๆ ผ่านโครงข่ายประสาทเทียมนี้เรียกว่าการวนซ้ำ เพื่อรับประกันว่าชุดข้อมูลจะข้ามผ่านโครงข่ายประสาทเทียมได้สำเร็จ จึงสามารถแบ่งออกเป็นชุดงานหรือชุดย่อยจำนวนหนึ่ง ซึ่งเรียกว่าชุดงาน

ขึ้นอยู่กับขนาดของการรวบรวมข้อมูล ทั้งสามวิธี ได้แก่ ยุค การวนซ้ำ และขนาดแบทช์ เป็นวิธีหลักในการใช้ อัลกอริธึมการไล่ระดับสี.

17. Batch Normalization และ Dropout คืออะไร?

การออกกลางคันป้องกันข้อมูลมากเกินไปโดยการสุ่มเอาทั้งหน่วยเครือข่ายที่มองเห็นและซ่อนอยู่ออก (โดยทั่วไปจะทำให้โหนดลดลง 20 เปอร์เซ็นต์) เพิ่มจำนวนการวนซ้ำที่จำเป็นเป็นสองเท่าเพื่อให้เครือข่ายมาบรรจบกัน

โดยการทำให้อินพุตเป็นมาตรฐานในแต่ละเลเยอร์เพื่อให้มีการเปิดใช้งานเอาต์พุตเฉลี่ยเป็นศูนย์และค่าเบี่ยงเบนมาตรฐานหนึ่งค่า การทำให้เป็นมาตรฐานแบบกลุ่มเป็นกลยุทธ์ในการเพิ่มประสิทธิภาพและความเสถียรของโครงข่ายประสาทเทียม

18. สิ่งที่แยก Stochastic Gradient Descent ออกจาก Batch Gradient Descent?

แบทช์ไล่ระดับโคตร:

ชุดข้อมูลทั้งหมดถูกใช้เพื่อสร้างการไล่ระดับสีสำหรับการไล่ระดับแบบแบตช์
ข้อมูลจำนวนมหาศาลและน้ำหนักที่อัปเดตช้าทำให้การบรรจบกันทำได้ยาก

โคตรไล่ระดับโคตร:

การไล่ระดับสีแบบสุ่มใช้ตัวอย่างเดียวในการคำนวณการไล่ระดับสี
เนื่องจากการเปลี่ยนแปลงของน้ำหนักบ่อยครั้งขึ้น มันจึงมาบรรจบกันเร็วกว่าการไล่ระดับแบบกลุ่มอย่างมีนัยสำคัญ

19. เหตุใดการรวมความไม่เชิงเส้นในโครงข่ายประสาทจึงสำคัญ

ไม่ว่าจะมีกี่ชั้น โครงข่ายประสาทเทียมจะมีพฤติกรรมเหมือนตัวรับรู้ในกรณีที่ไม่มีความไม่เป็นเชิงเส้น ทำให้ผลลัพธ์เชิงเส้นขึ้นอยู่กับอินพุต

กล่าวอีกนัยหนึ่ง โครงข่ายประสาทเทียมที่มี n เลเยอร์และ m หน่วยที่ซ่อนอยู่และฟังก์ชันการเปิดใช้งานเชิงเส้นเทียบเท่ากับโครงข่ายประสาทเชิงเส้นที่ไม่มีเลเยอร์ที่ซ่อนอยู่ และมีความสามารถในการตรวจจับเส้นขอบการแยกเชิงเส้นเพียงอย่างเดียว

หากไม่มีเส้นตรง โครงข่ายประสาทเทียมจะไม่สามารถแก้ปัญหาที่ซับซ้อนและจัดหมวดหมู่อินพุตได้อย่างถูกต้อง

20. เทนเซอร์ในการเรียนรู้เชิงลึกคืออะไร?

อาร์เรย์หลายมิติที่รู้จักกันในชื่อเทนเซอร์ทำหน้าที่เป็นลักษณะทั่วไปของเมทริกซ์และเวกเตอร์ เป็นโครงสร้างข้อมูลที่สำคัญสำหรับการเรียนรู้เชิงลึก อาร์เรย์ N-dimensional ของชนิดข้อมูลพื้นฐานใช้เพื่อแทนเทนเซอร์

ทุกองค์ประกอบของเทนเซอร์มีชนิดข้อมูลเหมือนกัน และชนิดข้อมูลนี้เป็นที่รู้จักเสมอ เป็นไปได้ว่าจะทราบเพียงชิ้นส่วนของรูปร่าง—นั่นคือ มีกี่มิติและแต่ละรูปร่างใหญ่แค่ไหน—เป็นที่รู้จัก

ในสถานการณ์ที่ทราบอินพุตทั้งหมดด้วย การดำเนินการส่วนใหญ่จะสร้างเทนเซอร์ที่รู้จักอย่างสมบูรณ์ ในกรณีอื่นๆ สามารถสร้างรูปแบบของเทนเซอร์ได้เฉพาะในระหว่างการดำเนินการกราฟเท่านั้น

21. คุณจะเลือกฟังก์ชันการเปิดใช้งานสำหรับโมเดลการเรียนรู้เชิงลึกอย่างไร

การใช้ฟังก์ชันการเปิดใช้งานเชิงเส้นเป็นเรื่องที่สมเหตุสมผลหากผลลัพธ์ที่คาดการณ์ไว้เป็นจริง
ควรใช้ฟังก์ชัน Sigmoid หากผลลัพธ์ที่ต้องคาดการณ์คือความน่าจะเป็นของคลาสไบนารี
สามารถใช้ฟังก์ชัน Tanh ได้หากเอาต์พุตที่คาดการณ์มีสองประเภท
เนื่องจากความง่ายในการคำนวณ ฟังก์ชัน ReLU จึงสามารถใช้ได้ในสถานการณ์ที่หลากหลาย

22. คุณหมายถึงอะไรโดย CNN?

โครงข่ายประสาทลึกที่เชี่ยวชาญในการประเมินภาพที่มองเห็น ได้แก่ โครงข่ายประสาทเทียม (CNN หรือ ConvNet) ที่นี่ แทนที่จะเป็นในโครงข่ายประสาทเทียมที่เวกเตอร์แทนอินพุต อินพุตจะเป็นรูปภาพแบบหลายช่องสัญญาณ

Multilayer perceptrons ถูกใช้ในลักษณะพิเศษโดย CNN ที่ต้องการการประมวลผลล่วงหน้าเพียงเล็กน้อย

23. CNN มีกี่ชั้น?

Convolutional Layer: เลเยอร์หลักคือเลเยอร์ Convolutional ซึ่งมีตัวกรองที่เรียนรู้ได้หลากหลายและฟิลด์ที่เปิดกว้าง เลเยอร์เริ่มต้นนี้รับข้อมูลอินพุตและแยกคุณลักษณะออกมา

เลเยอร์ ReLU: ด้วยการทำให้เครือข่ายไม่เป็นเชิงเส้น เลเยอร์นี้จะเปลี่ยนพิกเซลเชิงลบให้เป็นศูนย์

เลเยอร์การรวม: โดยการลดการประมวลผลและการตั้งค่าเครือข่าย เลเยอร์การรวมจะค่อยๆ ลดขนาดเชิงพื้นที่ของการเป็นตัวแทน Max pooling เป็นวิธีการรวมที่ใช้มากที่สุด

24. อะไรคือผลกระทบของการสวมใส่มากเกินไปและน้อยเกินไป และคุณจะหลีกเลี่ยงได้อย่างไร?

สิ่งนี้เรียกว่า overfitting เมื่อแบบจำลองเรียนรู้ความซับซ้อนและสัญญาณรบกวนในข้อมูลการฝึกจนถึงจุดที่ส่งผลเสียต่อการใช้ข้อมูลใหม่ของแบบจำลอง

เป็นไปได้มากกว่าที่จะเกิดขึ้นกับโมเดลที่ไม่เป็นเชิงเส้นซึ่งปรับเปลี่ยนได้มากกว่าในขณะที่เรียนรู้ฟังก์ชันเป้าหมาย โมเดลสามารถฝึกให้ตรวจจับรถยนต์และรถบรรทุกได้ แต่อาจระบุได้เฉพาะรถที่มีรูปแบบกล่องเฉพาะเท่านั้น

เนื่องจากได้รับการฝึกฝนบนรถบรรทุกประเภทเดียวเท่านั้น จึงอาจตรวจไม่พบรถบรรทุกพื้นเรียบ ในข้อมูลการฝึกอบรม โมเดลใช้งานได้ดี แต่ไม่ใช่ในโลกจริง

โมเดลที่ไม่พอดีหมายถึงโมเดลที่ไม่ได้รับการฝึกอบรมเพียงพอเกี่ยวกับข้อมูลหรือไม่สามารถสรุปข้อมูลใหม่ได้ ซึ่งมักเกิดขึ้นเมื่อโมเดลได้รับการฝึกอบรมโดยมีข้อมูลไม่เพียงพอหรือไม่ถูกต้อง

ความแม่นยำและประสิทธิภาพทั้งคู่ถูกลดทอนลงโดยการปรับให้เหมาะสม

การสุ่มตัวอย่างข้อมูลใหม่เพื่อประเมินความถูกต้องของแบบจำลอง (K-fold cross-validation) และการใช้ชุดข้อมูลการตรวจสอบความถูกต้องเพื่อประเมินแบบจำลองเป็นสองวิธีในการหลีกเลี่ยง overfitting และ underfitting

25. ในการเรียนรู้อย่างลึกซึ้ง RNN คืออะไร?

โครงข่ายประสาทเทียมแบบกำเริบ (RNNs) ซึ่งเป็นโครงข่ายประสาทเทียมที่หลากหลายโดยทั่วไป ใช้ตัวย่อ RNN พวกมันถูกใช้ในการประมวลผลจีโนม ลายมือ ข้อความ และลำดับข้อมูล เหนือสิ่งอื่นใด สำหรับการฝึกอบรมที่จำเป็น RNNs ใช้ backpropagation

26. อธิบาย Adam Optimizer

Adam Optimizer หรือที่รู้จักในชื่อ Adaptive Momentum เป็นเทคนิคการเพิ่มประสิทธิภาพที่พัฒนาขึ้นเพื่อจัดการกับสถานการณ์ที่มีเสียงดังด้วยการไล่ระดับสีแบบเบาบาง

นอกเหนือจากการจัดเตรียมการอัปเดตตามพารามิเตอร์เพื่อการบรรจบกันที่เร็วขึ้น เครื่องมือเพิ่มประสิทธิภาพของ Adam ยังปรับปรุงการบรรจบกันผ่านโมเมนตัม เพื่อให้แน่ใจว่าโมเดลจะไม่ติดอยู่ในจุดอาน

27. ตัวเข้ารหัสอัตโนมัติแบบลึก: มันคืออะไร?

Deep autoencoder เป็นชื่อรวมของเครือข่ายความเชื่อลึกแบบสมมาตรสองเครือข่าย ซึ่งโดยทั่วไปแล้วจะมีเลเยอร์ตื้นสี่หรือห้าชั้นสำหรับการเข้ารหัสครึ่งหนึ่งของเครือข่าย และอีกชุดหนึ่งที่มีสี่หรือห้าชั้นสำหรับครึ่งการถอดรหัส

เลเยอร์เหล่านี้เป็นรากฐานของเครือข่ายความเชื่อลึกๆ และถูกจำกัดด้วยเครื่องจักรของ Boltzmann หลังจากแต่ละ RBM ตัวเข้ารหัสอัตโนมัติเชิงลึกจะใช้การเปลี่ยนแปลงแบบไบนารีกับชุดข้อมูล MNIST

นอกจากนี้ยังสามารถใช้ในชุดข้อมูลอื่นที่ต้องการการแปลงแบบแก้ไขแบบเกาส์เซียนมากกว่า RBM

28. เทนเซอร์หมายถึงอะไรในเทนเซอร์โฟลว์?

นี่เป็นคำถามสัมภาษณ์เชิงลึกอีกคำถามหนึ่งที่ถามกันเป็นประจำ เทนเซอร์เป็นแนวคิดทางคณิตศาสตร์ที่แสดงเป็นอาร์เรย์มิติที่สูงกว่า

เทนเซอร์คืออาร์เรย์ข้อมูลเหล่านี้ที่จัดเตรียมไว้เป็นอินพุตไปยังโครงข่ายประสาทเทียมและมีมิติข้อมูลและการจัดอันดับที่หลากหลาย

29. คำอธิบายของกราฟคำนวณ

รากฐานของ TensorFlow คือการสร้างกราฟการคำนวณ แต่ละโหนดทำงานในเครือข่ายของโหนด โดยที่โหนดใช้แทนการดำเนินการทางคณิตศาสตร์และขอบสำหรับเทนเซอร์

บางครั้งเรียกว่า "DataFlow Graph" เนื่องจากข้อมูลไหลในรูปของกราฟ

30. Generative Adversarial Network (GANs): มันคืออะไร?

ในการเรียนรู้เชิงลึก การสร้างแบบจำลองกำเนิดทำได้โดยใช้เครือข่ายปฏิปักษ์แบบกำเนิด เป็นงานที่ไม่มีผู้ดูแลซึ่งผลลัพธ์จะถูกสร้างขึ้นโดยการระบุรูปแบบในข้อมูลที่ป้อนเข้า

discriminator ใช้เพื่อจัดหมวดหมู่อินสแตนซ์ที่สร้างโดยตัวสร้าง ในขณะที่ตัวสร้างจะใช้เพื่อสร้างตัวอย่างใหม่

31. คุณจะเลือกจำนวนเซลล์ประสาทและเลเยอร์ที่ซ่อนอยู่เพื่อรวมไว้ในโครงข่ายประสาทเทียมในขณะที่คุณออกแบบสถาปัตยกรรมอย่างไร

จากความท้าทายทางธุรกิจ จำนวนเซลล์ประสาทที่แม่นยำและเลเยอร์ที่ซ่อนอยู่ซึ่งจำเป็นต่อการสร้างสถาปัตยกรรมโครงข่ายประสาทเทียมไม่สามารถกำหนดได้ด้วยกฎเกณฑ์ที่เข้มงวดและรวดเร็ว

ในโครงข่ายประสาทเทียม ขนาดของเลเยอร์ที่ซ่อนอยู่ควรอยู่ตรงกลางของขนาดของเลเยอร์อินพุตและเอาต์พุต

การเริ่มต้นสร้างการออกแบบโครงข่ายประสาทเทียมสามารถทำได้ด้วยวิธีง่ายๆ ไม่กี่วิธี แม้ว่า:

เริ่มต้นด้วยการทดสอบระบบขั้นพื้นฐานเพื่อดูว่าสิ่งใดจะทำงานได้ดีที่สุดสำหรับชุดข้อมูลเฉพาะใดๆ ตามประสบการณ์ก่อนหน้ากับโครงข่ายประสาทเทียมในการตั้งค่าในโลกแห่งความเป็นจริงที่คล้ายคลึงกันเป็นวิธีที่ดีที่สุดในการจัดการกับความท้าทายในการสร้างแบบจำลองการคาดการณ์ในโลกแห่งความเป็นจริงที่ไม่เหมือนใคร

การกำหนดค่าเครือข่ายสามารถเลือกได้ตามความรู้ของโดเมนปัญหาและประสบการณ์เครือข่ายประสาทเทียมก่อนหน้า เมื่อประเมินการตั้งค่าโครงข่ายประสาทเทียม จำนวนเลเยอร์และเซลล์ประสาทที่ใช้ในปัญหาที่เกี่ยวข้องเป็นจุดเริ่มต้นที่ดี

ความซับซ้อนของโครงข่ายประสาทเทียมควรค่อยๆ เพิ่มขึ้นตามผลลัพธ์ที่คาดการณ์ไว้และความแม่นยำ โดยเริ่มจากการออกแบบโครงข่ายประสาทเทียมอย่างง่าย

32. โครงข่ายประสาทชนิดใดที่ใช้โดยการเรียนรู้การเสริมแรงเชิงลึก?

ในกระบวนทัศน์แมชชีนเลิร์นนิงที่เรียกว่าการเรียนรู้แบบเสริมแรง โมเดลนี้ทำหน้าที่เพื่อเพิ่มแนวคิดของรางวัลสะสมให้สูงสุด เช่นเดียวกับสิ่งที่มีชีวิต
เกมและยานพาหนะที่ขับเคลื่อนด้วยตนเองนั้นถูกอธิบายว่าเป็นปัญหาที่เกี่ยวข้อง การเรียนรู้การเสริมแรง.
หน้าจอจะใช้เป็นอินพุตหากปัญหาที่จะนำเสนอคือเกม ในการสร้างเอาต์พุตสำหรับขั้นตอนถัดไป อัลกอริทึมจะใช้พิกเซลเป็นอินพุตและประมวลผลผ่านเครือข่ายประสาทเทียมแบบหลายชั้น
ผลของการกระทำของตัวแบบ ไม่ว่าจะดีหรือไม่ดี ทำหน้าที่เป็นการเสริมแรง

สรุป

Deep Learning ได้รับความนิยมเพิ่มขึ้นในช่วงหลายปีที่ผ่านมา โดยมีการใช้งานในแทบทุกด้านของอุตสาหกรรม

บริษัทต่างๆ กำลังมองหาผู้เชี่ยวชาญที่มีความสามารถมากขึ้นเรื่อยๆ ซึ่งสามารถออกแบบแบบจำลองที่จำลองพฤติกรรมของมนุษย์โดยใช้การเรียนรู้เชิงลึกและการเรียนรู้ด้วยเครื่อง

ผู้สมัครที่เพิ่มทักษะและคงไว้ซึ่งความรู้เกี่ยวกับเทคโนโลยีล้ำสมัยเหล่านี้สามารถค้นหาโอกาสในการทำงานที่หลากหลายพร้อมค่าตอบแทนที่น่าดึงดูดใจ

คุณสามารถเริ่มต้นด้วยการสัมภาษณ์ได้ในขณะนี้ โดยที่คุณมีความเข้าใจอย่างถ่องแท้ว่าจะตอบคำถามสัมภาษณ์เพื่อการเรียนรู้เชิงลึกที่ได้รับการร้องขอบ่อยที่สุดได้อย่างไร ทำตามขั้นตอนต่อไปตามวัตถุประสงค์ของคุณ

เยี่ยมชม Hashdork's บทสัมภาษณ์ เพื่อเตรียมสัมภาษณ์

30+ คำถามสัมภาษณ์การเรียนรู้เชิงลึกยอดนิยม

1. Deep Learning คืออะไรกันแน่?

2. อะไรที่ทำให้ Deep Learning แตกต่างจาก Machine Learning?

3. ความเข้าใจในปัจจุบันของคุณเกี่ยวกับโครงข่ายประสาทเทียมคืออะไร?

4. การรับรู้คืออะไรกันแน่?

5. โครงข่ายประสาทเทียมลึกคืออะไรกันแน่?

6. Multilayer Perceptron (MLP) คืออะไร?

7. ฟังก์ชันการเปิดใช้งานมีจุดประสงค์อะไรในโครงข่ายประสาทเทียม?

8. Gradient Descent คืออะไรกันแน่?

9. ฟังก์ชันต้นทุนคืออะไรกันแน่?

10. เครือข่ายลึกจะมีประสิทธิภาพดีกว่าเครือข่ายตื้นได้อย่างไร

11. อธิบายการขยายพันธุ์ไปข้างหน้า

12. backpropagation คืออะไร?

13. ในบริบทของการเรียนรู้อย่างลึกซึ้ง คุณจะเข้าใจการไล่ระดับคลิปได้อย่างไร

14. ฟังก์ชัน Softmax และ ReLU คืออะไร?

15. โมเดลโครงข่ายประสาทเทียมสามารถฝึกโดยตั้งค่าตุ้มน้ำหนักทั้งหมดเป็น 0 ได้หรือไม่?

16. อะไรที่แตกต่างระหว่างยุคจากแบทช์และการวนซ้ำ?

17. Batch Normalization และ Dropout คืออะไร?

18. สิ่งที่แยก Stochastic Gradient Descent ออกจาก Batch Gradient Descent?

19. เหตุใดการรวมความไม่เชิงเส้นในโครงข่ายประสาทจึงสำคัญ

20. เทนเซอร์ในการเรียนรู้เชิงลึกคืออะไร?

21. คุณจะเลือกฟังก์ชันการเปิดใช้งานสำหรับโมเดลการเรียนรู้เชิงลึกอย่างไร

22. คุณหมายถึงอะไรโดย CNN?

23. CNN มีกี่ชั้น?

24. อะไรคือผลกระทบของการสวมใส่มากเกินไปและน้อยเกินไป และคุณจะหลีกเลี่ยงได้อย่างไร?

25. ในการเรียนรู้อย่างลึกซึ้ง RNN คืออะไร?

26. อธิบาย Adam Optimizer

27. ตัวเข้ารหัสอัตโนมัติแบบลึก: มันคืออะไร?

28. เทนเซอร์หมายถึงอะไรในเทนเซอร์โฟลว์?

29. คำอธิบายของกราฟคำนวณ

30. Generative Adversarial Network (GANs): มันคืออะไร?

32. โครงข่ายประสาทชนิดใดที่ใช้โดยการเรียนรู้การเสริมแรงเชิงลึก?

สรุป

เกี่ยวกับเรา เจย์

บทความเพิ่มเติมเกี่ยวกับ HashDork:

คำถามสัมภาษณ์ทางวิศวกรรมพร้อมท์ 30+ อันดับแรก

คำถามสัมภาษณ์เกี่ยวกับการเรียนรู้ของเครื่อง 40+ ยอดนิยม

คำถามสัมภาษณ์ AWS Lambda 25+ อันดับสูงสุด

40 คำถามสัมภาษณ์ที่จำเป็นสำหรับนักพัฒนา JavaScript

จดหมายข่าวเทคโนโลยีแห่งอนาคตนี้ไม่ห่วย

30+ คำถามสัมภาษณ์การเรียนรู้เชิงลึกยอดนิยม

1. Deep Learning คืออะไรกันแน่?

2. อะไรที่ทำให้ Deep Learning แตกต่างจาก Machine Learning?

3. ความเข้าใจในปัจจุบันของคุณเกี่ยวกับโครงข่ายประสาทเทียมคืออะไร?

4. การรับรู้คืออะไรกันแน่?

5. โครงข่ายประสาทเทียมลึกคืออะไรกันแน่?

6. Multilayer Perceptron (MLP) คืออะไร?

7. ฟังก์ชันการเปิดใช้งานมีจุดประสงค์อะไรในโครงข่ายประสาทเทียม?

8. Gradient Descent คืออะไรกันแน่?

9. ฟังก์ชันต้นทุนคืออะไรกันแน่?

10. เครือข่ายลึกจะมีประสิทธิภาพดีกว่าเครือข่ายตื้นได้อย่างไร

11. อธิบายการขยายพันธุ์ไปข้างหน้า

12. backpropagation คืออะไร?

13. ในบริบทของการเรียนรู้อย่างลึกซึ้ง คุณจะเข้าใจการไล่ระดับคลิปได้อย่างไร

14. ฟังก์ชัน Softmax และ ReLU คืออะไร?

15. โมเดลโครงข่ายประสาทเทียมสามารถฝึกโดยตั้งค่าตุ้มน้ำหนักทั้งหมดเป็น 0 ได้หรือไม่?

16. อะไรที่แตกต่างระหว่างยุคจากแบทช์และการวนซ้ำ?

17. Batch Normalization และ Dropout คืออะไร?

18. สิ่งที่แยก Stochastic Gradient Descent ออกจาก Batch Gradient Descent?

19. เหตุใดการรวมความไม่เชิงเส้นในโครงข่ายประสาทจึงสำคัญ

20. เทนเซอร์ในการเรียนรู้เชิงลึกคืออะไร?

21. คุณจะเลือกฟังก์ชันการเปิดใช้งานสำหรับโมเดลการเรียนรู้เชิงลึกอย่างไร

22. คุณหมายถึงอะไรโดย CNN?

23. CNN มีกี่ชั้น?

24. อะไรคือผลกระทบของการสวมใส่มากเกินไปและน้อยเกินไป และคุณจะหลีกเลี่ยงได้อย่างไร?

25. ในการเรียนรู้อย่างลึกซึ้ง RNN คืออะไร?

26. อธิบาย Adam Optimizer

27. ตัวเข้ารหัสอัตโนมัติแบบลึก: มันคืออะไร?

28. เทนเซอร์หมายถึงอะไรในเทนเซอร์โฟลว์?

29. คำอธิบายของกราฟคำนวณ

30. Generative Adversarial Network (GANs): มันคืออะไร?

32. โครงข่ายประสาทชนิดใดที่ใช้โดยการเรียนรู้การเสริมแรงเชิงลึก?

สรุป

เกี่ยวกับเรา เจย์

บทความเพิ่มเติมเกี่ยวกับ HashDork:

คำถามสัมภาษณ์ทางวิศวกรรมพร้อมท์ 30+ อันดับแรก

คำถามสัมภาษณ์เกี่ยวกับการเรียนรู้ของเครื่อง 40+ ยอดนิยม

คำถามสัมภาษณ์ AWS Lambda 25+ อันดับสูงสุด

40 คำถามสัมภาษณ์ที่จำเป็นสำหรับนักพัฒนา JavaScript

ปฏิสัมพันธ์ของผู้อ่าน

เขียนความเห็น ยกเลิกการตอบ

จดหมายข่าวเทคโนโลยีแห่งอนาคตนี้ไม่ห่วย