เป็นเวลาหลายปีที่การเรียนรู้เชิงลึกได้กลายเป็นหัวข้อข่าวในแวดวงเทคโนโลยี และง่ายต่อการเข้าใจว่าทำไม
สาขาของปัญญาประดิษฐ์นี้กำลังเปลี่ยนแปลงภาคส่วนต่างๆ ตั้งแต่การดูแลสุขภาพ การธนาคาร ไปจนถึงการขนส่ง ทำให้เกิดความก้าวหน้าที่คิดไม่ถึงมาก่อน
การเรียนรู้เชิงลึกสร้างขึ้นจากชุดของอัลกอริทึมที่ซับซ้อนซึ่งเรียนรู้ที่จะแยกและทำนายรูปแบบที่ซับซ้อนจากข้อมูลจำนวนมหาศาล
เราจะดูอัลกอริธึมการเรียนรู้เชิงลึกที่ดีที่สุด 15 รายการในโพสต์นี้ ตั้งแต่ Convolutional Neural Networks ไปจนถึง Generative Adversarial Networks ไปจนถึง Long Short-Term Memory Networks
โพสต์นี้จะให้ข้อมูลเชิงลึกที่สำคัญว่าคุณเป็น ผู้เริ่มต้นหรือผู้เชี่ยวชาญในการเรียนรู้เชิงลึก.
1. เครือข่ายหม้อแปลง
เครือข่าย Transformer ได้เปลี่ยนไปแล้ว วิสัยทัศน์คอมพิวเตอร์ และแอปพลิเคชันประมวลผลภาษาธรรมชาติ (NLP) พวกเขาวิเคราะห์ข้อมูลที่เข้ามาและใช้กระบวนการให้ความสนใจเพื่อจับความสัมพันธ์ระยะยาว ทำให้เร็วกว่าโมเดลแบบลำดับต่อลำดับทั่วไป
เครือข่าย Transformer ได้รับการอธิบายเป็นครั้งแรกในสิ่งพิมพ์ “Attention Is All You Need” โดย Vaswani et al
ประกอบด้วยตัวเข้ารหัสและตัวถอดรหัส (2017) โมเดลหม้อแปลงได้แสดงให้เห็นถึงประสิทธิภาพในการใช้งาน NLP ที่หลากหลาย รวมถึง การวิเคราะห์ความเชื่อมั่นการจัดหมวดหมู่ข้อความ และการแปลด้วยคอมพิวเตอร์
แบบจำลองที่ใช้ Transformer ยังสามารถใช้ในการมองเห็นด้วยคอมพิวเตอร์สำหรับแอปพลิเคชัน พวกเขาสามารถทำการจดจำวัตถุและคำบรรยายภาพ
2. เครือข่ายหน่วยความจำระยะสั้นระยะยาว (LSTM)
Long Short-Term Memory Networks (LSTMs) เป็นรูปแบบหนึ่งของ เครือข่ายประสาท สร้างขึ้นโดยเฉพาะเพื่อจัดการอินพุตตามลำดับ พวกเขาถูกเรียกว่า "ระยะสั้นระยะยาว" เพราะสามารถเรียกคืนความรู้เมื่อนานมาแล้วได้ในขณะเดียวกันก็ลืมข้อมูลที่ไม่จำเป็น
LSTM ทำงานผ่าน "ประตู" บางส่วนที่ควบคุมการไหลของข้อมูลภายในเครือข่าย ขึ้นอยู่กับว่าข้อมูลได้รับการพิจารณาว่ามีนัยสำคัญหรือไม่ ประตูเหล่านี้สามารถเปิดหรือป้องกันได้
เทคนิคนี้ช่วยให้ LSTM สามารถเรียกคืนหรือลืมข้อมูลจากขั้นตอนเวลาที่ผ่านมา ซึ่งมีความสำคัญสำหรับงานต่างๆ เช่น การรู้จำเสียง การประมวลผลภาษาธรรมชาติ และการคาดคะเนอนุกรมเวลา
LSTM มีประโยชน์อย่างยิ่งในกรณีที่คุณมีข้อมูลต่อเนื่องที่ต้องประเมินหรือคาดการณ์ มักใช้ในซอฟต์แวร์จดจำเสียงเพื่อแปลงคำพูดเป็นข้อความหรือใน ตลาดหลักทรัพย์ การวิเคราะห์เพื่อคาดการณ์ราคาในอนาคตจากข้อมูลก่อนหน้า
3. แผนที่จัดระเบียบตนเอง (SOMs)
SOM เป็นสิ่งประดิษฐ์ประเภทหนึ่ง โครงข่ายประสาทเทียมที่สามารถเรียนรู้ได้ และแสดงข้อมูลที่ซับซ้อนในสภาพแวดล้อมที่มีมิติต่ำ วิธีการนี้ดำเนินการโดยการแปลงข้อมูลอินพุตในมิติสูงให้เป็นกริดสองมิติ โดยแต่ละหน่วยหรือเซลล์ประสาทจะเป็นตัวแทนของส่วนต่างๆ ของพื้นที่อินพุต
เซลล์ประสาทถูกเชื่อมโยงเข้าด้วยกันและสร้างโครงสร้างทอพอโลยี ทำให้พวกมันสามารถเรียนรู้และปรับตัวเข้ากับข้อมูลอินพุตได้ ดังนั้น SOM จึงขึ้นอยู่กับการเรียนรู้แบบไม่มีผู้ดูแล
อัลกอริทึมไม่จำเป็นต้องใช้ ข้อมูลที่มีป้ายกำกับ เพื่อเรียนรู้จาก แต่จะใช้คุณสมบัติทางสถิติของข้อมูลอินพุตเพื่อค้นหารูปแบบและความสัมพันธ์ระหว่างตัวแปรต่างๆ
ในระหว่างขั้นตอนการฝึกอบรม เซลล์ประสาทจะแข่งขันกันเพื่อเป็นตัวบ่งชี้ข้อมูลอินพุตที่ดีที่สุด และจัดระเบียบตัวเองเป็นโครงสร้างที่มีความหมาย SOM มีแอปพลิเคชันที่หลากหลาย รวมถึงการรู้จำรูปภาพและคำพูด การทำเหมืองข้อมูล และการจดจำรูปแบบ
มีประโยชน์สำหรับ การมองเห็นข้อมูลที่ซับซ้อนการจัดกลุ่มจุดข้อมูลที่เกี่ยวข้อง และการตรวจจับความผิดปกติหรือค่าผิดปกติ
4. การเรียนรู้การเสริมแรงเชิงลึก
ลึก การเรียนรู้เสริมแรง เป็นการเรียนรู้ของเครื่องประเภทหนึ่งที่ตัวแทนได้รับการฝึกฝนให้ตัดสินใจโดยอิงจากระบบการให้รางวัล มันทำงานโดยให้เจ้าหน้าที่โต้ตอบกับสิ่งรอบตัวและเรียนรู้ผ่านการลองผิดลองถูก
ตัวแทนจะได้รับรางวัลสำหรับทุกการกระทำที่ทำ และจุดประสงค์คือเพื่อเรียนรู้วิธีเพิ่มผลประโยชน์สูงสุดเมื่อเวลาผ่านไป สิ่งนี้อาจใช้เพื่อสอนเจ้าหน้าที่ให้เล่นเกม ขับรถยนต์ และแม้แต่จัดการหุ่นยนต์
Q-Learning เป็นวิธีการเรียนรู้แบบเสริมแรงเชิงลึกที่รู้จักกันดี ดำเนินการโดยการประเมินมูลค่าของการดำเนินการบางอย่างในสถานะเฉพาะ และปรับปรุงค่าประมาณนั้นเมื่อตัวแทนโต้ตอบกับสภาพแวดล้อม
จากนั้นตัวแทนจะใช้ค่าประมาณเหล่านี้เพื่อพิจารณาว่าการกระทำใดมีแนวโน้มที่จะให้รางวัลมากที่สุด Q-Learning ถูกนำมาใช้เพื่อให้ความรู้แก่ตัวแทนในการเล่นเกม Atari ตลอดจนปรับปรุงการใช้พลังงานในศูนย์ข้อมูล
Deep Q-Networks เป็นวิธีการเรียนรู้แบบเสริมแรงเชิงลึก (DQN) ที่มีชื่อเสียงอีกวิธีหนึ่ง DQN คล้ายกับ Q-Learning ตรงที่ประเมินค่าการกระทำโดยใช้โครงข่ายประสาทเทียมเชิงลึกแทนที่จะเป็นตาราง
สิ่งนี้ช่วยให้พวกเขาจัดการกับการตั้งค่าขนาดใหญ่และซับซ้อนด้วยการดำเนินการทางเลือกมากมาย DQN ถูกนำมาใช้ในการฝึกอบรมตัวแทนในการเล่นเกมเช่น Go และ Dota 2 ตลอดจนสร้างหุ่นยนต์ที่สามารถเรียนรู้ที่จะเดิน
5. โครงข่ายประสาทเทียมที่เกิดซ้ำ (RNN)
RNN เป็นเครือข่ายประสาทประเภทหนึ่งที่สามารถประมวลผลข้อมูลตามลำดับในขณะที่รักษาสถานะภายใน พิจารณาว่าคล้ายกับคนอ่านหนังสือซึ่งแต่ละคำจะถูกแยกย่อยโดยสัมพันธ์กับคำที่อยู่ก่อนหน้า
RNN จึงเหมาะอย่างยิ่งสำหรับงานต่างๆ เช่น การรู้จำเสียง การแปลภาษา และแม้กระทั่งการพยากรณ์คำถัดไปในวลี
RNN ทำงานโดยใช้วงจรป้อนกลับเพื่อเชื่อมต่อเอาต์พุตของแต่ละขั้นตอนของเวลากลับไปยังอินพุตของขั้นตอนถัดไป สิ่งนี้ทำให้เครือข่ายสามารถใช้ข้อมูลขั้นตอนของเวลาก่อนหน้าเพื่อแจ้งการคาดการณ์สำหรับขั้นตอนของเวลาในอนาคต โชคไม่ดี นี่ก็หมายความว่า RNN มีความเสี่ยงต่อปัญหาการไล่ระดับสีที่หายไป ซึ่งการไล่ระดับสีที่ใช้สำหรับการฝึกอบรมมีขนาดเล็กมากและเครือข่ายต้องดิ้นรนเพื่อเรียนรู้ความสัมพันธ์ระยะยาว
แม้จะมีข้อ จำกัด ที่ชัดเจนนี้ แต่ RNN พบว่ามีการใช้งานที่หลากหลาย แอปพลิเคชันเหล่านี้รวมถึงการประมวลผลภาษาธรรมชาติ การรู้จำเสียง และแม้กระทั่งการผลิตเพลง
Google Translateตัวอย่างเช่น ใช้ระบบที่ใช้ RNN เพื่อแปลภาษาต่างๆ ในขณะที่ Siri ซึ่งเป็นผู้ช่วยเสมือนใช้ระบบที่ใช้ RNN เพื่อตรวจจับเสียง RNN ยังถูกใช้เพื่อคาดการณ์ราคาหุ้นและสร้างข้อความและกราฟิกที่เหมือนจริง
6. เครือข่ายแคปซูล
Capsule Networks คือการออกแบบโครงข่ายประสาทรูปแบบใหม่ที่สามารถระบุรูปแบบและความสัมพันธ์ในข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น พวกเขาจัดระเบียบเซลล์ประสาทเป็น "แคปซูล" ที่เข้ารหัสลักษณะเฉพาะของอินพุต
ด้วยวิธีนี้พวกเขาสามารถคาดการณ์ได้แม่นยำยิ่งขึ้น Capsule Networks แยกคุณสมบัติที่ซับซ้อนขึ้นเรื่อยๆ จากข้อมูลอินพุตโดยใช้แคปซูลหลายชั้น
เทคนิคของ Capsule Networks ช่วยให้พวกเขาเรียนรู้การแสดงลำดับชั้นของอินพุตที่กำหนด พวกเขาสามารถเข้ารหัสการเชื่อมต่อเชิงพื้นที่ระหว่างรายการภายในรูปภาพได้อย่างถูกต้องโดยการสื่อสารระหว่างแคปซูล
การระบุวัตถุ การแบ่งส่วนรูปภาพ และการประมวลผลภาษาธรรมชาติคือแอปพลิเคชันทั้งหมดของ Capsule Networks
Capsule Networks มีศักยภาพในการทำงาน การขับขี่แบบอิสระ เทคโนโลยี ช่วยให้ระบบจดจำและแยกแยะระหว่างสิ่งของต่างๆ เช่น รถยนต์ ผู้คน และป้ายจราจร ระบบเหล่านี้สามารถหลีกเลี่ยงการชนกันได้โดยการคาดการณ์ที่แม่นยำยิ่งขึ้นเกี่ยวกับพฤติกรรมของวัตถุในสภาพแวดล้อม
7. ตัวเข้ารหัสอัตโนมัติแบบแปรผัน (VAE)
VAE เป็นเครื่องมือการเรียนรู้เชิงลึกรูปแบบหนึ่งที่ใช้สำหรับการเรียนรู้แบบไม่มีผู้ดูแล โดยการเข้ารหัสข้อมูลในพื้นที่มิติที่ต่ำกว่าแล้วถอดรหัสกลับเป็นรูปแบบเดิม พวกเขาอาจเรียนรู้ที่จะระบุรูปแบบในข้อมูล
พวกเขาเป็นเหมือนนักมายากลที่สามารถเปลี่ยนกระต่ายเป็นหมวกแล้วกลับเป็นกระต่าย! VAE มีประโยชน์ในการสร้างภาพหรือเพลงที่สมจริง และสามารถใช้เพื่อสร้างข้อมูลใหม่ที่เทียบเคียงได้กับข้อมูลต้นฉบับ
VAE นั้นคล้ายกับตัวถอดรหัสลับ พวกเขาสามารถค้นพบเบื้องหลัง โครงสร้างของข้อมูล โดยการแบ่งมันออกเป็นชิ้นเล็กๆ ง่ายๆ เหมือนกับการแตกปริศนา พวกเขาอาจใช้ข้อมูลนั้นเพื่อสร้างข้อมูลใหม่ที่ดูเหมือนต้นฉบับหลังจากที่แยกชิ้นส่วนออกแล้ว
สิ่งนี้มีประโยชน์สำหรับการบีบอัดไฟล์ขนาดมหึมาหรือสร้างกราฟิกหรือเพลงที่สดใหม่ในสไตล์เฉพาะ นอกจากนี้ VAE ยังสามารถผลิตเนื้อหาใหม่ๆ เช่น ข่าวหรือเนื้อเพลงได้อีกด้วย
8. Generative Adversarial Networks (GAN)
GAN (Generative Adversarial Networks) เป็นรูปแบบหนึ่งของระบบการเรียนรู้เชิงลึกที่สร้างข้อมูลใหม่ที่คล้ายกับข้อมูลต้นฉบับ พวกเขาทำงานโดยการฝึกอบรมสองเครือข่าย: เครื่องกำเนิดและเครือข่ายผู้เลือกปฏิบัติ
ตัวสร้างจะสร้างข้อมูลใหม่ที่เทียบได้กับข้อมูลเดิม
และผู้เลือกปฏิบัติพยายามแยกแยะระหว่างข้อมูลต้นฉบับและข้อมูลที่สร้างขึ้น เครือข่ายทั้งสองได้รับการฝึกฝนควบคู่กันไป โดยตัวสร้างจะพยายามหลอกลวงผู้เลือกปฏิบัติและผู้เลือกปฏิบัติที่พยายามระบุข้อมูลต้นฉบับอย่างเหมาะสม
พิจารณาว่า GAN เป็นลูกผสมระหว่างนักปลอมแปลงและนักสืบ เครื่องกำเนิดทำงานคล้ายกับเครื่องตีขึ้นรูป สร้างงานศิลปะใหม่ที่คล้ายกับต้นฉบับ
ผู้เลือกปฏิบัติทำหน้าที่เป็นนักสืบโดยพยายามแยกแยะระหว่างงานศิลปะของแท้กับของปลอม เครือข่ายทั้งสองได้รับการฝึกฝนควบคู่กันไป โดยตัวสร้างจะปรับปรุงในการสร้างของปลอมที่น่าเชื่อถือ และตัวจำแนกจะปรับปรุงเมื่อจดจำได้
GAN มีประโยชน์หลายอย่างตั้งแต่การสร้างภาพเหมือนจริงของมนุษย์หรือสัตว์ไปจนถึงการสร้างดนตรีหรืองานเขียนใหม่ นอกจากนี้ยังอาจใช้สำหรับการเพิ่มข้อมูล ซึ่งเกี่ยวข้องกับการรวมข้อมูลที่ผลิตเข้ากับข้อมูลจริงเพื่อสร้างชุดข้อมูลที่ใหญ่ขึ้นสำหรับการฝึกอบรมโมเดลแมชชีนเลิร์นนิง
9. Deep Q-Networks (DQN)
Deep Q-Networks (DQNs) เป็นอัลกอริธึมการเรียนรู้เสริมการตัดสินใจประเภทหนึ่ง พวกมันทำงานโดยการเรียนรู้ฟังก์ชั่น Q ที่ทำนายรางวัลที่คาดหวังสำหรับการกระทำบางอย่างในเงื่อนไขเฉพาะ
ฟังก์ชัน Q สอนโดยการลองผิดลองถูก โดยอัลกอริทึมจะพยายามดำเนินการต่างๆ และเรียนรู้จากผลลัพธ์
พิจารณาเหมือนก วิดีโอเกม ตัวละครทดลองด้วยการกระทำต่าง ๆ และค้นพบว่าสิ่งใดนำไปสู่ความสำเร็จ! DQN ฝึกฝน Q-function โดยใช้เครือข่ายนิวรอลระดับลึก ทำให้เป็นเครื่องมือที่มีประสิทธิภาพสำหรับงานที่ต้องตัดสินใจยากๆ
พวกเขาเคยเอาชนะแชมป์เปี้ยนที่เป็นมนุษย์ในเกมอย่างโกะและหมากรุก รวมถึงหุ่นยนต์และรถยนต์ไร้คนขับ สรุปแล้ว DQN ทำงานโดยการเรียนรู้จากประสบการณ์เพื่อเพิ่มพูนทักษะการตัดสินใจเมื่อเวลาผ่านไป
10. เครือข่ายฟังก์ชันพื้นฐานรัศมี (RBFN)
Radial Basis Function Networks (RBFNs) เป็นประเภทของโครงข่ายประสาทเทียมที่ใช้เพื่อประมาณฟังก์ชันและดำเนินการจำแนกประเภท พวกมันทำงานโดยการแปลงข้อมูลอินพุตเป็นพื้นที่มิติที่สูงขึ้นโดยใช้ชุดของฟังก์ชันพื้นฐานแนวรัศมี
เอาต์พุตของเครือข่ายเป็นการรวมกันเชิงเส้นของฟังก์ชันพื้นฐาน และแต่ละฟังก์ชันพื้นฐานในแนวรัศมีจะแทนจุดศูนย์กลางในพื้นที่อินพุต
RBFN มีประสิทธิภาพโดยเฉพาะอย่างยิ่งสำหรับสถานการณ์ที่มีการโต้ตอบระหว่างอินพุตและเอาต์พุตที่ซับซ้อน และอาจได้รับการสอนโดยใช้เทคนิคที่หลากหลาย รวมถึงการเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้สอน พวกมันถูกใช้เพื่ออะไรตั้งแต่การทำนายทางการเงินไปจนถึงการรู้จำภาพและคำพูดไปจนถึงการวินิจฉัยทางการแพทย์
พิจารณา RBFN เป็นระบบ GPS ที่ใช้ชุดจุดยึดเพื่อหาทางผ่านภูมิประเทศที่ท้าทาย เอาต์พุตของเครือข่ายคือการรวมกันของจุดยึดซึ่งอยู่ในฟังก์ชันฐานรัศมี
เราสามารถเรียกดูข้อมูลที่ซับซ้อนและสร้างการคาดการณ์ที่แม่นยำเกี่ยวกับสถานการณ์ที่จะเกิดขึ้นโดยใช้ RBFN
11. Perceptron หลายชั้น (MLP)
รูปแบบทั่วไปของโครงข่ายประสาทเทียมที่เรียกว่า multilayer perceptron (MLP) ใช้สำหรับงานการเรียนรู้ภายใต้การดูแล เช่น การจำแนกประเภทและการถดถอย พวกมันทำงานโดยการซ้อนโหนดหรือเซลล์ประสาทที่เชื่อมโยงหลายชั้น โดยแต่ละเลเยอร์จะเปลี่ยนแปลงข้อมูลขาเข้าแบบไม่เชิงเส้น
ใน MLP เซลล์ประสาทแต่ละเซลล์จะได้รับข้อมูลจากเซลล์ประสาทในเลเยอร์ด้านล่างและส่งสัญญาณไปยังเซลล์ประสาทในเลเยอร์ด้านบน เอาต์พุตของเซลล์ประสาทแต่ละตัวถูกกำหนดโดยใช้ฟังก์ชันการเปิดใช้งาน ซึ่งทำให้เครือข่ายไม่เป็นเชิงเส้น
พวกเขาสามารถเรียนรู้การแสดงข้อมูลอินพุตที่ซับซ้อนเนื่องจากสามารถมีเลเยอร์ที่ซ่อนอยู่หลายชั้น
MLP ถูกนำไปใช้กับงานที่หลากหลาย เช่น การวิเคราะห์ความรู้สึก การตรวจจับการฉ้อโกง และการจดจำเสียงและภาพ MLP อาจเปรียบได้กับกลุ่มผู้สืบสวนที่ทำงานร่วมกันเพื่อไขคดีที่ยากลำบาก
พวกเขาสามารถปะติดปะต่อข้อเท็จจริงและไขคดีอาชญากรรมได้ แม้ว่าแต่ละคนจะมีความเชี่ยวชาญเฉพาะด้านก็ตาม
12. เครือข่ายประสาทเทียม (CNN)
รูปภาพและวิดีโอได้รับการประมวลผลโดยใช้โครงข่ายประสาทเทียม (CNN) ซึ่งเป็นรูปแบบหนึ่งของโครงข่ายประสาทเทียม พวกมันทำงานโดยใช้ชุดตัวกรองหรือเคอร์เนลที่สามารถเรียนรู้ได้ เพื่อแยกลักษณะสำคัญออกจากข้อมูลอินพุต
ตัวกรองจะเลื่อนไปเหนือรูปภาพที่ป้อนเข้า ทำการบิดเพื่อสร้างแผนผังคุณลักษณะที่จับลักษณะที่สำคัญของรูปภาพ
เนื่องจาก CNN สามารถเรียนรู้การแสดงภาพตามลำดับชั้นได้ จึงมีประโยชน์อย่างยิ่งสำหรับสถานการณ์ที่เกี่ยวข้องกับข้อมูลภาพจำนวนมหาศาล แอพพลิเคชั่นหลายตัวใช้ประโยชน์จากมัน เช่น การตรวจจับวัตถุ การจัดหมวดหมู่รูปภาพ และการตรวจจับใบหน้า
พิจารณาว่า CNN เป็นจิตรกรที่ใช้พู่กันหลายอันเพื่อสร้างผลงานชิ้นเอก พู่กันแต่ละอันคือแกนกลาง และศิลปินอาจสร้างภาพที่ซับซ้อนและเหมือนจริงด้วยการผสมแกนหลายๆ อัน เราสามารถแยกลักษณะสำคัญจากภาพถ่ายและใช้เพื่อคาดการณ์เนื้อหาของภาพได้อย่างแม่นยำโดยใช้ CNN
13. เครือข่ายความเชื่อลึก (DBN)
DBN เป็นรูปแบบของโครงข่ายประสาทเทียมที่ใช้สำหรับงานการเรียนรู้ที่ไม่มีผู้ดูแล เช่น การลดขนาดและการเรียนรู้คุณลักษณะ พวกมันทำงานโดยการซ้อนกันหลายชั้นของ Restricted Boltzmann Machines (RBMs) ซึ่งเป็นโครงข่ายประสาทเทียมสองชั้นที่สามารถเรียนรู้เพื่อสร้างข้อมูลอินพุตขึ้นใหม่
DBN มีประโยชน์อย่างมากสำหรับปัญหาข้อมูลที่มีมิติสูง เนื่องจากสามารถเรียนรู้การแสดงอินพุตที่กะทัดรัดและมีประสิทธิภาพ พวกมันถูกใช้เพื่ออะไร ตั้งแต่การจดจำเสียงไปจนถึงการจัดหมวดหมู่ภาพ ไปจนถึงการค้นพบยา
ตัวอย่างเช่น นักวิจัยใช้ DBN เพื่อประเมินความสัมพันธ์ที่มีผลผูกพันของผู้สมัครรับยากับตัวรับฮอร์โมนเอสโตรเจน DBN ได้รับการฝึกอบรมเกี่ยวกับการรวบรวมคุณลักษณะทางเคมีและความสัมพันธ์ที่มีผลผูกพัน และสามารถทำนายความสัมพันธ์ที่มีผลผูกพันของผู้สมัครยาใหม่ได้อย่างแม่นยำ
สิ่งนี้เน้นการใช้ DBN ในการพัฒนายาและการประยุกต์ใช้ข้อมูลในมิติสูงอื่นๆ
14. ตัวเข้ารหัสอัตโนมัติ
โปรแกรมเข้ารหัสอัตโนมัติคือโครงข่ายประสาทเทียมที่ใช้สำหรับงานการเรียนรู้ที่ไม่มีผู้ดูแล พวกเขามีจุดประสงค์เพื่อสร้างข้อมูลอินพุตใหม่ ซึ่งหมายความว่าพวกเขาจะเรียนรู้ที่จะเข้ารหัสข้อมูลให้เป็นตัวแทนที่กะทัดรัด แล้วถอดรหัสกลับเข้าไปในอินพุตดั้งเดิม
โปรแกรมเข้ารหัสอัตโนมัติมีประสิทธิภาพมากสำหรับการบีบอัดข้อมูล การกำจัดสัญญาณรบกวน และการตรวจจับความผิดปกติ นอกจากนี้ยังสามารถใช้สำหรับการเรียนรู้คุณลักษณะ โดยการนำเสนอแบบกะทัดรัดของตัวเข้ารหัสอัตโนมัติจะถูกป้อนเข้าไปในงานการเรียนรู้ภายใต้การดูแล
พิจารณาว่าโปรแกรมเข้ารหัสอัตโนมัติเป็นนักเรียนที่จดบันทึกในชั้นเรียน นักเรียนฟังการบรรยายและจดประเด็นที่เกี่ยวข้องมากที่สุดในลักษณะที่กระชับและมีประสิทธิภาพ
ต่อมานักเรียนอาจศึกษาและจำบทเรียนโดยใช้บันทึก ในทางกลับกัน ตัวเข้ารหัสอัตโนมัติจะเข้ารหัสข้อมูลที่ป้อนเข้าในรูปแบบกะทัดรัดที่อาจนำไปใช้เพื่อวัตถุประสงค์ต่างๆ ในภายหลัง เช่น การตรวจจับความผิดปกติหรือการบีบอัดข้อมูล
15. เครื่องจักร Boltzmann จำกัด (RBM)
RBM (เครื่องจักร Boltzmann ที่จำกัด) เป็นประเภทของเครือข่ายประสาทกำเนิดที่ใช้สำหรับงานการเรียนรู้ที่ไม่มีผู้ดูแล ประกอบด้วยชั้นที่มองเห็นได้และชั้นที่ซ่อนอยู่ โดยเซลล์ประสาทในแต่ละชั้นจะเชื่อมโยงกันแต่ไม่อยู่ในชั้นเดียวกัน
RBM ได้รับการฝึกฝนโดยใช้เทคนิคที่เรียกว่าคอนทราสต์ไดเวอร์เจนซ์ ซึ่งเกี่ยวข้องกับการเปลี่ยนน้ำหนักระหว่างชั้นที่มองเห็นและชั้นที่ซ่อนอยู่ เพื่อปรับความน่าจะเป็นของข้อมูลการฝึกให้เหมาะสมที่สุด RBM อาจสร้างข้อมูลใหม่หลังจากได้รับการฝึกฝนโดยการสุ่มตัวอย่างจากการแจกแจงที่เรียนรู้
การรู้จำภาพและคำพูด การกรองร่วมกัน และการตรวจจับความผิดปกติคือแอปพลิเคชันทั้งหมดที่ใช้ RBM พวกเขายังใช้ในระบบคำแนะนำเพื่อสร้างคำแนะนำที่ปรับแต่งโดยการเรียนรู้รูปแบบจากพฤติกรรมของผู้ใช้
นอกจากนี้ RBM ยังถูกนำมาใช้ในการเรียนรู้คุณลักษณะเพื่อสร้างการแสดงข้อมูลมิติสูงที่กระชับและมีประสิทธิภาพ
สรุปและการพัฒนาที่มีแนวโน้มบนขอบฟ้า
วิธีการเรียนรู้เชิงลึก เช่น Convolutional Neural Networks (CNNs) และ Recurrent Neural Networks (RNNs) เป็นหนึ่งในแนวทางปัญญาประดิษฐ์ที่ทันสมัยที่สุด CNN ได้เปลี่ยนการรับรู้ภาพและเสียง ในขณะที่ RNN ได้ก้าวหน้าอย่างมากในการประมวลผลภาษาธรรมชาติและการวิเคราะห์ข้อมูลตามลำดับ
ขั้นตอนต่อไปในวิวัฒนาการของแนวทางเหล่านี้มีแนวโน้มที่จะมุ่งเน้นไปที่การปรับปรุงประสิทธิภาพและความสามารถในการปรับขนาด ช่วยให้สามารถวิเคราะห์ชุดข้อมูลที่ใหญ่ขึ้นและซับซ้อนมากขึ้น ตลอดจนปรับปรุงความสามารถในการตีความและความสามารถในการเรียนรู้จากข้อมูลที่มีป้ายกำกับน้อยลง
การเรียนรู้เชิงลึกมีความเป็นไปได้ที่จะทำให้เกิดความก้าวหน้าในด้านต่าง ๆ เช่น การดูแลสุขภาพ การเงิน และระบบอัตโนมัติในขณะที่มันก้าวหน้า
เขียนความเห็น