ลองนึกภาพโลกที่คอมพิวเตอร์มีความแม่นยำมากกว่าคนในการตีความข้อมูลภาพ สาขาการมองเห็นของคอมพิวเตอร์และการเรียนรู้ของเครื่องทำให้แนวคิดนี้เป็นจริง
คอมพิวเตอร์วิทัศน์และการเรียนรู้ของเครื่องเป็นสององค์ประกอบที่สำคัญของ AI บางครั้งพวกเขาก็สับสนซึ่งกันและกัน พวกเขาอาจใช้แทนกันได้
อย่างไรก็ตาม พวกมันเป็นพื้นที่ที่แยกจากกันโดยมีวิธีการที่แตกต่างกัน ในโพสต์นี้ เราจะพูดถึงความแตกต่างระหว่างการมองเห็นของคอมพิวเตอร์และ เรียนรู้เครื่อง. เข้าร่วมกับเราในขณะที่เราสำรวจฟิลด์ย่อย AI ที่น่าสนใจเหล่านี้
ทำไมเราต้องสร้างความแตกต่างนี้
ทั้งการมองเห็นด้วยคอมพิวเตอร์และการเรียนรู้ของเครื่องเป็นส่วนสำคัญของปัญญาประดิษฐ์ ถึงกระนั้น พวกเขามีวิธีการและวัตถุประสงค์ที่แตกต่างกัน เมื่อทราบความแตกต่างระหว่างสองสิ่งนี้ เราจึงสามารถใช้ศักยภาพของ AI ได้ดีขึ้น
และเราสามารถเลือกเทคโนโลยีที่เหมาะสมสำหรับโครงการของเรา
มาดูกันทีละคน
ทำความเข้าใจกับการมองเห็นของคอมพิวเตอร์
ความสามารถของคอมพิวเตอร์ในการตีความโลกที่มองเห็นนั้นเรียกว่าการมองเห็นของคอมพิวเตอร์ รวมถึงการฝึกอบรมคอมพิวเตอร์เพื่อทำความเข้าใจและวิเคราะห์ภาพและวิดีโอดิจิทัล
เทคโนโลยีนี้ทำงานเหมือนกับการทำงานของดวงตาและสมองของมนุษย์ คอมพิวเตอร์สามารถจดจำวัตถุ ใบหน้า และรูปแบบได้ พวกเขาสามารถดึงข้อมูลจากภาพถ่าย และประเมินข้อมูลโดยใช้อัลกอริทึมและแบบจำลอง
หลายอุตสาหกรรม เช่น การดูแลสุขภาพ การขนส่ง ความบันเทิง และการรักษาความปลอดภัย สามารถได้รับประโยชน์จากการมองเห็นของคอมพิวเตอร์ ตัวอย่างเช่น คอมพิวเตอร์วิทัศน์ถูกใช้เพื่อนำทางรถยนต์ไร้คนขับและช่วยแพทย์ในการวินิจฉัยโรค
ความเป็นไปได้ของคอมพิวเตอร์วิทัศน์นั้นไร้ขอบเขต และเราเพิ่งเริ่มสำรวจศักยภาพของพวกเขา
งานหลักของคอมพิวเตอร์วิทัศน์
การจดจำภาพ
หน้าที่สำคัญของการมองเห็นของคอมพิวเตอร์คือการจดจำภาพ สอนระบบคอมพิวเตอร์ให้รู้จักและจัดหมวดหมู่รูปภาพดิจิทัล ซึ่งหมายความว่าคอมพิวเตอร์สามารถจดจำส่วนประกอบของรูปภาพได้โดยอัตโนมัติ
สามารถแยกความแตกต่างระหว่างวัตถุ สัตว์ และมนุษย์ และติดฉลากได้อย่างเหมาะสม
หลายอุตสาหกรรมใช้การจดจำภาพ ตัวอย่างเช่น การจดจำรูปภาพจะใช้ในระบบรักษาความปลอดภัยเพื่อระบุและติดตามผู้บุกรุก นอกจากนี้ยังใช้ในการถ่ายภาพรังสีเพื่อช่วยแพทย์ในการวินิจฉัยและการรักษา
การตรวจจับวัตถุ
เป็นเทคนิคในการระบุตำแหน่งและจดจำสิ่งของในสื่อโสตทัศน์ที่อยู่นิ่งหรือเคลื่อนไหว แอปพลิเคชันสำหรับงานนี้ ได้แก่ หุ่นยนต์ รถยนต์ไร้คนขับ และการเฝ้าระวัง ตัวอย่างเช่น, Nest Cam เป็นระบบรักษาความปลอดภัยภายในบ้านที่แจ้งเตือนลูกค้าเมื่อตรวจพบการเคลื่อนไหวหรือเสียงโดยใช้การตรวจจับวัตถุ
การแบ่งกลุ่ม
กระบวนการแบ่งส่วนภาพคือการแบ่งส่วนภาพออกเป็นหลายๆ ส่วน แต่ละส่วนจะมีคุณสมบัติเฉพาะตัว ใบสมัครสำหรับงานนี้รวมถึงการวิเคราะห์เอกสาร การประมวลผลวิดีโอ และการถ่ายภาพทางการแพทย์
เช่น โปรแกรมแต่งภาพที่เรารู้จักกันดี Adobe Photoshop ใช้การแบ่งส่วนเพื่อแยกส่วนประกอบต่างๆ ภายในภาพ และใช้เอฟเฟกต์ต่างๆ กับแต่ละองค์ประกอบ
ทำความเข้าใจแมชชีนเลิร์นนิง
ตัวอย่างหนึ่งของ ปัญญาประดิษฐ์ คือการเรียนรู้ของเครื่อง เป็นการสอนคอมพิวเตอร์ให้เรียนรู้จากข้อมูลและสร้างการคาดการณ์ตามข้อมูลนั้น โดยไม่ต้องเข้ารหัสอย่างชัดเจน จะใช้แบบจำลองทางสถิติเพื่อช่วยให้คอมพิวเตอร์ทำงานได้ดีขึ้นในกิจกรรมหนึ่งๆ
กล่าวอีกนัยหนึ่งว่า การเรียนรู้ของเครื่องคือกระบวนการฝึกอบรม คอมพิวเตอร์เพื่อเรียนรู้ด้วยตนเองโดยยึดข้อมูลเป็นแนวทาง
ข้อมูล อัลกอริทึม และคำติชมเป็นสามองค์ประกอบหลักของแมชชีนเลิร์นนิง เดอะ เครื่องอัลกอริทึมการเรียนรู้ ก่อนอื่นต้องได้รับการฝึกฝนในชุดข้อมูลเพื่อระบุรูปแบบ ประการที่สอง อัลกอริทึมทำการคาดคะเนตามชุดข้อมูลใหม่โดยใช้รูปแบบที่เรียนรู้
ในที่สุด หลังจากได้รับคำติชมเกี่ยวกับการคาดการณ์ อัลกอริทึมจะทำการปรับเปลี่ยน และช่วยเพิ่มประสิทธิภาพ
ประเภทหลักของการเรียนรู้ของเครื่อง
การเรียนรู้ภายใต้การดูแล
ในการเรียนรู้แบบมีผู้สอน ชุดข้อมูลที่มีป้ายกำกับจะฝึกอัลกอริทึม ดังนั้น อินพุตและเอาต์พุตที่ตรงกันจะถูกจับคู่ หลังจากเรียนรู้ที่จะจับคู่อินพุตกับเอาต์พุตแล้ว อัลกอริทึมสามารถทำนายผลลัพธ์โดยใช้ข้อมูลใหม่
แอปพลิเคชัน เช่น การจดจำภาพ การจดจำเสียง และการประมวลผลภาษาธรรมชาติใช้การเรียนรู้แบบมีผู้สอน ผู้ช่วยเสมือนของ Apple สิริตัวอย่างเช่น ใช้การเรียนรู้ภายใต้การดูแลเพื่อตีความและดำเนินการตามคำสั่งของคุณ
การเรียนรู้ที่ไม่มีผู้ดูแล
การเรียนรู้แบบไม่มีผู้ดูแลเป็นส่วนย่อยของแมชชีนเลิร์นนิง ในกรณีนี้ อัลกอริทึมจะสอนในชุดข้อมูลที่ไม่มีการจับคู่อินพุตและเอาต์พุต ในการสร้างการคาดการณ์ อัลกอริทึมต้องเรียนรู้ที่จะจดจำรูปแบบและความสัมพันธ์ในข้อมูลก่อน
แอปพลิเคชัน เช่น การบีบอัดข้อมูล การตรวจจับความผิดปกติ และการจัดกลุ่มใช้การเรียนรู้แบบไม่มีผู้ดูแล ตัวอย่างเช่น อเมซอน แนะนำสินค้าให้กับผู้บริโภคตามประวัติการซื้อและพฤติกรรมการเรียกดูโดยใช้การเรียนรู้แบบไม่มีผู้ดูแล
เสริมการเรียนรู้
มันเกี่ยวข้องกับการมีปฏิสัมพันธ์กับสิ่งแวดล้อมและรับข้อเสนอแนะในรูปแบบของรางวัลและบทลงโทษ อัลกอริทึมได้รับความสามารถในการตัดสินใจที่เพิ่มรางวัลและลดบทลงโทษ
แอปพลิเคชันสำหรับแมชชีนเลิร์นนิงประเภทนี้ ได้แก่ หุ่นยนต์ รถยนต์ไร้คนขับ และเกม ตัวอย่างเช่น Google DeepMind's AlphaGo ซอฟต์แวร์ใช้การเรียนรู้เสริมเพื่อเล่นเกม Go
ความสัมพันธ์ระหว่างการมองเห็นของคอมพิวเตอร์กับการเรียนรู้ของเครื่อง
งาน Computer Vision สามารถใช้อัลกอริทึมการเรียนรู้ของเครื่องได้อย่างไร?
งานคอมพิวเตอร์วิทัศน์หลายงาน รวมถึงการระบุวัตถุและการจัดหมวดหมู่รูปภาพ ใช้การเรียนรู้ของเครื่อง รูปแบบทั่วไปของเทคนิคแมชชีนเลิร์นนิงที่ใช้คือ โครงข่ายประสาทเทียม (ซีเอ็นเอ็น).
สามารถระบุรูปแบบและคุณลักษณะในภาพได้
ยกตัวอย่างเช่น Google รูปภาพ ใช้อัลกอริทึมการเรียนรู้ของเครื่อง โดยจะจดจำและจำแนกภาพถ่ายโดยอัตโนมัติตามสิ่งของและบุคคลที่มีอยู่
การประยุกต์ใช้คอมพิวเตอร์วิทัศน์และการเรียนรู้ของเครื่องในโลกแห่งความเป็นจริง
แอปพลิเคชั่นในโลกแห่งความเป็นจริงหลายตัวผสมผสานการมองเห็นของคอมพิวเตอร์และการเรียนรู้ของเครื่อง ตัวอย่างที่ดีคือรถยนต์ไร้คนขับ พวกเขาระบุและตรวจสอบสิ่งต่างๆ บนท้องถนนด้วยคอมพิวเตอร์วิทัศน์
และใช้อัลกอริทึมการเรียนรู้ของเครื่องเพื่อตัดสินตามข้อมูลนั้น Waymo เป็นบริษัทรถยนต์ไร้คนขับที่ Alphabet เป็นเจ้าของ สำหรับการจดจำวัตถุและการทำแผนที่ จะรวมเอาการมองเห็นของคอมพิวเตอร์และการเรียนรู้ของเครื่องเข้าด้วยกัน
วิชันคอมพิวเตอร์และแมชชีนเลิร์นนิงถูกนำมาใช้ร่วมกันในอุตสาหกรรมการแพทย์เช่นกัน พวกเขาช่วยผู้เชี่ยวชาญในการตรวจสอบภาพทางการแพทย์และช่วยในการวินิจฉัย ตัวอย่างเช่น เครื่องมือวินิจฉัย IDx-DR ที่ได้รับการอนุมัติจาก FDA ใช้การเรียนรู้ของเครื่องเพื่อตรวจสอบภาพจอประสาทตาและค้นหาภาวะเบาหวานขึ้นตา เป็นภาวะที่หากละเลยอาจทำให้ตาบอดได้
ความแตกต่างระหว่างการเรียนรู้ของเครื่องและการมองเห็นของคอมพิวเตอร์
ประเภทของข้อมูลที่ใช้
ประเภทของข้อมูลที่คอมพิวเตอร์วิทัศน์และแมชชีนเลิร์นนิงใช้นั้นแตกต่างกัน แมชชีนเลิร์นนิงสามารถจัดการกับข้อมูลประเภทต่างๆ รวมถึงข้อมูลตัวเลข ข้อความ และข้อมูลเสียง
อย่างไรก็ตามการมองเห็นของคอมพิวเตอร์มุ่งเน้นไปที่ ข้อมูลภาพ เช่น ภาพถ่ายและวิดีโอ
เป้าหมายของแต่ละสนาม
แมชชีนเลิร์นนิงและคอมพิวเตอร์วิทัศน์มีวัตถุประสงค์หลายประการ เป้าหมายหลักของการมองเห็นด้วยคอมพิวเตอร์คือการวิเคราะห์และทำความเข้าใจข้อมูลที่ป้อนเข้าด้วยภาพ ซึ่งรวมถึงการจดจำวัตถุ การติดตามการเคลื่อนไหว และการวิเคราะห์รูปภาพ
อย่างไรก็ตาม สามารถใช้อัลกอริทึมการเรียนรู้ของเครื่องสำหรับกิจกรรมทุกประเภท
คอมพิวเตอร์วิทัศน์เป็นส่วนย่อยของการเรียนรู้ของเครื่อง
แม้จะเป็นพื้นที่แยกต่างหาก แต่การมองเห็นของคอมพิวเตอร์ยังถูกมองว่าเป็นส่วนหนึ่งของการเรียนรู้ของเครื่อง
วิธีการและทรัพยากรต่างๆ ที่ใช้ในแมชชีนเลิร์นนิง เช่น การเรียนรู้ลึก ๆ, โครงข่ายประสาทเทียม และการจัดกลุ่ม—ยังใช้เพื่อสร้างการมองเห็นของคอมพิวเตอร์อีกด้วย
ความเป็นไปได้ที่น่าตื่นเต้นรออยู่ข้างหน้า
ศักยภาพในการตัดกันของพวกเขาน่าสนใจยิ่งขึ้น ด้วยความก้าวหน้าของเทคโนโลยีใหม่ เราคาดหวังได้ว่าจะได้เห็นแอพพลิเคชั่นที่น่าทึ่ง
สาขาหนึ่งที่จุดตัดนี้น่าสนใจเป็นพิเศษคือวิทยาการหุ่นยนต์ วิสัยทัศน์ของคอมพิวเตอร์และการเรียนรู้ของเครื่องจะมีบทบาทสำคัญในการช่วยให้หุ่นยนต์นำทางสภาพแวดล้อมที่ซับซ้อนได้
พวกมันจะมีปฏิสัมพันธ์กับวัตถุและมนุษย์เมื่อพวกมันเติบโตอย่างอิสระมากขึ้น เราคาดหวังที่จะเห็นหุ่นยนต์ที่มีประสิทธิภาพมากขึ้นในการทำงานต่างๆ
ศักยภาพที่น่าสนใจอีกอย่างคือความจริงเสมือน คอมพิวเตอร์วิชันซิสเต็มและแมชชีนเลิร์นนิงซึ่งมีความสามารถในการระบุและวิเคราะห์ข้อมูลที่ป้อนเข้าด้วยภาพ ช่วยให้มนุษย์มีส่วนร่วมกับสภาพแวดล้อมเสมือนจริงได้อย่างเป็นธรรมชาติและเป็นธรรมชาติมากขึ้น เราจะเห็นแอปพลิเคชั่นที่ช่วยให้เราสามารถรวมโลกจริงและโลกเสมือนจริงได้อย่างราบรื่น มันจะนำมาซึ่งความเป็นไปได้ใหม่ๆ เพื่อความบันเทิง การศึกษา และวัตถุประสงค์อื่นๆ
อนาคตของการมองเห็นด้วยคอมพิวเตอร์และการเรียนรู้ของเครื่องถือเป็นคำมั่นสัญญามากมาย เราจะเห็นการใช้โดเมนเหล่านี้ที่น่าทึ่งยิ่งขึ้นไปอีกในปีต่อๆ ไป
เขียนความเห็น