เทคโนโลยีเดียวกันกับที่ขับเคลื่อนการจดจำใบหน้าและรถยนต์ที่ขับด้วยตนเองในไม่ช้าอาจเป็นเครื่องมือสำคัญในการไขความลับที่ซ่อนอยู่ของจักรวาล
พัฒนาการล่าสุดในด้านดาราศาสตร์เชิงสังเกตได้นำไปสู่การระเบิดของข้อมูล
กล้องโทรทรรศน์ทรงพลังรวบรวมข้อมูลเทราไบต์ทุกวัน ในการประมวลผลข้อมูลจำนวนมหาศาลนั้น นักวิทยาศาสตร์จำเป็นต้องหาวิธีใหม่ๆ ในการทำงานต่างๆ ในภาคสนามให้เป็นแบบอัตโนมัติ เช่น การวัดรังสีและปรากฏการณ์ท้องฟ้าอื่นๆ
งานพิเศษอย่างหนึ่งที่นักดาราศาสตร์ต้องการเร่งให้เร็วขึ้นคือการจำแนกกาแลคซี่ ในบทความนี้ เราจะอธิบายว่าทำไมการจำแนกกาแลคซีจึงมีความสำคัญ และวิธีที่นักวิจัยเริ่มใช้เทคนิคการเรียนรู้ของเครื่องขั้นสูงในการขยายขนาดเมื่อมีปริมาณข้อมูลเพิ่มขึ้น
ทำไมเราต้องจำแนกกาแลคซี?
การจำแนกประเภทของดาราจักร ซึ่งเป็นที่รู้จักในด้านสัณฐานวิทยาของดาราจักร เกิดขึ้นในศตวรรษที่ 18 ในช่วงเวลานั้น เซอร์วิลเลียม เฮอร์เชลสังเกตว่า 'เนบิวลา' ต่างๆ มาในรูปแบบต่างๆ จอห์น เฮอร์เชล ลูกชายของเขาปรับปรุงการจำแนกประเภทนี้โดยแยกความแตกต่างระหว่างเนบิวลาดาราจักรและเนบิวลาที่ไม่ใช่ดาราจักร การจำแนกประเภทหลังของทั้งสองนี้เป็นสิ่งที่เรารู้จักและเรียกว่ากาแลคซี
ในช่วงปลายศตวรรษที่ 18 นักดาราศาสตร์หลายคนคาดการณ์ว่าวัตถุในจักรวาลเหล่านี้เป็น "ดาราจักรนอกระบบ" และพวกมันอยู่นอกทางช้างเผือกของเราเอง
ฮับเบิลแนะนำการจำแนกกาแลคซีใหม่ในปี พ.ศ. 1925 ด้วยการเปิดตัวลำดับฮับเบิลหรือที่รู้จักกันอย่างไม่เป็นทางการว่าแผนภาพการปรับส้อมเสียงของฮับเบิล
ลำดับของฮับเบิลแบ่งดาราจักรออกเป็นดาราจักรปกติและดาราจักรไม่ปกติ ดาราจักรปกติถูกแบ่งออกเป็นสามชั้นกว้างๆ ได้แก่ วงรี วงก้นหอย และเลนส์เลนติคูลาร์
การศึกษากาแลคซีทำให้เราเข้าใจถึงความลึกลับที่สำคัญหลายประการเกี่ยวกับวิธีการทำงานของจักรวาล นักวิจัยได้ใช้กาแลคซีรูปแบบต่างๆ เพื่อสร้างทฤษฎีเกี่ยวกับกระบวนการก่อตัวดาวฤกษ์ การใช้การจำลอง นักวิทยาศาสตร์ยังได้พยายามจำลองว่ากาแลคซีเองก่อตัวเป็นรูปร่างที่เราสังเกตได้อย่างไรในปัจจุบัน
การจำแนกทางสัณฐานวิทยาของดาราจักรโดยอัตโนมัติ
การวิจัยเกี่ยวกับการใช้แมชชีนเลิร์นนิงเพื่อจำแนกกาแลคซีได้แสดงให้เห็นผลลัพธ์ที่น่าพึงพอใจ ในปี 2020 นักวิจัยจากหอดูดาวแห่งชาติญี่ปุ่นใช้ a เทคนิคการเรียนรู้เชิงลึก เพื่อจำแนกดาราจักรได้อย่างถูกต้อง
นักวิจัยใช้ชุดข้อมูลขนาดใหญ่ของภาพที่ได้จากการสำรวจ Subaru/Hyper Suprime-Cam (HSC) เมื่อใช้เทคนิคนี้ พวกมันสามารถจำแนกกาแลคซีออกเป็นเกลียวตัว S เกลียวตัว Z และไม่มีเกลียว
งานวิจัยของพวกเขาแสดงให้เห็นถึงข้อดีของการรวมข้อมูลขนาดใหญ่จากกล้องโทรทรรศน์กับ การเรียนรู้ลึก ๆ เทคนิคต่างๆ เนื่องจากตาข่ายประสาท นักดาราศาสตร์จึงสามารถลองจำแนกลักษณะทางสัณฐานวิทยาประเภทอื่นๆ ได้ เช่น แท่ง การรวมตัว และวัตถุที่เลนส์หนัก ตัวอย่างเช่น, งานวิจัยที่เกี่ยวข้อง จาก MK Cavanagh และ K. Bekki ใช้ CNNs เพื่อตรวจสอบการก่อตัวของแท่งในการรวมดาราจักร
มันทำงานอย่างไร
นักวิทยาศาสตร์จาก NAOJ พึ่งพา convolutional เครือข่ายประสาทเทียม หรือซีเอ็นเอ็นเพื่อจำแนกภาพ ตั้งแต่ปี 2015 ซีเอ็นเอ็นได้กลายเป็นเทคนิคที่แม่นยำอย่างยิ่งในการจำแนกวัตถุบางอย่าง แอปพลิเคชันในโลกแห่งความเป็นจริงสำหรับ CNN ได้แก่ การตรวจจับใบหน้าในรูปภาพ รถยนต์ที่ขับด้วยตนเอง การจดจำอักขระที่เขียนด้วยลายมือ และการแพทย์ การวิเคราะห์ภาพ.
แต่ CNN ทำงานอย่างไร?
CNN อยู่ในคลาสของเทคนิคการเรียนรู้ของเครื่องที่เรียกว่า classifier ลักษณนามสามารถรับอินพุตและเอาต์พุตบางจุดข้อมูลได้ ตัวอย่างเช่น ตัวแยกประเภทป้ายถนนจะสามารถรับภาพและส่งออกได้ไม่ว่าภาพนั้นเป็นป้ายถนนหรือไม่
CNN เป็นตัวอย่างของ a เครือข่ายประสาท. โครงข่ายประสาทเหล่านี้ประกอบด้วย เซลล์ประสาท จัดเป็น ชั้น. ในระหว่างขั้นตอนการฝึก เซลล์ประสาทเหล่านี้ได้รับการปรับให้เข้ากับน้ำหนักและอคติที่เฉพาะเจาะจง ซึ่งจะช่วยแก้ปัญหาการจำแนกประเภทที่ต้องการ
เมื่อโครงข่ายประสาทรับภาพ จะใช้พื้นที่เล็กๆ ของภาพมากกว่าที่จะรวมทุกอย่างเข้าด้วยกัน เซลล์ประสาทแต่ละเซลล์จะมีปฏิสัมพันธ์กับเซลล์ประสาทอื่นๆ เช่นเดียวกับที่ใช้ในส่วนต่างๆ ของภาพหลัก
การปรากฏตัวของชั้น convolutional ทำให้ CNN แตกต่างจากโครงข่ายประสาทอื่น ๆ เลเยอร์เหล่านี้จะสแกนบล็อกพิกเซลที่ทับซ้อนกันโดยมีเป้าหมายเพื่อระบุคุณลักษณะจากภาพที่ป้อน เนื่องจากเราเชื่อมต่อเซลล์ประสาทที่อยู่ใกล้กัน เครือข่ายจะมีเวลาทำความเข้าใจรูปภาพได้ง่ายขึ้นเมื่อข้อมูลที่ป้อนเข้าผ่านแต่ละเลเยอร์
การใช้งานในสัณฐานวิทยาของกาแล็กซี่
เมื่อใช้ในการจำแนกดาราจักร CNN จะแบ่งภาพดาราจักรออกเป็น “แผ่นปะ” ที่เล็กกว่า การใช้คณิตศาสตร์เพียงเล็กน้อย เลเยอร์แรกที่ซ่อนอยู่จะพยายามแก้ไขว่าแพตช์นั้นมีเส้นหรือเส้นโค้งหรือไม่ เลเยอร์อื่นๆ จะพยายามแก้ปัญหาที่ซับซ้อนมากขึ้นเรื่อยๆ เช่น แพทช์มีคุณลักษณะของดาราจักรชนิดก้นหอยหรือไม่ เช่น การมีอยู่ของแขน
แม้ว่าจะค่อนข้างง่ายที่จะตัดสินว่าส่วนของภาพมีเส้นตรงหรือไม่ แต่การถามว่าภาพแสดงดาราจักรชนิดก้นหอยนั้นดูซับซ้อนขึ้นหรือไม่ ไม่ต้องพูดถึงดาราจักรชนิดก้นหอยชนิดใด
ด้วยโครงข่ายประสาทเทียม ตัวแยกประเภทจะเริ่มต้นด้วยกฎและเกณฑ์แบบสุ่ม กฎเหล่านี้จะค่อยๆ แม่นยำขึ้นเรื่อยๆ และเกี่ยวข้องกับปัญหาที่เรากำลังพยายามแก้ไข เมื่อสิ้นสุดระยะการฝึกอบรม โครงข่ายประสาทเทียมควรมีความคิดที่ดีว่าควรมองหาคุณลักษณะใดในภาพ
การขยาย AI โดยใช้ Citizen Science
วิทยาศาสตร์พลเมืองหมายถึงการวิจัยทางวิทยาศาสตร์ที่ดำเนินการโดยนักวิทยาศาสตร์สมัครเล่นหรือสมาชิกสาธารณะ
นักวิทยาศาสตร์ที่ศึกษาดาราศาสตร์มักจะร่วมมือกับนักวิทยาศาสตร์พลเมืองเพื่อช่วยในการค้นพบทางวิทยาศาสตร์ที่สำคัญกว่า นาซ่ารักษา รายการ โครงการวิทยาศาสตร์พลเมืองหลายสิบโครงการที่ทุกคนที่มีโทรศัพท์มือถือหรือแล็ปท็อปสามารถมีส่วนร่วมได้
หอดูดาวดาราศาสตร์แห่งชาติของญี่ปุ่นยังได้จัดทำโครงการวิทยาศาสตร์พลเมืองที่เรียกว่า กาแล็กซี่ ครูซ. ความคิดริเริ่มนี้ฝึกอาสาสมัครในการจำแนกกาแลคซีและมองหาสัญญาณของการชนกันที่อาจเกิดขึ้นระหว่างกาแลคซี โครงการพลเมืองอื่นที่เรียกว่า สวนสัตว์ Galaxy ได้รับการจัดประเภทแล้วกว่า 50 ล้านประเภทในปีแรกของการเปิดตัว
เราทำได้โดยใช้ข้อมูลจากโครงการวิทยาศาสตร์พลเมือง รถไฟเครือข่ายประสาท เพื่อจำแนกกาแลคซีออกเป็นคลาสที่ละเอียดยิ่งขึ้นต่อไป เรายังสามารถใช้ป้ายกำกับวิทยาศาสตร์พลเมืองเหล่านี้เพื่อค้นหากาแลคซีที่มีคุณสมบัติที่น่าสนใจ คุณลักษณะต่างๆ เช่น วงแหวนและเลนส์อาจยังหาได้ยากเมื่อใช้โครงข่ายประสาทเทียม
สรุป
เทคนิคโครงข่ายประสาทเทียมกำลังเป็นที่นิยมมากขึ้นในด้านดาราศาสตร์ การเปิดตัวกล้องโทรทรรศน์อวกาศเจมส์ เวบบ์ของนาซ่าในปี 2021 ถือเป็นยุคใหม่ของดาราศาสตร์เชิงสังเกตการณ์ กล้องโทรทรรศน์ได้รวบรวมข้อมูลมาแล้วหลายเทราไบต์ โดยอาจมีข้อมูลมากกว่าพันวิธีในช่วงอายุภารกิจห้าปี
การจำแนกกาแลคซีเป็นเพียงหนึ่งในงานที่เป็นไปได้มากมายที่สามารถเพิ่มขนาดได้ด้วย ML ด้วยการประมวลผลข้อมูลพื้นที่กลายเป็นปัญหา Big Data นักวิจัยต้องใช้การเรียนรู้ของเครื่องขั้นสูงอย่างเต็มที่เพื่อทำความเข้าใจภาพรวม
เขียนความเห็น