Công nghệ tương tự hỗ trợ nhận dạng khuôn mặt và ô tô tự lái có thể sẽ sớm trở thành công cụ quan trọng để mở ra những bí mật tiềm ẩn của vũ trụ.
Những phát triển gần đây trong thiên văn học quan sát đã dẫn đến sự bùng nổ dữ liệu.
Kính thiên văn mạnh mẽ thu thập hàng terabyte dữ liệu hàng ngày. Để xử lý nhiều dữ liệu đó, các nhà khoa học cần tìm ra những cách mới để tự động hóa các nhiệm vụ khác nhau trong lĩnh vực này, chẳng hạn như đo bức xạ và các hiện tượng thiên thể khác.
Một nhiệm vụ đặc biệt mà các nhà thiên văn học đang mong muốn đẩy nhanh tiến độ là phân loại các thiên hà. Trong bài viết này, chúng ta sẽ cùng tìm hiểu lý do tại sao việc phân loại các thiên hà lại quan trọng như vậy và cách các nhà nghiên cứu bắt đầu dựa vào các kỹ thuật máy học tiên tiến để mở rộng quy mô khi khối lượng dữ liệu tăng lên.
Tại sao chúng ta cần phân loại các thiên hà?
Việc phân loại các thiên hà, được biết đến trong lĩnh vực này là hình thái thiên hà, bắt nguồn từ thế kỷ 18. Trong thời gian đó, Ngài William Herschel đã quan sát thấy nhiều 'tinh vân' khác nhau có nhiều dạng khác nhau. Con trai của ông, John Herschel, đã cải thiện sự phân loại này bằng cách phân biệt giữa tinh vân thiên hà và tinh vân phi thiên hà. Phân loại sau của hai phân loại này là những gì chúng ta biết và gọi là thiên hà.
Vào cuối thế kỷ 18, nhiều nhà thiên văn học đã suy đoán rằng những vật thể vũ trụ này là “ngoài thiên hà”, và chúng nằm bên ngoài Dải Ngân hà của chúng ta.
Hubble đã đưa ra một phân loại mới về các thiên hà vào năm 1925 với sự ra đời của chuỗi Hubble, được gọi một cách không chính thức là biểu đồ âm thoa của Hubble.
Trình tự của Hubble chia các thiên hà thành các thiên hà đều đặn và không đều. Các thiên hà thông thường được chia thành ba lớp lớn: Hình elip, hình xoắn ốc và hình thấu kính.
Nghiên cứu về các thiên hà cho chúng ta cái nhìn sâu sắc về một số bí ẩn quan trọng về cách thức hoạt động của vũ trụ. Các nhà nghiên cứu đã sử dụng các dạng thiên hà khác nhau để đưa ra giả thuyết về quá trình hình thành sao. Sử dụng mô phỏng, các nhà khoa học cũng đã cố gắng mô hình hóa cách các thiên hà tự hình thành nên những hình dạng mà chúng ta quan sát được ngày nay.
Phân loại hình thái tự động của các thiên hà
Nghiên cứu sử dụng máy học để phân loại các thiên hà đã cho thấy những kết quả đầy hứa hẹn. Vào năm 2020, các nhà nghiên cứu từ Đài quan sát Thiên văn Quốc gia Nhật Bản đã sử dụng kỹ thuật học sâu để phân loại các thiên hà một cách chính xác.
Các nhà nghiên cứu đã sử dụng một tập dữ liệu lớn về hình ảnh thu được từ Khảo sát Subaru / Hyper Suprime-Cam (HSC). Sử dụng kỹ thuật của mình, họ có thể phân loại các thiên hà thành xoắn ốc S, xoắn ốc khôn ngoan Z và xoắn ốc không xoắn ốc.
Nghiên cứu của họ đã chứng minh lợi thế của việc kết hợp dữ liệu lớn từ kính thiên văn với học kĩ càng kỹ thuật. Do có lưới thần kinh, các nhà thiên văn học giờ đây có thể thử phân loại các dạng hình thái khác như thanh, hợp nhất và các vật thể được thấu kính mạnh. Ví dụ, Nghiên cứu liên quan từ MK Cavanagh và K. Bekki đã sử dụng CNN để điều tra sự hình thành thanh trong các thiên hà hợp nhất.
Cách thức Hoạt động
Các nhà khoa học từ NAOJ đã dựa trên mạng thần kinh hoặc CNNs để phân loại hình ảnh. Kể từ năm 2015, CNN đã trở thành một kỹ thuật cực kỳ chính xác để phân loại các đối tượng nhất định. Các ứng dụng trong thế giới thực của CNN bao gồm nhận diện khuôn mặt trong hình ảnh, ô tô tự lái, nhận dạng ký tự viết tay và y tế. phân tích hình ảnh.
Nhưng CNN hoạt động như thế nào?
CNN thuộc về một lớp kỹ thuật học máy được biết đến như một bộ phân loại. Bộ phân loại có thể nhận một số đầu vào và đầu ra một điểm dữ liệu. Ví dụ: một bộ phân loại biển báo đường phố sẽ có thể lấy hình ảnh và xuất ra hình ảnh đó có phải là biển báo đường phố hay không.
CNN là một ví dụ về mạng lưới thần kinh. Các mạng nơ-ron này bao gồm tế bào thần kinh Tổ chức thành lớp. Trong giai đoạn huấn luyện, những tế bào thần kinh này được điều chỉnh để thích ứng với trọng lượng và độ lệch cụ thể sẽ giúp giải quyết vấn đề phân loại được yêu cầu.
Khi một mạng nơ-ron nhận được một hình ảnh, nó sẽ chiếm những vùng nhỏ của hình ảnh chứ không phải toàn bộ mọi thứ, Mỗi nơ-ron riêng lẻ sẽ tương tác với các nơ-ron khác khi nó diễn ra trong các phần khác nhau của hình ảnh chính.
Sự hiện diện của các lớp chập làm cho CNN trở nên khác biệt so với các mạng nơ-ron khác. Các lớp này quét các khối pixel chồng lên nhau với mục tiêu xác định các đặc điểm từ hình ảnh đầu vào. Vì chúng ta kết nối các nơ-ron gần nhau nên mạng sẽ dễ dàng hiểu được bức tranh hơn khi dữ liệu đầu vào đi qua từng lớp.
Sử dụng trong Hình thái học Thiên hà
Khi được sử dụng để phân loại các thiên hà, CNN chia nhỏ hình ảnh của một thiên hà thành các “mảng” nhỏ hơn. Sử dụng một chút toán học, lớp ẩn đầu tiên sẽ cố gắng giải quyết xem bản vá có chứa đường thẳng hay đường cong hay không. Các lớp tiếp theo sẽ cố gắng giải quyết các câu hỏi ngày càng phức tạp như liệu bản vá có chứa đặc điểm của thiên hà xoắn ốc, chẳng hạn như sự hiện diện của một cánh tay hay không.
Mặc dù việc xác định một phần của hình ảnh có chứa đường thẳng là điều tương đối dễ dàng hay không, nhưng việc đặt câu hỏi liệu hình ảnh đó có hiển thị một thiên hà xoắn ốc hay không, chứ chưa nói đến loại thiên hà xoắn ốc ngày càng trở nên phức tạp.
Với mạng nơron, bộ phân loại bắt đầu với các quy tắc và tiêu chí ngẫu nhiên. Các quy tắc này ngày càng trở nên chính xác hơn và phù hợp hơn với vấn đề mà chúng tôi đang cố gắng giải quyết. Vào cuối giai đoạn huấn luyện, mạng nơ-ron bây giờ sẽ có một ý tưởng tốt về những tính năng cần tìm kiếm trong một hình ảnh.
Mở rộng AI bằng Khoa học Công dân
Khoa học công dân là nghiên cứu khoa học được thực hiện bởi các nhà khoa học nghiệp dư hoặc các thành viên nhà nước.
Các nhà khoa học nghiên cứu thiên văn học thường cộng tác với các nhà khoa học công dân để giúp tạo ra nhiều khám phá khoa học quan trọng hơn. NASA duy trì một trong số hàng chục dự án khoa học công dân mà bất kỳ ai có điện thoại di động hoặc máy tính xách tay đều có thể đóng góp.
Đài quan sát thiên văn quốc gia của Nhật Bản cũng đã đưa ra một dự án khoa học công dân được gọi là Du thuyền Galaxy. Sáng kiến này đào tạo các tình nguyện viên cách phân loại các thiên hà và tìm kiếm các dấu hiệu về khả năng va chạm giữa các thiên hà. Một dự án công dân khác được gọi là Sở thú thiên hà đã nhận được hơn 50 triệu phân loại chỉ trong năm đầu tiên ra mắt.
Sử dụng dữ liệu từ các dự án khoa học công dân, chúng ta có thể đào tạo mạng lưới thần kinh để phân loại các thiên hà thành các lớp chi tiết hơn nữa. Chúng ta cũng có thể sử dụng các nhãn khoa học công dân này để tìm các thiên hà có các đặc điểm thú vị. Các tính năng như nhẫn và ống kính vẫn có thể khó tìm thấy bằng mạng thần kinh.
Kết luận
Kỹ thuật mạng nơ-ron ngày càng trở nên phổ biến trong lĩnh vực thiên văn học. Sự ra mắt của Kính viễn vọng Không gian James Webb của NASA vào năm 2021 hứa hẹn một kỷ nguyên mới của thiên văn học quan sát. Kính thiên văn đã thu thập được hàng terabyte dữ liệu, có thể còn hàng nghìn lần nữa trong vòng đời sứ mệnh kéo dài XNUMX năm của nó.
Phân loại các thiên hà chỉ là một trong nhiều nhiệm vụ tiềm năng có thể được mở rộng với ML. Với việc xử lý dữ liệu không gian đang trở thành vấn đề Dữ liệu lớn của riêng mình, các nhà nghiên cứu phải sử dụng máy học tiên tiến hoàn toàn để hiểu được bức tranh lớn.
Bình luận