目錄[隱藏][顯示]
驅動面部識別和自動駕駛汽車的技術可能很快就會成為解開宇宙隱藏秘密的關鍵工具。
觀測天文學的最新發展導致了數據的爆炸式增長。
強大的望遠鏡每天收集數 TB 的數據。 為了處理這麼多數據,科學家們需要找到新的方法來自動化該領域的各種任務,例如測量輻射和其他天體現象。
天文學家急於加速的一項特殊任務是星系分類。 在本文中,我們將討論為什麼對星系進行分類如此重要,以及研究人員如何開始依賴先進的機器學習技術來隨著數據量的增加而擴大規模。
為什麼我們需要對星系進行分類?
星系的分類,在該領域被稱為星系形態,起源於 18 世紀。 在那段時間裡,威廉·赫歇爾爵士觀察到各種“星雲”以各種形式出現。 他的兒子約翰赫歇爾通過區分銀河星雲和非銀河星雲改進了這一分類。 這兩個分類中的後者是我們所知道的並被稱為星系。
到 18 世紀末,許多天文學家推測這些宇宙物體是“銀河系外的”,它們位於我們自己的銀河系之外。
哈勃在 1925 年引入了一種新的星系分類,引入了哈勃序列,非正式地稱為哈勃音叉圖。
哈勃序列將星系分為規則星系和不規則星系。 規則星系進一步分為三大類:橢圓星系、螺旋星系和透鏡星系。
對星系的研究讓我們深入了解了宇宙如何運作的幾個關鍵謎團。 研究人員使用不同形式的星係來理論化恆星形成過程。 通過模擬,科學家們還試圖模擬星系本身是如何形成我們今天觀察到的形狀的。
星系的自動形態分類
使用機器學習對星系進行分類的研究已經顯示出有希望的結果。 2020 年,日本國立天文台的研究人員使用了 深度學習技術 準確分類星系。
研究人員使用了從 Subaru/Hyper Suprime-Cam (HSC) 調查中獲得的大量圖像數據集。 使用他們的技術,他們可以將星系分為 S 向螺旋、Z 向螺旋和非螺旋。
他們的研究證明了將來自望遠鏡的大數據與 深入學習 技巧。 由於神經網絡,天文學家現在可以嘗試對其他類型的形態進行分類,例如條形、合併和強透鏡物體。 例如, 相關的研究 來自 MK Cavanagh 和 K. Bekki 的研究人員使用 CNN 來研究合併星系中的條形結構。
如何操作
NAOJ 的科學家們依靠卷積 神經網絡 或 CNN 對圖像進行分類。 自 2015 年以來,CNN 已成為對某些對象進行分類的極其準確的技術。 CNN 的實際應用包括圖像中的人臉檢測、自動駕駛汽車、手寫字符識別和醫療 圖像分析.
但是CNN是如何工作的呢?
CNN 屬於一類稱為分類器的機器學習技術。 分類器可以接受某些輸入並輸出一個數據點。 例如,街道標誌分類器將能夠接收圖像並輸出圖像是否是街道標誌。
CNN 就是一個例子 神經網絡. 這些神經網絡由 神經元 組織成 層. 在訓練階段,這些神經元被調整以適應特定的權重和偏差,這將有助於解決所需的分類問題。
當神經網絡接收到圖像時,它會接收圖像的小區域而不是整個圖像。每個單獨的神經元與其他神經元交互,就像它接收主圖像的各個部分一樣。
卷積層的存在使 CNN 與其他神經網絡不同。 這些層掃描重疊的像素塊,目的是從輸入圖像中識別特徵。 由於我們將靠近的神經元連接在一起,當輸入數據通過每一層時,網絡將更容易理解圖片。
在星系形態學中的使用
當用於對星系進行分類時,CNN 將星系的圖像分解成更小的“塊”。 使用一點數學,第一個隱藏層將嘗試解決補丁是否包含直線或曲線。 進一步的層將嘗試解決越來越複雜的問題,例如補丁是否包含螺旋星系的特徵,例如手臂的存在。
雖然確定圖像的某個部分是否包含直線相對容易,但要詢問圖像是否顯示螺旋星系變得越來越複雜,更不用說什麼類型的螺旋星係了。
對於神經網絡,分類器從隨機規則和標准開始。 這些規則慢慢變得越來越精確,並且與我們試圖解決的問題相關。 在訓練階段結束時,神經網絡現在應該很好地了解要在圖像中尋找哪些特徵。
使用公民科學擴展人工智能
公民科學是指由業餘科學家或公眾成員進行的科學研究。
研究天文學的科學家經常與公民科學家合作,以幫助做出更重要的科學發現。 美國國家航空航天局維持一個 表 任何擁有手機或筆記本電腦的人都可以參與的數十個公民科學項目。
日本國家天文台也提出了一個公民科學項目,稱為 銀河遊輪. 該計劃訓練志願者對星系進行分類並尋找星系之間潛在碰撞的跡象。 另一個公民項目稱為 銀河動物園 僅在推出的第一年就已收到超過 50 萬次分類。
使用公民科學項目的數據,我們可以 訓練神經網絡 進一步將星系分為更詳細的類別。 我們還可以使用這些公民科學標籤來尋找具有有趣特徵的星系。 使用神經網絡可能仍然很難找到諸如戒指和鏡片之類的特徵。
結論
神經網絡技術在天文學領域變得越來越流行。 美國宇航局詹姆斯韋伯太空望遠鏡於 2021 年發射,預示著觀測天文學的新紀元。 該望遠鏡已經收集了數 TB 的數據,在其五年的任務生命週期中可能還會有數千個數據。
對星系進行分類只是可以使用 ML 擴大規模的眾多潛在任務之一。 隨著空間數據處理成為其自身的大數據問題,研究人員必須充分利用先進的機器學習來了解全局。
發表評論