Samma teknik som driver ansiktsigenkänning och självkörande bilar kan snart bli ett nyckelinstrument för att låsa upp universums dolda hemligheter.
Den senaste tidens utveckling inom observationsastronomi har lett till en explosion av data.
Kraftfulla teleskop samlar in terabyte data dagligen. För att bearbeta så mycket data måste forskare hitta nya sätt att automatisera olika uppgifter på fältet, som att mäta strålning och andra himmelska fenomen.
En särskild uppgift som astronomer är ivriga att påskynda är klassificeringen av galaxer. I den här artikeln kommer vi att gå igenom varför klassificering av galaxer är så viktigt och hur forskare har börjat förlita sig på avancerad maskininlärningsteknik för att skala upp i takt med att datavolymen ökar.
Varför behöver vi klassificera galaxer?
Klassificeringen av galaxer, känd inom området som galaxmorfologi, har sitt ursprung på 18-talet. Under den tiden observerade Sir William Herschel att olika "nebulosor" kom i olika former. Hans son John Herschel förbättrade denna klassificering genom att skilja mellan galaktiska nebulosor och icke-galaktiska nebulosor. Den senare av dessa två klassificeringar är vad vi känner till och kallar galaxer.
Mot slutet av 18-talet spekulerade olika astronomer att dessa kosmiska objekt var "extragalaktiska", och att de ligger utanför vår egen Vintergatan.
Hubble introducerade en ny klassificering av galaxer 1925 med introduktionen av Hubble-sekvensen, informellt känd som Hubble-stämgaffeldiagrammet.
Hubbles sekvens delade upp galaxer i vanliga och oregelbundna galaxer. De vanliga galaxerna delades ytterligare in i tre breda klasser: elliptiska, spiralformade och linsformade.
Studiet av galaxer ger oss insikt i flera nyckelmysterier om hur universum fungerar. Forskare har använt de olika formerna av galaxer för att teoretisera om stjärnbildningsprocessen. Med hjälp av simuleringar har forskare också försökt modellera hur galaxer själva formas till de former som vi observerar idag.
Automatiserad morfologisk klassificering av galaxer
Forskning om att använda maskininlärning för att klassificera galaxer har visat lovande resultat. År 2020 använde forskare från National Astronomical Observatory of Japan en teknik för djupinlärning att klassificera galaxer korrekt.
Forskarna använde en stor datamängd av bilder erhållna från Subaru/Hyper Suprime-Cam (HSC) Survey. Med hjälp av sin teknik kunde de klassificera galaxer i S-visa spiraler, Z-vise spiraler och icke-spiraler.
Deras forskning visade fördelarna med att kombinera stordata från teleskop med djupt lärande tekniker. På grund av neurala nät kan astronomer nu försöka klassificera andra typer av morfologi som staplar, sammanslagningar och föremål med stark lins. Till exempel, relaterad forskning från MK Cavanagh och K. Bekki använde CNN för att undersöka stångformationer i sammanslagna galaxer.
Så fungerar det
Forskarna från NAOJ förlitade sig på convolutional neurala nätverk eller CNN för att klassificera bilder. Sedan 2015 har CNN blivit en extremt noggrann teknik för att klassificera vissa objekt. Verkliga applikationer för CNN inkluderar ansiktsdetektering i bilder, självkörande bilar, handskriven karaktärsigenkänning och medicinsk bildanalys.
Men hur fungerar ett CNN?
CNN tillhör en klass av maskininlärningstekniker som kallas klassificerare. Klassificerare kan ta viss ingång och mata ut en datapunkt. Till exempel kommer en gatumärkesklassificerare att kunna ta in en bild och skriva ut om bilden är en gatuskylt eller inte.
En CNN är ett exempel på en neurala nätverk. Dessa neurala nätverk består av neuroner organiserad i skikt. Under träningsfasen ställs dessa neuroner in för att anpassa specifika vikter och fördomar som hjälper till att lösa det klassificeringsproblem som krävs.
När ett neuralt nätverk tar emot en bild tar det in små områden av bilden snarare än allt som helhet. Varje enskild neuron interagerar med andra neuroner när den tar i olika delar av huvudbilden.
Närvaron av faltningslager gör att CNN skiljer sig från andra neurala nätverk. Dessa lager skannar överlappande block av pixlar med målet att identifiera funktioner från inmatningsbilden. Eftersom vi kopplar ihop neuroner som är nära varandra kommer nätverket att ha lättare att förstå bilden när indata passerar genom varje lager.
Användning i galaxmorfologi
När de används för att klassificera galaxer bryter CNN ner en bild av en galax i mindre "fläckar". Med hjälp av lite matematik kommer det första dolda lagret att försöka lösa om lappen innehåller en linje eller kurva. Ytterligare lager kommer att försöka lösa allt mer komplexa frågor som om plåstret innehåller en egenskap hos en spiralgalax, till exempel närvaron av en arm.
Även om det är relativt lätt att avgöra om en sektion av en bild innehåller en rät linje, blir det allt mer komplicerat att fråga om bilden visar en spiralgalax, än mindre vilken typ av spiralgalax.
Med neurala nätverk börjar klassificeraren med slumpmässiga regler och kriterier. Dessa regler blir långsamt mer och mer exakta och relevanta för det problem vi försöker lösa. I slutet av träningsfasen bör det neurala nätverket nu ha en bra uppfattning om vilka funktioner man ska leta efter i en bild.
Utöka AI med Citizen Science
Medborgarvetenskap avser vetenskaplig forskning som utförs av amatörforskare eller offentliga medlemmar.
Forskare som studerar astronomi samarbetar ofta med medborgarforskare för att göra viktigare vetenskapliga upptäckter. NASA upprätthåller en lista av dussintals medborgarvetenskapliga projekt till vilka alla som har en mobiltelefon eller bärbar dator kan bidra.
National Astronomical Observatory of Japan har också satt upp ett medborgarvetenskapligt projekt känt som Galaxy Cruise. Initiativet utbildar frivilliga att klassificera galaxer och leta efter tecken på potentiella kollisioner mellan galaxer. Ett annat medborgarprojekt kallat Galaxy Zoo har redan fått över 50 miljoner klassificeringar bara under det första lanseringsåret.
Med hjälp av data från medborgarvetenskapliga projekt kan vi träna neurala nätverk att klassificera galaxer i mer detaljerade klasser ytterligare. Vi skulle också kunna använda dessa medborgarvetenskapliga etiketter för att hitta galaxer med intressanta egenskaper. Funktioner som ringar och linser kan fortfarande vara svåra att hitta med hjälp av ett neuralt nätverk.
Slutsats
Neurala nätverkstekniker blir allt mer populära inom astronomi. Lanseringen av NASA:s rymdteleskop James Webb 2021 lovar en ny era av observationsastronomi. Teleskopet har redan samlat in terabyte med data, med möjligen tusentals fler på väg under dess femåriga uppdragslivslängd.
Klassificering av galaxer är bara en av många potentiella uppgifter som kan skalas upp med ML. Eftersom rymddatabehandling blir sitt eget Big Data-problem, måste forskare använda avancerad maskininlärning fullt ut för att förstå helheten.
Kommentera uppropet