Sama tehnoloogia, mis juhib näotuvastust ja isejuhtivaid autosid, võib peagi olla võtmeinstrumendiks universumi varjatud saladuste avamisel.
Vaatlusastronoomia hiljutised arengud on toonud kaasa andmete plahvatusliku suurenemise.
Võimsad teleskoobid koguvad iga päev terabaite andmeid. Nii suure hulga andmete töötlemiseks peavad teadlased leidma uusi viise, kuidas automatiseerida erinevaid valdkonna ülesandeid, nagu kiirguse ja muude taevanähtuste mõõtmine.
Üks konkreetne ülesanne, mida astronoomid innukalt kiirendada soovivad, on galaktikate klassifitseerimine. Selles artiklis käsitleme seda, miks galaktikate klassifitseerimine on nii oluline ja kuidas teadlased on hakanud tuginema täiustatud masinõppetehnikatele, et andmemahu suurenedes neid suurendada.
Miks me peame galaktikaid klassifitseerima?
Galaktikate klassifikatsioon, mida selles valdkonnas tuntakse galaktikamorfoloogiana, sai alguse 18. sajandil. Selle aja jooksul täheldas Sir William Herschel, et mitmesugused udukogud olid erineval kujul. Tema poeg John Herschel täiustas seda klassifikatsiooni, eristades galaktilisi udukogusid mitte-galaktilistel ududel. Viimast neist kahest klassifikatsioonist teame ja nimetame galaktikateks.
18. sajandi lõpupoole spekuleerisid mitmed astronoomid, et need kosmilised objektid on galaktikavälised ja asuvad väljaspool meie Linnuteed.
Hubble võttis 1925. aastal kasutusele uue galaktikate klassifikatsiooni, võttes kasutusele Hubble'i jada, mida mitteametlikult tuntakse Hubble'i häälestuskahvli diagrammina.
Hubble'i jada jagas galaktikad korrapärasteks ja ebaregulaarseteks galaktikateks. Regulaarsed galaktikad jaotati veel kolme suurde klassi: elliptilised, spiraalid ja läätsekujulised.
Galaktikate uurimine annab meile ülevaate mitmetest universumi toimimise võtmesaladustest. Teadlased on kasutanud galaktikate erinevaid vorme, et luua teooriat tähtede tekkeprotsessi kohta. Simulatsioonide abil on teadlased püüdnud modelleerida ka seda, kuidas galaktikad ise moodustuvad kujunditeks, mida me tänapäeval jälgime.
Galaktikate automatiseeritud morfoloogiline klassifikatsioon
Masinõppe kasutamise uuringud galaktikate klassifitseerimiseks on näidanud paljulubavaid tulemusi. 2020. aastal kasutasid Jaapani riikliku astronoomiaobservatooriumi teadlased a süvaõppe tehnika galaktikate täpseks klassifitseerimiseks.
Teadlased kasutasid Subaru/Hyper Suprime-Cami (HSC) uuringust saadud piltide suurt andmekogumit. Oma tehnikat kasutades võisid nad klassifitseerida galaktikad S-kujulisteks spiraalideks, Z-kujulisteks spiraalideks ja mittespiraalideks.
Nende uuringud näitasid teleskoopide suurte andmete kombineerimise eeliseid sügav õpe tehnikaid. Närvivõrkude tõttu saavad astronoomid nüüd proovida klassifitseerida muud tüüpi morfoloogiat, nagu tulbad, ühinemised ja tugeva läätsega objektid. Näiteks, seotud uuringud MK Cavanagh ja K. Bekki kasutasid CNN-e, et uurida varraste moodustisi ühinevates galaktikates.
Kuidas see töötab
NAOJ-i teadlased toetusid konvolutsioonile närvivõrgud või CNN-id piltide klassifitseerimiseks. Alates 2015. aastast on CNN-id muutunud äärmiselt täpseks tehnikaks teatud objektide klassifitseerimiseks. CNN-ide tegelikud rakendused hõlmavad näotuvastust piltidel, isejuhtivaid autosid, käsitsi kirjutatud märgituvastust ja meditsiinilist kujundianalüüs.
Aga kuidas CNN töötab?
CNN kuulub masinõppetehnikate klassi, mida tuntakse klassifikaatorina. Klassifikaatorid võivad võtta teatud sisendi ja väljastada andmepunkti. Näiteks suudab tänavaviitade klassifikaator võtta pildi ja väljastada, kas pilt on tänavasilt või mitte.
CNN on näide a Närvivõrgus. Need närvivõrgud koosnevad neuronid sisse organiseeritud kihid. Treeningufaasis häälestatakse need neuronid kohandama spetsiifilisi raskusi ja kõrvalekaldeid, mis aitavad lahendada nõutavat klassifitseerimisprobleemi.
Kui närvivõrk võtab kujutise vastu, võtab see pildist pigem väikesed alad kui kõik tervikuna. Iga üksik neuron suhtleb teiste neuronitega põhipildi erinevates osades.
Konvolutsioonikihtide olemasolu muudab CNN-i teistest närvivõrkudest erinevaks. Need kihid skannivad kattuvaid piksliplokke eesmärgiga tuvastada sisendkujutise funktsioone. Kuna ühendame üksteise lähedal olevad neuronid, on võrgul lihtsam pilti mõista, kui sisendandmed läbivad iga kihi.
Kasutamine galaktika morfoloogias
Galaktikate klassifitseerimisel jagavad CNN-id galaktika kujutise väiksemateks laigudeks. Kasutades veidi matemaatikat, proovib esimene peidetud kiht lahendada, kas plaaster sisaldab joont või kõverat. Edasised kihid püüavad lahendada üha keerukamaid küsimusi, näiteks seda, kas plaaster sisaldab spiraalgalaktika tunnust, näiteks käe olemasolu.
Kuigi on suhteliselt lihtne kindlaks teha, kas pildi osa sisaldab sirgjoont, muutub üha keerulisemaks küsida, kas pildil on näha spiraalgalaktikat, rääkimata sellest, millist tüüpi spiraalgalaktikat.
Närvivõrkude puhul algab klassifikaator juhuslike reeglite ja kriteeriumidega. Need reeglid muutuvad aeglaselt üha täpsemaks ja asjakohasemaks probleemiga, mida püüame lahendada. Treeningfaasi lõpuks peaks närvivõrgul olema nüüd hea ettekujutus, milliseid funktsioone pildilt otsida.
AI laiendamine Citizen Science'i abil
Kodanikuteadus viitab teadusuuringutele, mida viivad läbi amatöörteadlased või avalik-õiguslikud liikmed.
Astronoomiat uurivad teadlased teevad sageli koostööd kodanike teadlastega, et aidata teha olulisemaid teaduslikke avastusi. NASA väidab a nimekiri kümneid kodanikuteaduse projekte, millesse saavad panustada igaüks, kellel on mobiiltelefon või sülearvuti.
Jaapani riiklik astronoomiaobservatoorium on välja pannud ka kodanikuteaduse projekti, mida tuntakse kui Galaxy kruiis. Algatus koolitab vabatahtlikke galaktikaid klassifitseerima ja otsima märke võimalikest galaktikate kokkupõrgetest. Teine kodanikuprojekt kutsus Galaxy loomaaed on juba esimesel turuletoomise aastal saanud üle 50 miljoni klassifikatsiooni.
Kodanikuteaduse projektide andmeid kasutades saame treenima närvivõrke klassifitseerida galaktikad üksikasjalikumatesse klassidesse. Neid kodanikuteaduse silte võiksime kasutada ka huvitavate omadustega galaktikate leidmiseks. Funktsioone, nagu rõngad ja läätsed, võib siiski olla närvivõrgu abil raske leida.
Järeldus
Närvivõrgu tehnikad muutuvad astronoomia valdkonnas üha populaarsemaks. NASA James Webbi kosmoseteleskoobi start 2021. aastal tõotab uut vaatlusastronoomia ajastut. Teleskoop on juba kogunud terabaite andmeid ja võib-olla on viieaastase missiooni jooksul teel veel tuhandeid.
Galaktikate klassifitseerimine on vaid üks paljudest võimalikest ülesannetest, mida saab ML abil suurendada. Kuna kosmoseandmete töötlemisest on saamas omaette suurandmete probleem, peavad teadlased suure pildi täielikuks mõistmiseks kasutama täiustatud masinõpet.
Jäta vastus