Stejná technologie, která pohání rozpoznávání obličeje a samořídící auta, může být brzy klíčovým nástrojem při odhalování skrytých tajemství vesmíru.
Nedávný vývoj v pozorovací astronomii vedl k explozi dat.
Výkonné teleskopy denně shromažďují terabajty dat. Aby vědci zpracovali takové množství dat, musí najít nové způsoby, jak automatizovat různé úkoly v terénu, jako je měření radiace a dalších nebeských jevů.
Jedním konkrétním úkolem, který astronomové chtějí urychlit, je klasifikace galaxií. V tomto článku se podíváme na to, proč je klasifikace galaxií tak důležitá a jak se výzkumníci začali spoléhat na pokročilé techniky strojového učení, aby se zvětšily s rostoucím objemem dat.
Proč potřebujeme klasifikovat galaxie?
Klasifikace galaxií, v oboru známá jako morfologie galaxií, vznikla v 18. století. Během té doby sir William Herschel pozoroval, že různé „mlhoviny“ přicházejí v různých podobách. Jeho syn John Herschel tuto klasifikaci zlepšil rozlišováním mezi galaktickými a negalaktickými mlhovinami. Poslední z těchto dvou klasifikací je to, co známe a označujeme jako galaxie.
Ke konci 18. století různí astronomové spekulovali, že tyto kosmické objekty jsou „extragalaktické“ a že leží mimo naši vlastní Mléčnou dráhu.
Hubble zavedl novou klasifikaci galaxií v roce 1925 zavedením Hubbleovy sekvence, neformálně známé jako Hubbleův diagram ladičky.
Hubbleova sekvence rozdělila galaxie na pravidelné a nepravidelné galaxie. Pravidelné galaxie byly dále rozděleny do tří širokých tříd: eliptické, spirální a lentikulární.
Studium galaxií nám umožňuje nahlédnout do několika klíčových záhad fungování vesmíru. Vědci použili různé formy galaxií k teoriím o procesu tvorby hvězd. Pomocí simulací se vědci také pokusili modelovat, jak se samotné galaxie formují do tvarů, které dnes pozorujeme.
Automatizovaná morfologická klasifikace galaxií
Výzkum využití strojového učení ke klasifikaci galaxií ukázal slibné výsledky. V roce 2020 použili vědci z Národní astronomické observatoře Japonska a technika hlubokého učení pro přesnou klasifikaci galaxií.
Výzkumníci použili velký soubor dat získaných z průzkumu Subaru/Hyper Suprime-Cam (HSC). Pomocí své techniky mohli klasifikovat galaxie do spirálních spirál ve tvaru S, spirál ve tvaru Z a nespirály.
Jejich výzkum ukázal výhody kombinace velkých dat z dalekohledů s hluboké učení techniky. Díky neuronovým sítím se nyní astronomové mohou pokusit klasifikovat jiné typy morfologie, jako jsou pruhy, sloučení a objekty se silnou čočkou. Například, související výzkum od MK Cavanagh a K. Bekki použili CNN ke zkoumání formací příček ve splývajících galaxiích.
Jak to funguje
Vědci z NAOJ spoléhali na konvoluční neuronové sítě nebo CNN pro klasifikaci obrázků. Od roku 2015 se CNN staly extrémně přesnou technikou pro klasifikaci určitých objektů. Reálné aplikace pro CNN zahrnují detekci obličeje na obrázcích, samořídící auta, rozpoznávání ručně psaných znaků a lékařské analýza snímků.
Jak ale CNN funguje?
CNN patří do třídy technik strojového učení známých jako klasifikátor. Klasifikátory mohou mít určitý vstup a výstup datového bodu. Klasifikátor pouličních značek bude například schopen zachytit obrázek a vygenerovat, zda se jedná o označení ulice nebo ne.
CNN je příkladem a nervová síť. Tyto neuronové sítě se skládají z neurony organizovaný do vrstev. Během tréninkové fáze jsou tyto neurony vyladěny tak, aby přizpůsobily specifické váhy a odchylky, které pomohou vyřešit požadovaný klasifikační problém.
Když neuronová síť přijme obraz, zabere spíše malé oblasti obrazu než vše jako celek. Každý jednotlivý neuron interaguje s jinými neurony, když zabírá různé části hlavního obrazu.
Přítomnost konvolučních vrstev dělá CNN odlišnou od ostatních neuronových sítí. Tyto vrstvy skenují překrývající se bloky pixelů s cílem identifikovat prvky ze vstupního obrazu. Vzhledem k tomu, že spojujeme neurony, které jsou blízko u sebe, bude síť snáze porozumět obrazu, protože vstupní data procházejí každou vrstvou.
Použití v morfologii galaxií
Při použití při klasifikaci galaxií rozdělují CNN obraz galaxie na menší „záplaty“. S trochou matematiky se první skrytá vrstva pokusí vyřešit, zda záplata obsahuje čáru nebo křivku. Další vrstvy se pokusí vyřešit stále složitější otázky, jako je to, zda skvrna obsahuje rys spirální galaxie, jako je přítomnost ramene.
I když je poměrně snadné určit, zda část obrázku obsahuje přímku, je stále složitější ptát se, zda obrázek ukazuje spirální galaxii, natož jaký typ spirální galaxie.
U neuronových sítí začíná klasifikátor náhodnými pravidly a kritérii. Tato pravidla se pomalu stávají stále přesnějšími a relevantnějšími pro problém, který se snažíme vyřešit. Na konci trénovací fáze by nyní neuronová síť měla mít dobrou představu o tom, jaké vlastnosti na obrázku hledat.
Rozšíření AI pomocí Citizen Science
Občanská věda označuje vědecký výzkum prováděný amatérskými vědci nebo veřejnými členy.
Vědci studující astronomii často spolupracují s občanskými vědci, aby pomohli učinit důležitější vědecké objevy. NASA udržuje a lest z desítek projektů občanské vědy, do kterých může přispět kdokoli s mobilním telefonem nebo notebookem.
Japonská národní astronomická observatoř také připravila projekt občanské vědy známý jako Galaxy Cruise. Tato iniciativa školí dobrovolníky, aby klasifikovali galaxie a hledali známky potenciálních kolizí mezi galaxiemi. Další občanský projekt tzv Galaxy Zoo již za první rok uvedení na trh získal více než 50 milionů klasifikací.
Pomocí dat z projektů občanské vědy můžeme trénovat neuronové sítě dále klasifikovat galaxie do podrobnějších tříd. Mohli bychom také použít tyto občanské vědecké štítky k nalezení galaxií se zajímavými rysy. Funkce, jako jsou prsteny a čočky, může být stále obtížné najít pomocí neuronové sítě.
Proč investovat do čističky vzduchu?
Techniky neuronových sítí jsou v oblasti astronomie stále populárnější. Vypuštění vesmírného dalekohledu NASA James Webb Space Telescope v roce 2021 slibuje novou éru pozorovací astronomie. Dalekohled již shromáždil terabajty dat a možná tisíce dalších jsou na cestě během pětileté životnosti mise.
Klasifikace galaxií je jen jedním z mnoha potenciálních úkolů, které lze pomocí ML zvětšit. Vzhledem k tomu, že se zpracování vesmírných dat stává vlastním problémem velkých dat, musí výzkumníci plně využít pokročilé strojové učení, aby pochopili celkový obraz.
Napsat komentář