Rovnaká technológia, ktorá poháňa rozpoznávanie tváre a samoriadiace autá, môže byť čoskoro kľúčovým nástrojom pri odhaľovaní skrytých tajomstiev vesmíru.
Nedávny vývoj v pozorovacej astronómii viedol k explózii údajov.
Výkonné teleskopy denne zhromažďujú terabajty údajov. Na spracovanie takého množstva údajov musia vedci nájsť nové spôsoby automatizácie rôznych úloh v teréne, ako je meranie žiarenia a iných nebeských javov.
Jednou konkrétnou úlohou, ktorú astronómovia chcú urýchliť, je klasifikácia galaxií. V tomto článku sa pozrieme na to, prečo je klasifikácia galaxií taká dôležitá a ako sa výskumníci začali spoliehať na pokročilé techniky strojového učenia, aby sa zväčšili s rastúcim objemom údajov.
Prečo potrebujeme klasifikovať galaxie?
Klasifikácia galaxií, v odbore známa ako morfológia galaxií, vznikla v 18. storočí. Počas toho času Sir William Herschel pozoroval, že rôzne „hmloviny“ sa vyskytujú v rôznych formách. Jeho syn John Herschel zlepšil túto klasifikáciu tým, že rozlišoval medzi galaktickými hmlovinami a negalaktickými hmlovinami. Poslednú z týchto dvoch klasifikácií poznáme a označujeme ako galaxie.
Ku koncu 18. storočia rôzni astronómovia špekulovali, že tieto kozmické objekty sú „extragalaktické“ a že ležia mimo našej vlastnej Mliečnej dráhy.
Hubbleov teleskop zaviedol novú klasifikáciu galaxií v roku 1925 zavedením Hubbleovej sekvencie, ktorá je neformálne známa ako Hubblov diagram ladiacej vidlice.
Hubbleova sekvencia rozdelila galaxie na pravidelné a nepravidelné galaxie. Pravidelné galaxie boli ďalej rozdelené do troch širokých tried: eliptické, špirálové a lentikulárne.
Štúdium galaxií nám dáva pohľad na niekoľko kľúčových tajomstiev fungovania vesmíru. Výskumníci použili rôzne formy galaxií na teoretizovanie procesu tvorby hviezd. Pomocou simulácií sa vedci tiež pokúsili modelovať, ako sa samotné galaxie formujú do tvarov, ktoré dnes pozorujeme.
Automatizovaná morfologická klasifikácia galaxií
Výskum využitia strojového učenia na klasifikáciu galaxií ukázal sľubné výsledky. V roku 2020 výskumníci z Národného astronomického observatória Japonska použili a technika hlbokého učenia na presnú klasifikáciu galaxií.
Výskumníci použili veľký súbor údajov získaných z prieskumu Subaru/Hyper Suprime-Cam (HSC). Pomocou svojej techniky mohli klasifikovať galaxie do špirálovitých S, špirálovitých v tvare Z a bez špirály.
Ich výskum ukázal výhody kombinácie veľkých dát z ďalekohľadov s hlboké vzdelávanie techniky. Vďaka neurónovým sieťam sa teraz astronómovia môžu pokúsiť klasifikovať iné typy morfológie, ako sú pruhy, zlúčenia a objekty so silnou šošovkou. Napríklad, súvisiaci výskum od MK Cavanagh a K. Bekki použili CNN na skúmanie tyčových formácií v splývajúcich galaxiách.
Ako to funguje
Vedci z NAOJ stavili na konvolučné neurálne siete alebo CNN na klasifikáciu obrázkov. Od roku 2015 sa CNN stali mimoriadne presnou technikou na klasifikáciu určitých objektov. Reálne aplikácie pre CNN zahŕňajú detekciu tváre na obrázkoch, autonómne autá, rozpoznávanie rukou písaných znakov a lekárske analýza snímok.
Ale ako funguje CNN?
CNN patrí do triedy techník strojového učenia známych ako klasifikátor. Klasifikátory môžu prijať určitý vstup a výstup dátového bodu. Klasifikátor názvov ulíc bude napríklad schopný zachytiť obrázok a vygenerovať, či ide o návesť ulice alebo nie.
CNN je príkladom a neurónové sieť. Tieto neurónové siete sa skladajú z neuróny organizované do vrstiev. Počas tréningovej fázy sú tieto neuróny vyladené tak, aby prispôsobili špecifické váhy a odchýlky, ktoré pomôžu vyriešiť požadovaný klasifikačný problém.
Keď neurónová sieť dostane obrázok, zaberie skôr malé oblasti obrázka než všetko ako celok. Každý jednotlivý neurón interaguje s inými neurónmi, keď zaberá rôzne časti hlavného obrázka.
Prítomnosť konvolučných vrstiev robí CNN odlišnou od ostatných neurónových sietí. Tieto vrstvy skenujú prekrývajúce sa bloky pixelov s cieľom identifikovať prvky zo vstupného obrazu. Keďže spájame neuróny, ktoré sú blízko seba, sieť ľahšie pochopí obraz, keď vstupné údaje prechádzajú každou vrstvou.
Použitie v morfológii galaxií
Pri použití pri klasifikácii galaxií rozdeľujú CNN obraz galaxie na menšie „záplaty“. S trochou matematiky sa prvá skrytá vrstva pokúsi vyriešiť, či záplata obsahuje čiaru alebo krivku. Ďalšie vrstvy sa pokúsia vyriešiť čoraz zložitejšie otázky, ako napríklad to, či náplasť obsahuje znak špirálovej galaxie, ako napríklad prítomnosť ramena.
Aj keď je relatívne ľahké určiť, či časť obrázka obsahuje priamku, je čoraz zložitejšie sa opýtať, či obrázok zobrazuje špirálovú galaxiu, nehovoriac o tom, aký typ špirálovej galaxie.
Pri neurónových sieťach začína klasifikátor náhodnými pravidlami a kritériami. Tieto pravidlá sa pomaly stávajú čoraz presnejšími a relevantnejšími pre problém, ktorý sa snažíme vyriešiť. Na konci tréningovej fázy by teraz neurónová sieť mala mať dobrú predstavu o tom, aké funkcie má na obrázku hľadať.
Rozšírenie AI pomocou Citizen Science
Občianska veda sa vzťahuje na vedecký výskum, ktorý vykonávajú amatérski vedci alebo verejní členovia.
Vedci, ktorí študujú astronómiu, často spolupracujú s občianskymi vedcami, aby pomohli urobiť dôležitejšie vedecké objavy. NASA tvrdí a zoznam z desiatok projektov občianskej vedy, do ktorých môže prispieť ktokoľvek s mobilným telefónom alebo notebookom.
Národné astronomické observatórium Japonska tiež pripravilo občiansky vedecký projekt známy ako Galaxy Cruise. Iniciatíva školí dobrovoľníkov, aby klasifikovali galaxie a hľadali známky potenciálnych kolízií medzi galaxiami. Ďalší občiansky projekt tzv Galaxy Zoo už za prvý rok uvedenia na trh získal viac ako 50 miliónov klasifikácií.
Pomocou údajov z projektov občianskej vedy môžeme trénovať neurónové siete ďalej klasifikovať galaxie do podrobnejších tried. Tieto označenia občianskej vedy by sme mohli použiť aj na nájdenie galaxií so zaujímavými vlastnosťami. Funkcie, ako sú prstene a šošovky, môže byť stále ťažké nájsť pomocou neurónovej siete.
záver
Techniky neurónových sietí sú v oblasti astronómie čoraz populárnejšie. Spustenie vesmírneho teleskopu Jamesa Webba od NASA v roku 2021 sľubuje novú éru pozorovacej astronómie. Ďalekohľad už zhromaždil terabajty údajov a možno tisíce ďalších sú na ceste počas jeho päťročného trvania misie.
Klasifikácia galaxií je len jednou z mnohých potenciálnych úloh, ktoré je možné zväčšiť pomocou ML. Keďže spracovanie vesmírnych údajov sa stáva vlastným problémom veľkých údajov, výskumníci musia plne využívať pokročilé strojové učenie, aby pochopili celkový obraz.
Nechaj odpoveď