La même technologie qui pilote la reconnaissance faciale et les voitures autonomes pourrait bientôt être un instrument clé pour déverrouiller les secrets cachés de l'univers.
Les développements récents de l'astronomie d'observation ont conduit à une explosion de données.
De puissants télescopes collectent quotidiennement des téraoctets de données. Pour traiter autant de données, les scientifiques doivent trouver de nouvelles façons d'automatiser diverses tâches sur le terrain, telles que la mesure du rayonnement et d'autres phénomènes célestes.
Une tâche particulière que les astronomes souhaitent accélérer est la classification des galaxies. Dans cet article, nous expliquerons pourquoi la classification des galaxies est si importante et comment les chercheurs ont commencé à s'appuyer sur des techniques avancées d'apprentissage automatique pour évoluer à mesure que le volume de données augmente.
Pourquoi avons-nous besoin de classer les galaxies ?
La classification des galaxies, connue dans le domaine sous le nom de morphologie des galaxies, est née au 18ème siècle. Pendant ce temps, Sir William Herschel a observé que diverses «nébuleuses» se présentaient sous diverses formes. Son fils John Herschel a amélioré cette classification en distinguant les nébuleuses galactiques des nébuleuses non galactiques. La dernière de ces deux classifications est ce que nous connaissons et appelons les galaxies.
Vers la fin du 18e siècle, divers astronomes ont émis l'hypothèse que ces objets cosmiques étaient "extra-galactiques" et qu'ils se trouvaient en dehors de notre propre Voie lactée.
Hubble a introduit une nouvelle classification des galaxies en 1925 avec l'introduction de la séquence de Hubble, connue officieusement sous le nom de diagramme du diapason de Hubble.
La séquence de Hubble a divisé les galaxies en galaxies régulières et irrégulières. Les galaxies régulières ont ensuite été divisées en trois grandes classes : les elliptiques, les spirales et les lenticulaires.
L'étude des galaxies nous donne un aperçu de plusieurs mystères clés du fonctionnement de l'univers. Les chercheurs ont utilisé les différentes formes de galaxies pour théoriser sur le processus de formation des étoiles. À l'aide de simulations, les scientifiques ont également tenté de modéliser la façon dont les galaxies elles-mêmes se forment dans les formes que nous observons aujourd'hui.
Classification morphologique automatisée des galaxies
La recherche sur l'utilisation de l'apprentissage automatique pour classer les galaxies a donné des résultats prometteurs. En 2020, des chercheurs de l'Observatoire astronomique national du Japon ont utilisé un technique d'apprentissage en profondeur pour classer les galaxies avec précision.
Les chercheurs ont utilisé un grand ensemble de données d'images obtenues à partir de l'enquête Subaru/Hyper Suprime-Cam (HSC). En utilisant leur technique, ils ont pu classer les galaxies en spirales en S, en spirales en Z et en non-spirales.
Leurs recherches ont démontré les avantages de combiner les mégadonnées des télescopes avec l'apprentissage en profondeur techniques. Grâce aux réseaux de neurones, les astronomes peuvent désormais essayer de classer d'autres types de morphologie tels que les barres, les fusions et les objets à lentilles fortes. Par exemple, recherche connexe de MK Cavanagh et K. Bekki ont utilisé des CNN pour étudier les formations de barres dans les galaxies en fusion.
Notre processus
Les scientifiques du NAOJ se sont appuyés sur la convolution les réseaux de neurones ou CNN pour classer les images. Depuis 2015, les CNN sont devenus une technique extrêmement précise pour classer certains objets. Les applications du monde réel pour les CNN incluent la détection des visages dans les images, les voitures autonomes, la reconnaissance des caractères manuscrits et la médecine analyse d'images.
Mais comment fonctionne un CNN ?
CNN appartient à une classe de techniques d'apprentissage automatique connues sous le nom de classifieur. Les classificateurs peuvent prendre certaines entrées et sortir un point de données. Par exemple, un classificateur de panneaux de signalisation pourra prendre une image et indiquer si l'image est un panneau de signalisation ou non.
Un CNN est un exemple de Réseau neuronal. Ces réseaux de neurones sont composés de neurones organisé en poules pondeuses. Pendant la phase d'entraînement, ces neurones sont réglés pour adapter des poids et des biais spécifiques qui aideront à résoudre le problème de classification requis.
Lorsqu'un réseau neuronal reçoit une image, il prend de petites zones de l'image plutôt que tout dans son ensemble. Chaque neurone individuel interagit avec d'autres neurones au fur et à mesure qu'il prend différentes sections de l'image principale.
La présence de couches convolutives rend CNN différent des autres réseaux de neurones. Ces couches analysent des blocs de pixels qui se chevauchent dans le but d'identifier les caractéristiques de l'image d'entrée. Puisque nous connectons des neurones proches les uns des autres, le réseau aura plus de facilité à comprendre l'image lorsque les données d'entrée traversent chaque couche.
Utilisation dans la morphologie de la galaxie
Lorsqu'ils sont utilisés pour classer les galaxies, les CNN décomposent l'image d'une galaxie en « patchs » plus petits. En utilisant un peu de maths, la première couche cachée essaiera de déterminer si le patch contient une ligne ou une courbe. D'autres couches tenteront de résoudre des questions de plus en plus complexes telles que si le patch contient une caractéristique d'une galaxie spirale, telle que la présence d'un bras.
S'il est relativement facile de déterminer si une section d'une image contient une ligne droite, il devient de plus en plus complexe de se demander si l'image montre une galaxie spirale, et encore moins quel type de galaxie spirale.
Avec les réseaux de neurones, le classificateur commence par des règles et des critères aléatoires. Ces règles deviennent lentement de plus en plus précises et pertinentes pour le problème que nous essayons de résoudre. À la fin de la phase de formation, le réseau de neurones devrait maintenant avoir une bonne idée des caractéristiques à rechercher dans une image.
Étendre l'IA à l'aide de la science citoyenne
La science citoyenne fait référence à la recherche scientifique menée par des scientifiques amateurs ou des membres du public.
Les scientifiques qui étudient l'astronomie collaborent souvent avec des scientifiques citoyens pour aider à faire des découvertes scientifiques plus importantes. La NASA maintient un liste de dizaines de projets de science citoyenne auxquels toute personne disposant d'un téléphone portable ou d'un ordinateur portable peut contribuer.
L'Observatoire astronomique national du Japon a également mis en place un projet de science citoyenne connu sous le nom de Croisière Galaxie. L'initiative forme des volontaires à classer les galaxies et à rechercher des signes de collisions potentielles entre galaxies. Un autre projet citoyen appelé Galaxy Zoo a déjà reçu plus de 50 millions de classifications au cours de la première année seulement de son lancement.
En utilisant les données des projets de science citoyenne, nous pouvons former des réseaux de neurones pour classer davantage les galaxies dans des classes plus détaillées. Nous pourrions également utiliser ces étiquettes de science citoyenne pour trouver des galaxies aux caractéristiques intéressantes. Des caractéristiques telles que des bagues et des lentilles peuvent encore être difficiles à trouver à l'aide d'un réseau de neurones.
Conclusion
Les techniques de réseaux de neurones sont de plus en plus populaires dans le domaine de l'astronomie. Le lancement du télescope spatial James Webb de la NASA en 2021 promet une nouvelle ère d'astronomie d'observation. Le télescope a déjà collecté des téraoctets de données, avec peut-être des milliers d'autres en route au cours de sa durée de vie de cinq ans.
La classification des galaxies n'est qu'une des nombreuses tâches potentielles qui peuvent être étendues avec ML. Le traitement des données spatiales devenant son propre problème de Big Data, les chercheurs doivent utiliser pleinement l'apprentissage automatique avancé pour comprendre la situation dans son ensemble.
Soyez sympa! Laissez un commentaire