Та же технология, которая используется в распознавании лиц и беспилотных автомобилях, вскоре может стать ключевым инструментом для раскрытия скрытых секретов Вселенной.
Недавние разработки в наблюдательной астрономии привели к взрыву данных.
Мощные телескопы ежедневно собирают терабайты данных. Чтобы обработать такой объем данных, ученым необходимо найти новые способы автоматизации различных полевых задач, таких как измерение радиации и других небесных явлений.
Одной из конкретных задач, которую астрономы стремятся ускорить, является классификация галактик. В этой статье мы рассмотрим, почему классификация галактик так важна и как исследователи начали полагаться на передовые методы машинного обучения для расширения масштабов по мере увеличения объема данных.
Зачем нам классифицировать галактики?
Классификация галактик, известная в этой области как морфология галактик, возникла в 18 веке. В то время сэр Уильям Гершель заметил, что различные «туманности» бывают разных форм. Его сын Джон Гершель усовершенствовал эту классификацию, проводя различие между галактическими туманностями и негалактическими туманностями. Последняя из этих двух классификаций — это то, что мы знаем и называем галактиками.
К концу 18 века различные астрономы предполагали, что эти космические объекты были «внегалактическими» и что они находятся за пределами нашего Млечного Пути.
Хаббл представил новую классификацию галактик в 1925 году, представив последовательность Хаббла, неофициально известную как камертонная диаграмма Хаббла.
Последовательность Хаббла разделила галактики на правильные и неправильные галактики. В дальнейшем правильные галактики были разделены на три больших класса: эллиптические, спиральные и линзообразные.
Изучение галактик дает нам представление о нескольких ключевых тайнах того, как устроена Вселенная. Исследователи использовали различные формы галактик, чтобы теоретизировать о процессе звездообразования. Используя моделирование, ученые также пытались смоделировать, как сами галактики принимают формы, которые мы наблюдаем сегодня.
Автоматизированная морфологическая классификация галактик
Исследования по использованию машинного обучения для классификации галактик показали многообещающие результаты. В 2020 году исследователи из Национальной астрономической обсерватории Японии использовали техника глубокого обучения правильно классифицировать галактики.
Исследователи использовали большой набор изображений, полученных в ходе исследования Subaru/Hyper Suprime-Cam (HSC). Используя свою технику, они смогли классифицировать галактики на S-образные спирали, Z-спирали и неспиральные.
Их исследование продемонстрировало преимущества объединения больших данных с телескопов с глубокое обучение методы. Благодаря нейронным сетям астрономы теперь могут попытаться классифицировать другие типы морфологии, такие как полосы, слияния и сильно линзированные объекты. Например, связанные исследования из MK Cavanagh и K. Bekki использовали CNN для исследования перемычек в сливающихся галактиках.
Как это работает
Ученые из NAOJ полагались на сверточные нейронные сети или CNN для классификации изображений. С 2015 года CNN стали чрезвычайно точным методом классификации определенных объектов. Реальные приложения для CNN включают распознавание лиц на изображениях, беспилотные автомобили, распознавание рукописных символов и медицинские услуги. анализ изображений.
Но как работает CNN?
CNN принадлежит к классу методов машинного обучения, известных как классификатор. Классификаторы могут принимать определенные входные данные и выводить точку данных. Например, классификатор дорожных знаков сможет принять изображение и вывести, является ли изображение дорожным знаком или нет.
CNN является примером нейронной сети. Эти нейронные сети состоят из нейроны организованы в слоев. На этапе обучения эти нейроны настраиваются на адаптацию определенных весов и смещений, которые помогут решить требуемую проблему классификации.
Когда нейронная сеть получает изображение, она берет небольшие области изображения, а не все целиком. Каждый отдельный нейрон взаимодействует с другими нейронами, поскольку он берет различные участки основного изображения.
Наличие сверточных слоев отличает CNN от других нейронных сетей. Эти слои сканируют перекрывающиеся блоки пикселей с целью определения особенностей входного изображения. Поскольку мы соединяем нейроны, расположенные близко друг к другу, сети будет легче понять картину, когда входные данные проходят через каждый слой.
Использование в морфологии галактики
При использовании в классификации галактик CNN разбивают изображение галактики на более мелкие «участки». Используя немного математики, первый скрытый слой попытается решить, содержит ли патч линию или кривую. Дальнейшие уровни будут пытаться решить все более сложные вопросы, например, содержит ли участок особенность спиральной галактики, например наличие рукава.
В то время как относительно легко определить, содержит ли часть изображения прямую линию, становится все сложнее спросить, показывает ли изображение спиральную галактику, не говоря уже о том, какой тип спиральной галактики.
В нейронных сетях классификатор начинается со случайных правил и критериев. Эти правила постепенно становятся все более и более точными и актуальными для проблемы, которую мы пытаемся решить. К концу этапа обучения у нейронной сети должно быть хорошее представление о том, какие функции искать на изображении.
Расширение возможностей ИИ с помощью Citizen Science
Гражданская наука относится к научным исследованиям, проводимым учеными-любителями или представителями общественности.
Ученые, изучающие астрономию, часто сотрудничают с гражданскими учеными, чтобы помочь сделать более важные научные открытия. НАСА поддерживает список из десятков гражданских научных проектов, в которых может принять участие любой, у кого есть мобильный телефон или ноутбук.
Национальная астрономическая обсерватория Японии также запустила проект гражданской науки, известный как Галактика Круиз. Инициатива обучает добровольцев классифицировать галактики и искать признаки потенциальных столкновений между галактиками. Другой гражданский проект под названием Зоопарк Галактики уже получил более 50 миллионов классификаций всего за первый год запуска.
Используя данные гражданских научных проектов, мы можем обучать нейронные сети для дальнейшей классификации галактик на более подробные классы. Мы также могли бы использовать эти метки гражданской науки, чтобы найти галактики с интересными особенностями. Такие элементы, как кольца и линзы, по-прежнему трудно найти с помощью нейронной сети.
Заключение
Методы нейронных сетей становятся все более популярными в области астрономии. Запуск космического телескопа имени Джеймса Уэбба НАСА в 2021 году обещает новую эру наблюдательной астрономии. Телескоп уже собрал терабайты данных, и, возможно, еще тысячи будут в пути за пять лет его миссии.
Классификация галактик — лишь одна из многих потенциальных задач, которые можно масштабировать с помощью машинного обучения. Поскольку обработка космических данных становится отдельной проблемой больших данных, исследователи должны полностью использовать передовое машинное обучение, чтобы понять общую картину.
Оставьте комментарий