Может ли машинное обучение ответить на вопрос «Откуда мы пришли?»

Чтобы понять, откуда мы пришли, ученые начинают с изучения того, почему галактики рождаются, как они растут и почему умирают.

Мы живем в галактике, и жизненный цикл каждой галактики — это целая история, всегда с этими тремя фазами. Легко *видеть* галактики в каждой фазе, но без лучшего понимания звездообразования и того, как газ превращается в звезды, мы никогда не узнаем, ПОЧЕМУ они стареют и почему умирают.

Уже более 50 лет астрономы вручную измеряют и моделируют звездообразование, но будущее понимание зависит от анализа большего количества данных, полученных с помощью телескопов более крупного поколения. В отсутствие возможности использовать объем данных, необходимых для измерения звездообразования, теоретики вместо этого полагались на модели, которые часто убедительны, но не подтверждены.

Все это вот-вот изменится.

На прошлой неделе я опубликовал для широкой публики кодовую базу машинного обучения, которая принципиально ускоряет способность ученых анализировать данные с телескопов следующего поколения.

Я разработал алгоритм и соответствующий код, будучи научным сотрудником в Висконсинском университете. Кодовая база позволяет применять на практике алгоритм, изложенный в статье, опубликованной в 2015 году. Работа финансировалась за счет гранта Национального научного фонда Снежаны Станимирович, профессора кафедры астрономии Университета Висконсин-Мэдисон.

Gausspy позволяет ученым впервые проверять теории, используя увеличенные данные с больших телескопов, чтобы выяснить, почему звезды формируются, почему они стареют и умирают, и приближаются к пониманию самого фундаментального вопроса о том, почему мы здесь.

Так почему же потребовалось 50 лет, чтобы перейти от ученых, сидящих в лабораториях и вручную анализирующих спектры, к машинному обучению?

Науке нужен был кто-то, кто решил бы эту проблему с точки зрения за пределами области, которая в ней нуждалась.

Радиоастрономия нуждалась в этом, чтобы понять их спектры. Моим опытом было машинное обучение, применяемое к запутанным проблемам, которые требовали решения людьми. Я лично выбрал этот проект не только для науки, но и потому, что я видел огромную проблему, которая у них была, и знал, что я могу внести большую брешь. Проблема, которая десятилетиями мучила радиоастрономов.

Раннее внедрение было впечатляющим и подтверждает, насколько важно это новшество для будущего астрономии.

Хотя кодовая база была выпущена только на прошлой неделе, я закончил Gausspy в 2015 году и начал искать следующую задачу машинного обучения. Когда я покидал свой пост, я встретил своего партнера и основал VEDA Data Solutions.

Мне всегда было очень весело прыгать из области в область, решая давние проблемы с данными, чтобы делать прорывные открытия, а затем переходить к следующей наиболее «изменчивой» области. Так что я получил очень широкие знания. Я привёз с собой лучшие методы и способности для решения проблем, потому что я ухватился за лучшие стили анализа данных из каждой области, которую я видел, и применил их в других областях, которые не учитывали эти способы.

Мой стиль в ВЕДЕ — это просто следующая ступень в этой цепочке, прыгающая не только по полям, но и по секторам, и по вертикали. Я очень рад поделиться Gausspy с научным сообществом и с нетерпением жду возможности решить больше проблем и поделиться новыми открытиями благодаря работе, которую мы делаем в VEDA.