Как координировать 11 телескопов, чтобы наблюдать черную дыру?

Члены команды: Шу Сюй, Имин Сюй, Цзыи (Куина) Чжоу

Эта статья служит, прежде всего, для того, чтобы поделиться выводами и вкладом авторов в ходе их проекта заключительного курса в Институте прикладных вычислительных наук (IACS) Гарвардского университета при Школе инженерии и прикладных наук Джона А. Полсона. Их советники - Сесилия Гарраффо и Павлос Протопапас. Во время этого проекта, который длился весь семестр, мы стали партнерами коллаборации Event Horizon Telescope (EHT), чтобы оказать влияние на открытие человеком Вселенной.

Вы, наверное, видели это знаменитое изображение раньше - первое изображение черной дыры в истории человечества. 10 апреля 2019 года EHT опубликовал это фото, и они получили премию за прорыв в области фундаментальной физики 2020 года.

Шепард Доулман - один из директоров-основателей EHT. После того, как была сделана фотография черной дыры, он подошел к Павлосу Протопапасу, ведущему инструктору проекта Capstone, с просьбой о помощи.

Он сказал, что для достижения высокого разрешения изображения черной дыры они использовали технику интерферометрии с очень длинной базой, в которой радиотарелки по всему миру синхронизируются, чтобы сформировать виртуальный телескоп с самым высоким угловым разрешением, которое в настоящее время возможно с поверхности. земли. Насколько велико это разрешение? Это эквивалентно возможности читать газету в Лос-Анджелесе, сидя в Бостоне, или, что то же самое, видеть атом на расстоянии вытянутой руки. Чтобы работать таким образом, EHT требует достаточно хорошей погоды одновременно на большей части массива. В настоящее время в массиве одиннадцать радиотарелок. Условия для наблюдений могут быть отличными в некоторых местах, но если из-за плохой погоды в других местах не хватает телескопов, которые могут участвовать в наблюдениях, наблюдения не могут продолжаться, поскольку они не дадут высококачественных данных.

Однако управлять этими гигантскими телескопами очень дорого, и ученые постоянно соревнуются за время наблюдений, поэтому EHT предоставляется только с 10-дневным окном в каждый год, когда телескопы доступны для совместного использования. Каждый год 10-дневное окно будет другим. Мало того, из этого 10-дневного окна они могут запускать только 5–6 ночей из-за некоторых других ограничений. В настоящее время один человек в их команде, то есть Шеп, вручную решает, запускать ли ночь. Он принимает решение, звоня своим друзьям, работающим у каждого телескопа, и спрашивает: «Что вы думаете о погоде?»

Как вы, наверное, заметили, текущий процесс принятия решений не так эффективен и глубок, как должен быть. Поэтому Шеп хотел, чтобы мы создали несколько алгоритмов реального времени, которые могут облегчить его процесс принятия решений. Наша цель - максимально увеличить количество качественных фотографий черной дыры. Учитывая погодные данные и информацию о дате, алгоритм должен делать предложения на ходу, а именно, запускать ли в этот день и оптимальную стратегию для будущих оставшихся дней. В целом, мы могли выбрать только пять дней из 10 последовательных дней с ограничением в 5 дней срабатывания.

Если возможно, EHT также хотел, чтобы наши модели выводили уровень достоверности и вторую оптимальную стратегию.

Вот демонстрация того, что это за проблема. Ось x представляет даты в 10-дневном окне, а ось y представляет количество дней, которые были активированы на данный момент. Каждый день, если мы решаем сработать на следующий день, мы движемся вверх по диагонали, а если мы предлагаем пропустить следующий день, мы движемся по горизонтали. В конце концов, мы должны достичь одной из точек в верхней строке. Зеленая линия здесь показывает возможный путь, предполагающий запуск 6, 8, 10, 13 и 14 октября.

Мотивации

У нас двоякая мотивация. В настоящее время EHT принимают свои решения людьми. Если наша модель окажется успешной, они обязательно воспользуются ею для облегчения принятия решения. Это огромная мотивация для нас, поскольку мы знаем, что мы также вносим свой вклад в открытие человеком Вселенной, увеличивая шанс захвата черной дыры.

Данные

Мы собрали наши данные из GFS, модели прогноза погоды, разработанной национальными центрами экологической информации. Это общедоступно. Он обеспечивает послойный прогноз атмосферы по всему миру. Вы можете представить его данные в трехмерной форме. Каждые 6 часов GFS производит набор прогнозов, и мы извлекаем важные для нас данные: погодные условия в месте расположения каждого телескопа. Мы делаем это, указывая долготу, широту и высоту телескопов.

После получения некоторых данных мы начали процесс исследовательского анализа данных и нарисовали этот график. Здесь пять графиков, потому что GFS делает прогнозы для пяти переменных одновременно. На каждом графике вы видите одну черную линию и семь серых линий. Это соответствует каждому набору данных прогноза погоды, прогнозируемых каждые 6 часов. Черная линия представляет собой самые последние данные прогноза, а серые линии - прогнозы, сделанные за последние 48 часов. Каждый прогноз охватывает 16 дней в будущем. Мы видим, что первый пятидневный прогноз довольно точен, но после этого он становится очень неопределенным. Эксперты сказали нам, что первая переменная, Тау-225, является наиболее важной для определения чистоты атмосферы, так как это скорость поглощения непосредственно над головой. Тау-225 меньшего размера предпочтительнее, чем больший.

Это все данные, которые у нас есть. Перед встречей с партнерами и просмотром данных мы рассмотрели возможность использования обучения с подкреплением для решения этой проблемы. Однако после того, как мы встретились с партнером и увидели данные, мы поняли, что это проблема оптимизации, и мы должны были проявить творческий подход при разработке моделей, хорошо подходящих для нее. Когда мы не можем найти какую-либо литературу или предыдущие работы, которые делали бы подобное, мы разработали эту базовую модель, и она служит костяком для всех других моделей, которые мы создали позже.

Базовая модель

Мы позаимствовали идею функций вознаграждения из обучения с подкреплением. Каждый телескоп получит вознаграждение в зависимости от погодных условий. Функция вознаграждения для каждого телескопа называется малым f. Каждому дню присваивается значение вознаграждения, для которого функция вознаграждения называется большой F. В базовой модели мы строим функцию вознаграждения, используя прогнозы Тау-225. Малая f определяется как отрицательное ожидание Тау-225 в окне наблюдения телескопа. (Причина отрицательного знака заключается в том, что интуитивно мы хотим, чтобы значение вознаграждения было как можно большим, но Тау-225 всегда положителен и лучше, когда оно близко к нулю.) Большое F определяется как некоторое средневзвешенное значение. малых f. Мы использовали размеры телескопов как часть веса, потому что большие телескопы более важны в группе. Мы также включили в формулу матрицу расстояний, так как мы хотим, чтобы телескопы были разбросаны по поверхности земли.

После того, как мы рассчитаем значения вознаграждения за каждый день, мы хотим решить проблему оптимизации. Например, в день 0 мы вычисляем значения вознаграждения от дня 1 до дня 10. Поскольку у нас есть 5 дней для активации, и мы не использовали ни одного из них, мы находим пять самых больших вознаграждений и смотрим, является ли день 1 одним из в эти дни. Здесь розовые прямоугольники представляют пять наибольших значений. В день 1 у нас есть значения вознаграждения со 2 по 10 день. Обратите внимание, что эти значения обновляются, потому что был составлен новый прогноз погоды. Поскольку мы сработали день 1, у нас осталось четыре дня до срабатывания. Мы находим четыре дня с наибольшим вознаграждением. Мы видим, что день 2 находится в одной из них, поэтому мы предлагаем активировать день 2. Во второй день мы хотим найти 3 лучших награды за оставшиеся дни. Мы видим, что третьего дня у них нет. Затем, в день 3, мы продолжаем поиск трех лучших наград и смотрим, входит ли в них день 4.

Это основы базовой модели. Теперь мы переходим к более продвинутым моделям, которые учитывают неопределенность. Неопределенность означает, что мы можем доверять данным прогнозов GFS лишь в определенной степени. Наш партнер много раз подчеркивал, что он предпочел бы инициировать наблюдение раньше, чем позже, чтобы минимизировать риск.

Метод 1. Единый коэффициент скидки

Первый тип неопределенности, который мы рассмотрели, зависит только от того, как далеко в будущем GFS прогнозирует, а именно от временной задержки. Чтобы учесть это, мы можем умножить вознаграждение за каждый день на коэффициент дисконтирования, чтобы получить приведенную стоимость. А затем выполните тот же метод оптимизации, который мы использовали в базовой модели. Единый коэффициент дисконтирования считается гиперпараметром, который необходимо настраивать с помощью перекрестной проверки.

Метод 2: прогнозирование штрафа

Мы считаем, что одного коэффициента дисконтирования недостаточно для объяснения неопределенности в будущем, поэтому мы ввели различные количественные оценки неопределенности для построения второго метода. В этом методе мы ищем закономерность в точности модели GFS на основе временного лага. Поэтому мы использовали исторические данные, чтобы вычислить среднюю ошибку, которую может иметь прогноз, исходя из того, на сколько дней в будущем он будет. Мы наносим результаты слева, на которых ось x - это количество дней в будущем, а ось y - измерение ошибки. Мы видим, что модель GFS становится менее точной, когда она превышает шестидневную отметку. Как и в случае с коэффициентом дисконтирования в предыдущей модели, мы используем мультипликативный штрафной член для значения вознаграждения. (Мы могли бы сделать это с помощью либо малого значения f, либо большого значения F). Срок штрафа зависит от временной задержки и гиперпараметра, называемого «уровень штрафа».

Метод 3. Сложность прогнозирования определенного времени

Предыдущие две модели предполагают, что неопределенность возникает из-за запаздывания по времени. Эта и последующие модели предполагают, что неопределенность связана с конкретной датой, на которую составляется прогноз. Помните, что GFS каждые 6 часов делает прогнозы на следующие 16 дней? Таким образом, для каждой временной точки существует несколько прогнозов прогнозов. Желтая область на графике ограничена данными минимального и максимального прогноза Тау-225.

Для этого метода мы хотим найти последний прогноз, сделанный для определенного момента времени, и вычислить среднеквадратичную ошибку (RMSE) других прогнозов по отношению к этому последнему прогнозу. Затем мы используем ту же формулу, что и раньше, чтобы получить значение вознаграждения, но на этот раз и вознаграждение, и штраф привязаны к временным точкам.

Метод 4. Выборка из нормального распределения

Наконец, мы по-прежнему предполагаем, что неопределенность различается для каждого момента времени, но мы хотим получить уровень достоверности, связанный с оптимальным путем, который мы предлагаем. Мы предполагаем, что истинная погода будет происходить из нормального распределения. Следуя указаниям методов Монте-Карло, мы произвольно выбирали значения вознаграждения из распределения для каждого момента времени достаточное количество раз и каждый раз находили оптимальный путь. В конце мы суммируем частоты путей и заключаем, что лучший путь - это тот, у которого самая высокая частота. Мы также используем его частоту, чтобы указать наш уровень уверенности в предлагаемом пути. Мы считаем, что наш партнер сможет лучше принимать информативные решения, если увидит это число.

Оценка модели

Мы проверили наши модели на исторических данных, сравнив предложенный путь, заданный разными моделями, с реальным путем. Это пример. Мы выполнили моделирование на основе данных прогноза, полученных с 9 по 18 ноября, поэтому каждая модель подсказывала нам предполагаемый путь. Мы также знали, какова основа истинного пути, поэтому сравнили среднее вознаграждение каждой модели с оценкой лучшего пути. В этом примере только базовый метод и выборка из метода распределения не смогли создать лучший путь. Отсутствие штрафов в последующие дни привело к предсказанию на день позже.

Мы собрали данные GFS с 25 октября по 30 ноября и запускали моделирование в каждом последующем 10-дневном окне. Всего имеется 26 10-дневных окон. Можно думать обо всех данных, которые мы получили в 10-дневном окне, как о x, а о средней награде, когда мы оглядываемся назад, как о прогнозируемом y. Естественно, мы можем сравнить наш прогнозируемый y с наилучшим путем и вычислить среднеквадратичную ошибку. Мы также вычисляем оценку, которая определяется в формуле, показанной ниже. Это относительная оценка. Если наш прогнозируемый путь равен наилучшему пути, тогда он будет равен 1. Если наш прогнозируемый путь равен случайному пути, оценка будет равна 0.

С помощью этих двух показателей мы можем определить лучший уровень штрафов для каждого метода, а также лучшую модель. Здесь метод 3 является наиболее эффективной моделью, что вполне ожидаемо, поскольку он учитывает неопределенность дисперсии прогноза погоды для каждого дня. Метод 2 является вторым по эффективности, потому что он учитывает только неопределенность прогноза погоды с точки зрения того, как далеко он находится в будущем. Метод выборки здесь хорош только как базовый уровень, потому что он не предусматривает каких-либо штрафов. Тем не менее, он по-прежнему полезен, потому что это единственная модель, которая выводит уровень достоверности выбранного пути.

Программное обеспечение

Мы создали программный пакет для EHT, который будет использоваться в будущем. Программное обеспечение включает в себя процедуры обработки данных, запуска моделей оптимизации и внесения предложений с предоставленным измерением неопределенности.

Вот демонстрация того, как использовать программное обеспечение:

Заключение

Было непросто добраться до той стадии, на которой мы сейчас находимся с этим проектом. Изначально, когда нам дали задание, мы подумали о модных моделях машинного обучения для решения проблемы. Однако после просмотра данных и встречи с партнером мы поняли, что для решения этой проблемы подходит гораздо более простая модель. Был период, когда данные, полученные из GFS, содержали неожиданные нули, и нам потребовалось некоторое время, чтобы решить эту проблему с помощью наших партнеров. Создание программного обеспечения потребовало от нас создания графического пользовательского интерфейса (GUI) и соединения GUI со всеми входами и выходами модели. Раньше у нас не было опыта в проведении такого рода моделирования, но мы смогли многому научиться и в конце концов преодолеть каждую концепцию. Мы очень гордимся этим проектом и надеемся, что он будет полезен другим.