Введение

Это серия из трех частей, подготовленная ЮНИСЕФ и Решение во благо, посвященная влиянию местных ограничений во время кризиса COVID-19 на уровень загрязнения воздуха и здоровье детей. Цель этой серии — дать ответы на такие вопросы, как, например, почему маленькие дети особенно уязвимы к воздействию загрязнения воздуха (Rees 2017). Широко ли доступны данные о качестве воздуха в глобальном масштабе, если да, то в каком масштабе и насколько целесообразно использовать этот слой данных для мониторинга загрязнения? В отсутствие детальных данных о качестве воздуха на глобальном уровне, как мы можем использовать общедоступные источники спутниковых данных для построения глобальной модели для оценки загрязняющих веществ (с использованием машинного обучения)? Способствовала ли блокировка COVID19 значительному снижению уровня загрязнения воздуха? Борнеман, 2020 г., наблюдал значительные изменения в уровнях NO2 в Китае (рис. 1) — а как насчет изменений основного загрязняющего вещества PM2,5 в глобальном масштабе? Стремясь дать операциональный ответ на эти вопросы, мы начинаем наше исследование.

Цель

ЮНИСЕФ и Solve for Good объединились для анализа различных аспектов изменений в загрязнении воздуха, особенно связанных с COVID-19, и с долгосрочной целью создать платформу для мониторинга загрязнения воздуха с упором на деятельность ЮНИСЕФ.

  • Модель для измерения воздействия на детей загрязнителя воздуха PM2,5, превышающего стандарт ВОЗ в текущем сценарии COVID.
  • Понимание уровня качества воздуха во всем мире с целью получения детальной оценки на основе комбинации измерения наземного значения с помощью общедоступных измерений наземного датчика и дистанционного зондирования.
  • Позвольте гражданским ученым глубже погрузиться в измерение качества воздуха во всем мире.

В частности, мы стремимся (а) смоделировать влияние блокировок COVID-19 на качество воздуха и (б) проверить, привело ли это к улучшению здоровья детей. Следуя по стопам существующих работ, таких как Borneman 2020, Mahato et al, 2020, мы предполагаем найти доказательства положительного влияния на качество воздуха в результате крупномасштабного перехода на автомобили с низким уровнем выбросов после блокировки и разработать исследовательскую платформу визуализации для местных программные менеджеры. Платформа будет предоставлять функции для управления, анализа и визуализации изменений данных о загрязнении воздуха в разных местах, предпочтительно в странах и городах, где ЮНИСЕФ работает с интересами мониторинга загрязнения воздуха для здоровья детей.

Почему нас это должно волновать?

Во всем мире 93% детей живут в условиях, когда уровни загрязнения воздуха превышают нормы ВОЗ. Существует прочная связь между здоровьем человека и воздействием высоких уровней загрязнения воздуха. Длительное воздействие мелкодисперсных твердых частиц диаметром менее 2,5 мкм (PM2,5), по оценкам, ежегодно вызывает около 8 миллионов дополнительных смертей, в то время как двуокись азота (NO2) ежегодно приводит к 4 миллионам новых случаев детской астмы» (Venter et al. al2020)». Воздействие загрязнения воздуха острее ощущается молодежью, при этом каждая четвертая смерть детей в возрасте до 5 лет прямо или косвенно связана с экологическими рисками (ВОЗ 2018).

Однако распределение детского населения плохо соответствует глобальному распределению датчиков качества воздуха. Иллюстрацией этих распределений являются панель (а) и рисунок 2, показывающий расположение датчиков качества воздуха, и панель (б) с глобальной концентрацией детского населения. Поэтому использование только местонахождения наземных датчиков качества воздуха для вывода о воздействии высоких уровней загрязнения воздуха на детское население во всем мире затруднительно, особенно в густонаселенных районах, таких как Западная Африка и Великая рифтовая долина.

Кроме того, во время блокировки COVID-19 потребление ископаемого топлива снизилось из-за более низкого уровня мобильности в целом, а также из-за перехода на виды транспорта с низким уровнем выбросов (такие как ходьба пешком и езда на велосипеде). Это предотвращает неточность предыдущих моделей, которые измеряют глобальное распределение загрязнения воздуха, поскольку они не могут отразить текущие изменения уровней загрязнения воздуха из-за событий блокировки COVID19 (Health Effects Institute 2019).

Следовательно, снижение концентрации вредных выбросов в результате этого может значительно улучшить здоровье сердечно-сосудистой системы детей, которые более уязвимы к воздействию загрязнения воздуха (ЮНИСЕФ, 2017 г.). В ЮНИСЕФ и Solve for Good мы хотели задать вопрос о здоровье детей глобальным данным о выбросах в атмосферу, которые ЮНИСЕФ собрал во время блокировки, чтобы определить, есть ли значительное улучшение здоровья детей с массовым переходом на низкоуглеродные источники энергии для промышленности и транспортных средств.

Наш подход

Мы используем трехэтапный подход для нашего анализа.

  1. Мы разрабатываем крупномасштабную модель, предназначенную для прогнозирования качества воздуха в географических регионах с использованием широко доступных источников данных,
  2. Разработать платформу геопространственной визуализации, чтобы помочь в изучении результатов,
  3. Точная настройка результатов крупномасштабной модели с использованием разнородных источников данных для конкретных местоположений для более точных прогнозов на местном уровне и сопоставление результатов с показателями здоровья детей.

В этой серии статей мы сосредоточимся на первых двух шагах. В первой статье мы обсуждаем важность мониторинга качества воздуха, доступные источники данных, настройку данных и некоторые исследовательские результаты в текущем контексте. Во второй статье мы обсудим детали и результаты, относящиеся к модели глобального уровня. Третья статья будет направлена ​​на визуализацию и обсуждение результатов, а также на указания относительно будущей работы над локальными моделями и включения данных о здоровье детей.

Источники данных

Мы собираем уровни загрязнения воздуха, используя 1600 станций контроля качества воздуха, измеряющих приземные концентрации PM2,5 с января 2019 года по сентябрь 2020 года в качестве нашей целевой переменной. Для прогнозирования концентраций PM2,5 мы извлекаем усредненные за неделю значения временных рядов для AOD, NO2, данных о землепользовании и осадках из Google Earth Engine. Чтобы извлечь данные из Google Earth Engine, мы импортируем данные с 1 января 2019 года по 11 сентября 2020 года со следующих спутников:

Обработка данных

Спутники собирают данные с разной временной и пространственной степенью детализации (таблица 1). Для стандартизации спутниковых данных мы агрегируем спутниковые данные по средненедельным значениям (рис. 4). Чтобы создать эту статистику, мы создали драйвер vrt (драйвер формата для GDAL, который позволяет составлять виртуальный набор данных GDAL из других наборов данных GDAL), который помог нам быстрее обрабатывать данные.

Используя файл vrt, мы извлекли усредненные данные за неделю для каждого из городов, используя их геометрические формы. Для этой цели мы используем файлы GADM Shape, чтобы маскировать изображения и получать еженедельные средние переменные спутников для форм городов. Мы извлекли еженедельные усредненные данные на двух разных географических уровнях, на местном уровне и общегородском уровне. На локальном уровне мы извлекаем усредненные за неделю значения спутниковых данных, используя локальную маску, определяемую как 75-метровый буфер вокруг местоположения наземного датчика. Мы извлекаем усредненные еженедельные значения спутниковых данных по всему городу, используя соответствующие маски городов из полигонов городов GADM (GADM 2020). Помимо включения спутниковых данных в качестве функций в модель машинного обучения, мы включаем ряд вторичных источников данных, таких как «индекс строгости» COVID-19, в различных пространственных и временных разрешениях. Подробную информацию об источниках данных см. в Таблице 1.

Кроме того, мы предварительно обработали данные станции PM2,5, чтобы убедиться, что у нас есть надежный набор обучающих данных. Для этого мы удалили значения PM2,5 выше и равные 3000, а также значения ниже 0. Мы передискретизировали значения PM2,5 еженедельно (день начала понедельника) и среднее значение. Используя 75-метровый буфер и общегородские полигоны, мы усреднили недельное значение PM2,5 для радиуса 75 м вокруг точки расположения датчика и усреднили недельное значение PM2,5 для экстента города, если точка находится в пределах города в ГАДМ. Наш последний шаг предварительной обработки заключался в агрегировании широты и долготы местоположения датчика до четырех знаков после запятой и объединении идентификаторов города и страны с данными точки датчика.

Исследовательский анализ

Мы завершаем эту статью некоторыми предварительными сравнениями показаний OpenAQ PM2.5, чтобы контекстуализировать нашу работу. Как мы видим на двух панелях рисунка 5, показатели качества воздуха до и после блокировки в Лиме, ​​Перу, повторяют известные закономерности, демонстрируя улучшение качества воздуха после блокировки. Обратите внимание, что существует неоднородность с точки зрения мест считывания PM2,5 - наборы станций мониторинга качества воздуха, по которым у нас есть данные за эти две даты, не идентичны. Сравнивая наблюдения из двух разных источников (OpenAQ и Drone) на рисунке 6, мы видим высокую степень совпадения с расхождением на хвосте. Это несоответствие и упомянутая выше неоднородность данных являются некоторыми из проблем, которые мы попытаемся решить с помощью нашей модели машинного обучения.

В этой статье мы представили проблему разработки модели машинного обучения глобального уровня для точного прогнозирования качества воздуха — особенно после введенных ограничений COVID19 — с несколькими операционными целями. В следующей статье мы включим двухуровневые спутниковые данные и функции, извлеченные из вторичных источников данных в таблице 1, в XGBoost для глобального моделирования PM2.5. Эти вторичные источники данных включают дополнительные характеристики, такие как плотность населения и данные о карантине Covid-19 2020 года, которые, как известно, значительно влияют на концентрацию PM2,5 на уровне земли (Hale et al. 2020).

Ссылки

Борнеман, Э. Восстанавливающийся уровень загрязнения знаменует конец блокировок коронавируса. 2020.
Рис, Н. Опасность в воздухе: как загрязнение воздуха может влиять на развитие мозга детей раннего возраста во всем мире, Рабочий документ по данным, исследованиям и политике ,ноябрь 2017 г. (по состоянию на 22 ноября 2020 г.).
Данные GADM. версия 3.6, 2020.< br /> Хейл, Т .; Ангрист, Н .; Боби, Т. и др. Различия в реакции правительства на COVID-19. Рабочий документ BSG-WP-2020/032, версия 10, 2020.
Институт воздействия на здоровье. State of Global Air 2019, 2019.
Кумар, Н.; Чу, А .; и Фостер, Ф. Эмпирическая взаимосвязь между PM2,5 и оптической плотностью аэрозоля в столичном Дели, Atmos Environ 2011, 41(21): 4492–4503.< br /> Махато, С.; Пал, С .; Гош, К. Г. Влияние карантина в условиях пандемии COVID-19 на качество воздуха в мегаполисе Дели, Индия. Science of The Total Environment 2020, 730:139086.
Рис, Н. Опасность в воздухе: как загрязнение воздуха может повлиять на развитие мозга у маленьких детей , Отдел данных, исследований и политики ЮНИСЕФ, декабрь 2017 г..
Всемирная организация здравоохранения. Загрязнение воздуха и здоровье детей: предписываем чистый воздух, номер ВОЗ: WHO/CED/PHE/18.01, 2018.
Вентер З. С.; Аунан, К.; Чоудхури С. и Лелиевельд Дж. Блокировки COVID-19 вызывают глобальное снижение загрязнения воздуха. Proc Natl Acad Sci USA 2020, 117(32):18984–18990.