Загрязнение воздуха является постоянной проблемой уже довольно давно и становится все более серьезной из-за роста промышленной деятельности и увеличения количества транспортных средств на дорогах. Это подчеркивает острую необходимость немедленно предпринять активные шаги для смягчения его вредных последствий. Обширные исследования неизменно подчеркивают, что эта проблема будет продолжать влиять на нашу окружающую среду и здоровье без раннего вмешательства.

Развитие передовых технологий, включая недорогие датчики, интеллектуальные устройства с подключением к Интернету и компьютерные программы, подобные человеческому, обрабатывающие большие данные, способствовало нашему пониманию опасной природы загрязнения воздуха. Эти открытия выявили прямую взаимосвязь между загрязнением воздуха и различными заболеваниями, подчеркивая настоятельную необходимость немедленных действий.

Загрязнение воздуха происходит главным образом в результате сложной смеси загрязняющих веществ, выбрасываемых из различных источников. Эти загрязнители включают в себя ряд веществ, таких как твердые частицы (PM), диоксид азота (NO2), диоксид серы (SO2), оксид углерода (CO) и летучие органические соединения (ЛОС) и другие. Эти вещества могут серьезно повлиять на здоровье человека, увеличивая распространенность респираторных заболеваний, таких как астма и хроническая обструктивная болезнь легких (ХОБЛ), сердечно-сосудистых заболеваний и даже рака легких. По данным Всемирной организации здравоохранения (ВОЗ), деликатные твердые частицы (PM2,5) и другие загрязнители ежегодно становятся причиной около 7 миллионов преждевременных смертей во всем мире. Признание сложной связи между загрязнителями и проблемами здоровья является обязательным, что приводит к срочности комплексных усилий по смягчению последствий загрязнения воздуха для здоровья.

Что такое индекс качества воздуха и как он рассчитывается?

Индекс качества воздуха (AQI) представляет собой стандартизированную числовую шкалу, используемую для информирования населения об уровне загрязнения воздуха и его потенциальных последствиях для здоровья. Он обеспечивает простой и понятный способ измерения качества воздуха в определенной области. AQI рассчитывается на основе концентраций основных загрязнителей воздуха, включая твердые частицы (PM2,5 и PM10), приземный озон (O3), диоксид азота (NO2), диоксид серы (SO2) и оксид углерода (CO). . Концентрация каждого загрязняющего вещества преобразуется в субиндекс, а самый высокий субиндекс среди этих загрязняющих веществ становится значением AQI. Затем AQI классифицируется по диапазонам от хорошего до тяжелого, что указывает на проблемы со здоровьем, связанные с качеством воздуха. Эта информация имеет решающее значение для отдельных лиц и органов власти для принятия обоснованных решений по защите здоровья населения. Доступно подробное руководство по Kaggle с соответствующим кодом для расчета Индекса качества воздуха (AQI) по Vopani.

Что такое традиционные станции мониторинга качества воздуха?

Традиционная оценка качества воздуха в значительной степени опирается на сложные инструменты, такие как мониторы бета-затухания (BAM) и осциллирующие микровесы с коническим элементом (TEOM), которые широко используются регулирующими органами, такими как Центральный совет по контролю за загрязнением (CPCB) и правительственными учреждениями в Индии.

Во многих странах мира созданы различные станции мониторинга качества воздуха в разных городах. Эти станции используют прецизионные приборы обнаружения, основанные на вышеизложенных принципах, для определения концентраций загрязняющих веществ. Впоследствии они рассчитывают индекс качества воздуха (AQI) и распространяют эту информацию среди общественности. Стратегическое размещение этих станций мониторинга учитывает такие факторы, как распределение населения, размер застроенной территории, репрезентативность, непрерывность, безопасность и эксплуатационная осуществимость. Следовательно, зона действия станции мониторинга составляет примерно 1–3 км. Однако качество воздуха в городе демонстрирует значительные региональные различия и нелинейные изменения, что делает непрактичным адекватное определение этой сложности с помощью ограниченного числа станций мониторинга. Еще одним недостатком этого подхода является ограниченный срок службы датчиков, что требует регулярного обслуживания. Достижение плотного развертывания для покрытия каждого уголка города является непомерно дорогостоящим. Следовательно, люди, живущие или работающие вдали от станций мониторинга, не могут получить доступ к точной информации о качестве воздуха в режиме реального времени.

Зачем нужны методы оценки индекса качества воздуха (AQI) на основе изображений?

Следовательно, зона действия станции мониторинга качества воздуха обычно распространяется на радиус около 1–3 км. Однако качество воздуха в городах демонстрирует существенные региональные различия и нелинейные изменения, что делает непрактичным всесторонний учет этой сложности с помощью ограниченных станций мониторинга. Дополнительным недостатком традиционного подхода к мониторингу на основе датчиков является ограниченный срок службы датчиков, что требует частого технического обслуживания. Стоимость достижения широкого развертывания, охватывающего каждый уголок города, оказывается непомерной. Это приводит к тому, что люди, живущие или работающие вдали от станций мониторинга, не имеют доступа к точной информации о качестве воздуха в режиме реального времени.

Это подчеркивает необходимость подхода к оценке индекса качества воздуха (AQI) на основе изображений, обусловленного быстрым развитием технологий смартфонов, систем видеонаблюдения и повсеместным использованием искусственного интеллекта (ИИ). Улучшение качества изображения и простота захвата изображений с помощью мобильных устройств позволяют людям легко документировать свое окружение. В сочетании с такими методами искусственного интеллекта, как обработка изображений и машинное обучение, этот прогресс позволяет определять качество воздуха на основе изображений. Это дает общественности возможность анализировать качество воздуха, применяя установленные модели распознавания, способствуя информированному реагированию на загрязнение воздуха.

Кроме того, появление методологий глубокого обучения повысило актуальность оценки качества воздуха на основе изображений. Этот новый метод не только уменьшает зависимость от специализированного оборудования, но и повышает степень детализации мониторинга качества воздуха. Сложная связь между атрибутами изображения и индексами качества воздуха систематически исследуется с использованием функций изображения и передовых моделей глубокого обучения. В результате этот подход устраняет ограничения традиционных методов, обеспечивая комплексные и доступные средства измерения качества воздуха.

Оценка AQI на основе Интернета вещей с использованием методов обработки изображений и обучения

Недавнее исследование представило инновационный подход на основе Интернета вещей для оценки уровней индекса качества воздуха (AQI) в реальном времени, разделенных на пять групп. Этот метод использует для оценки изображения дорожного движения и параметры погоды. Примечательно, что эта работа представляет собой новаторскую попытку: она первой достигла таких результатов на дорогах Индии. Это новаторское исследование было представлено в качестве доклада на конференции 8-го Всемирного форума IEEE по Интернету вещей (WF-IoT) 2022 года в Иокогаме, Япония. Авторами данной работы являются Нитин Нилеш, Ишан Патвардхан, Джаяти Наранг и Сачин Чаудхари.

Для поддержки этой методологии на индийских дорогах собирается новый набор данных о дорожном движении, включающий 5048 изображений, соответствующие данные о погоде и совмещенные наземные значения PM. Этот набор данных охватывает разные времена года в индийском городе Хайдарабад.

Предложенный метод демонстрирует замечательную общую точность в 82% при учете изменений твердых частиц в зависимости от сезона. Более того, продемонстрировано существенное повышение точности оценки AQI за счет использования изображений по сравнению с существующими методологиями.

Предлагаемая методология

Методология состоит из структурированной серии шагов, охватывающих такие ключевые этапы, как кампания по сбору данных, установка точной настройки оборудования, создание специализированной модели обнаружения транспортных средств, адаптированной к уникальным сложностям сценария дорожного движения в Индии, а также различные другие неотъемлемые компоненты.

Загрязнение воздуха является постоянной проблемой уже довольно давно и становится все более серьезной из-за роста промышленной деятельности и увеличения количества транспортных средств на дорогах. Это подчеркивает острую необходимость немедленно предпринять активные шаги для смягчения его вредных последствий. Обширные исследования неизменно подчеркивают, что эта проблема будет продолжать влиять на нашу окружающую среду и здоровье без раннего вмешательства.

Рост передовых технологий, включая недорогие датчики, интеллектуальные устройства, подключенные к Интернету, и человеческие ресурсы. например, изучение компьютерных программ, обрабатывающих большие данные, способствовало нашему пониманию опасной природы загрязнения воздуха. Эти открытия выявили прямую взаимосвязь между загрязнением воздуха и различными заболеваниями, подчеркивая настоятельную необходимость немедленных действий.

Загрязнение воздуха происходит главным образом в результате сложной смеси загрязняющих веществ, выбрасываемых из различных источников. Эти загрязнители включают в себя ряд веществ, таких как твердые частицы (PM), диоксид азота (NO2), диоксид серы (SO2), оксид углерода (CO) и летучие органические соединения (ЛОС) и другие. Эти вещества могут серьезно повлиять на здоровье человека, увеличивая распространенность респираторных заболеваний, таких как астма и хроническая обструктивная болезнь легких (ХОБЛ), сердечно-сосудистых заболеваний и даже рака легких. По данным Всемирной организации здравоохранения (ВОЗ), деликатные твердые частицы (PM2,5) и другие загрязнители ежегодно становятся причиной около 7 миллионов преждевременных смертей во всем мире. Признание сложной связи между загрязнителями и проблемами здоровья является обязательным, что приводит к срочности комплексных усилий по смягчению последствий загрязнения воздуха для здоровья.

Что такое индекс качества воздуха и как он рассчитывается?

Индекс качества воздуха (AQI) представляет собой стандартизированную числовую шкалу, используемую для информирования населения об уровне загрязнения воздуха и его потенциальных последствиях для здоровья. Он обеспечивает простой и понятный способ измерения качества воздуха в определенной области. AQI рассчитывается на основе концентраций основных загрязнителей воздуха, включая твердые частицы (PM2,5 и PM10), приземный озон (O3), диоксид азота (NO2), диоксид серы (SO2) и оксид углерода (CO). . Концентрация каждого загрязняющего вещества преобразуется в субиндекс, а самый высокий субиндекс среди этих загрязняющих веществ становится значением AQI. Затем AQI классифицируется по диапазонам от «хорошего» до «тяжелого», что указывает на проблемы со здоровьем, связанные с качеством воздуха. Эта информация имеет решающее значение для отдельных лиц и органов власти для принятия обоснованных решений по защите здоровья населения. Доступно подробное руководство по Kaggle с соответствующим кодом для расчета индекса качества воздуха (AQI) от Vopani.

Каковы традиционные станции мониторинга качества воздуха?

Традиционная оценка качества воздуха в значительной степени опирается на сложные инструменты, такие как мониторы бета-затухания (BAM) и осциллирующие микровесы с коническим элементом (TEOM), которые широко используются регулирующими органами, такими как Центральный совет по контролю за загрязнением (CPCB) и правительственными учреждениями в Индии.

Во многих странах мира созданы различные станции мониторинга качества воздуха в разных городах. Эти станции используют прецизионные приборы обнаружения, основанные на вышеизложенных принципах, для определения концентраций загрязняющих веществ. Впоследствии они рассчитывают индекс качества воздуха (AQI) и распространяют эту информацию среди общественности. Стратегическое размещение этих станций мониторинга учитывает такие факторы, как распределение населения, размер застроенной территории, репрезентативность, непрерывность, безопасность и эксплуатационная осуществимость. Следовательно, зона действия станции мониторинга составляет примерно 1–3 км.

Аппаратная настройка решения

Устройство, разработанное для проекта «Оценка AQI на основе Интернета вещей с использованием методов обработки изображений и обучения», состоит из микроконтроллера Raspberry Pi 3B+ и камеры Raspberry Pi, которая облегчает захват изображений дорожного движения. Встроенные датчики включают в себя BME280 для измерения температуры и влажности, GPS-модуль Neo 8M для отслеживания широты и долготы, а также датчик SDS011 Nova для получения значений PM2,5 и PM10 в определенных местах. Каждое новое изображение захватывается с интервалом в 5 секунд. Данные, полученные от датчика SDS011, используются для расчета AQI, одновременно служа основой для алгоритма машинного обучения, разработанного для этой экспериментальной инициативы. AQI рассчитывается в соответствии с индийскими стандартами. Примечательно, что конфигурация оборудования позволяет передавать обработанные данные на удаленный сервер, что делает его хорошо подходящим для приложений периферийных вычислений.

Кампания по сбору данных

Кампания по сбору данных проводится в Хайдарабаде, Индия, на разных этапах и сезонах с целью создания обширного набора данных совмещенных изображений индекса качества воздуха (AQI). Набор данных включает 5048 изображений, каждое из которых коррелирует с данными AQI. Первый этап включает сбор данных в сентябре, октябре, ноябре и декабре 2021 года. Второй этап происходит в октябре и ноябре 2022 года, а также в январе и феврале 2023 года. Этот набор данных охватывает различные времена года. и преимущественно собирается в дневное время. Процесс сбора охватывает более 1000 километров по городу с использованием нескольких камер.

Для облегчения сбора данных щедро предоставляется автомобиль Бодхьян от IIT Hyderabad’s iHub, который служит платформой для установки нашей аппаратной установки. Установка расположена на крыше автомобиля и оснащена эталонным датчиком Aeroqual с удлинителем PM. Также установлен дополнительный эталонный датчик Aeroqual, оснащенный удлинителем CO для сбора более полных данных. Для бесперебойной передачи данных и мониторинга в реальном времени используется устройство JioFi, обеспечивающее подключение к Интернету для узла сбора данных.

Калибровка и предварительная обработка данных датчиков

В ходе сбора данных мы собрали комплексный набор данных, включающий такие важные переменные, как PM2,5, PM10, относительная влажность (Rh) и температура. Эти данные были собраны с помощью нашего узла качества воздуха и эталонного датчика, известного как Aeroqual. Примечательно, что наш узел работал с частотой 15 секунд, а эталонное устройство — с интервалом в 1 минуту.

После сбора набора данных был начат важный этап предварительной обработки. Необработанные данные были уточнены с помощью метода удаления выбросов IQR, одновременно исключая значения PM, превышающие 999, и значения Rh, превышающие 80. Впоследствии было принято стратегическое решение усреднить данные наших узлов с интервалом в 1 минуту, совместив их со справочными данными. . Смысл этого шага заключался в том, чтобы облегчить выполнение регрессионной модели для установления корреляций между нашими данными и эталонным набором данных.

Процесс установления корреляций включал использование корреляционных моделей Пирсона и Спирмена. Обнаружив временную задержку в наших данных, мы предприняли корректирующие действия, переместив наши данные для их синхронизации. Модели регрессии были протестированы для калибровки наших данных по показаниям эталонного устройства. В конечном счете, простая модель линейной регрессии оказалась оптимальным выбором, продемонстрированным самой низкой среднеквадратической ошибкой (RMSE) и самой высокой корреляцией, подтвержденной похвальным показателем r2.

После успешного выполнения линейной регрессии мы получили значения наклона и точки пересечения, которые сыграли решающую роль в калибровке значений нашего устройства, используя уравнение y = mx + c. Впоследствии был составлен дополнительный набор данных, содержащий калиброванные значения, полученные с помощью этого уравнения. Этот откалиброванный набор данных затем был использован для расчета индекса качества воздуха (AQI). Это было достигнуто путем расчета субиндексов для значений PM2,5 и PM10 с последующим расчетом AQI по индийской формуле AQI.

Извлечение функций и разработка функций

Центральная идея этого исследования связана с оценкой загрязнения воздуха, в частности индекса качества воздуха (AQI), посредством использования изображений дорожного движения. Это влечет за собой извлечение соответствующих характеристик из полученных изображений, которые затем используются в качестве входных данных для расчета AQI. При этом на изображениях идентифицируются транспортные средства, выбрасывающие загрязняющие вещества, и их количество считается важной особенностью изображения. Идентификация этих транспортных средств на изображениях была достигнута за счет реализации современного алгоритма обнаружения объектов «Вы только посмотрите один раз», версия 5 (YOLOv5).

Для количественной оценки количества транспортных средств, изображенных на изображениях, использовался алгоритм YOLOv5. YOLOv5 — это усовершенствованный алгоритм обнаружения и локализации объектов, характеризующийся использованием сверточной нейронной сети (CNN) в качестве средства извлечения признаков. Эта базовая архитектура позволяет алгоритму умело обнаруживать и локализовать несколько объектов на одном изображении. Конечный результат YOLOv5 для каждого изображения включает в себя два ключевых компонента: идентификация обнаруженных объектов (классификация) и очертание соответствующих ограничивающих рамок (регрессия). Чтобы обеспечить превосходную производительность, YOLOv5 был обучен с использованием специального набора данных о вождении в Индии (IDD), представленного ранее в этом исследовании.

Окончательная подготовка набора данных

При окончательной доработке набора данных начальный этап включает ввод изображений в предварительно обученную модель YOLOv5. Эта модель эффективно идентифицирует и количественно определяет количество транспортных средств, загрязняющих окружающую среду, на каждом изображении, охватывая различные типы транспортных средств, таких как автобусы, легковые автомобили, грузовики, мотоциклы и авторикши (всего пять категорий). Это количество служит фундаментальным компонентом вектора признаков изображения. Кроме того, оценка видимости каждого изображения вычисляется с помощью алгоритма BRISQUE, что дает единственное значение, которое еще больше дополняет вектор признаков.

На основе этого вектор функций расширяется за счет включения соответствующих данных датчиков, а именно показаний температуры и влажности. Кульминацией этого слияния является комплексный вектор признаков, структурированный как 8 × 1 для каждого образца изображения. Для ясности представлен репрезентативный пример этого вектора признаков.

Что касается маркировки образцов, используются значения концентрации PM2,5 и PM10, полученные от эталонного датчика PM. Посредством расчета значений AQI на основе этих измерений датчиков образцы набора данных классифицируются по заранее определенным уровням AQI, каждый из которых соответствует определенному уровню качества воздуха. Этот классифицированный уровень AQI служит меткой для каждого образца.

После выполнения этого процесса для всего набора данных генерируется комплексная матрица данных M размером m × 8, где m означает общее количество выборок в наборе данных. Кроме того, создается соответствующий вектор меток y размером m × 1 для инкапсуляции категории AQI для каждого образца, завершая подготовку окончательного набора данных.

Эксперименты и результаты

Это исследование было сосредоточено на прогнозировании качества воздуха, и в центре внимания оказался широкий спектр моделей машинного обучения (ML). В центре внимания были такие модели, как случайный лес, машина опорных векторов (SVM) и многослойный персептрон (MLP), каждая из которых играет свою роль. Эти модели были тщательно обучены и протестированы с использованием библиотеки Scikit-learn, известной своими мощными возможностями машинного обучения.

Центральным элементом исследования стала модель YOLOv5, которую не просто обучали, но и совершенствовали в течение 25 эпох. Затем эта модель была преобразована в вариант TensorFlow Lite, оптимизированный для бесперебойной работы на платформе Raspberry Pi Zero (Rpi 3B+).

Успех этого начинания стал очевиден благодаря всесторонней оценке характеристик моделей. Эта оценка включала такие ключевые показатели, как точность, полнота, показатель F1 и точность, что проливает свет на способность моделей прогнозировать уровни качества воздуха.

Оставайтесь с нами, чтобы получить более подробную информацию об этом увлекательном исследовании, в котором эти модели состязаются друг с другом в прогнозировании качества воздуха с точностью и изяществом. Это исследование отправляет нас в увлекательное путешествие по миру машинного обучения для оценки качества воздуха: от доработки YOLOv5 до TensorFlow Lite и использования возможностей SVM, RF и MLP.

Заключение

В этой новаторской статье мы представили удобную для пользователя методику прогнозирования индекса качества воздуха (AQI) с использованием изображений на устройствах Интернета вещей. Подход, основанный на сочетании машинного обучения (ML) и глубокого обучения (DL), позволил достичь поразительной точности классификации AQI — до 90%.

Но мы не останавливаемся на достигнутых результатах. Мы рады сотрудничать и делиться своим прогрессом с более широким сообществом. Если вы заинтересованы в изучении кода и данных этого инновационного проекта, вы можете посетить наш репозиторий GitHub: IoT-based-AQI-Estimation-using-Image-Processing-and -Методы обучения. Этот репозиторий включает в себя код, наборы данных и ресурсы, которые способствовали нашему исследованию мира машинного обучения для оценки качества воздуха.

По мере продвижения вперед наше внимание расширяется. Мы планируем распространить этот инновационный метод на ночные прогнозы, собирать летние данные и даже прогнозировать AQI для разных городов. Присоединяйтесь к нам в этом увлекательном путешествии по машинному обучению и оценке качества воздуха.