Прогнозная аналитика и обслуживание событий с использованием машинного обучения

Огромные краны поднимают кучи земли в уединенной шахте в пустыне Австралии. Экскаваторы, скреперы, буровые установки, погрузчики, подъемники и землеройные машины работают в унисон, выкапывая железо, литий, золото и алмазы. Каждая машина с тысячами движущихся частей, работающая круглосуточно без выходных в суровых условиях, требует тщательного контроля и технического обслуживания для поддержания ее работоспособности. Для этого требуется специальный обслуживающий персонал и запас запасных частей во всех точках. Любая поломка, которая приводит к значительному простою, означает огромные убытки.

Внутренняя органическая гидропонная ферма наполнена огнями, вентиляторами, смесителями питательных веществ и водяными насосами в пятизвездочном отеле в городе Орландо, штат Флорида. Для хорошего роста растений необходим строгий климат-контроль и оптимальные условия. Любой отказ компонентов, даже кратковременный, может повлиять на качество зелени.

Электромобиль беспилотный по дорогам Калифорнии. Датчики IoT в двигателе непрерывно передают данные на центральный сервер, который отслеживает производительность двигателя, оптимизирует его работу и прогнозирует любые потенциальные сбои.

Появление возможности подключения 5G для быстрых подключений, датчиков IoT для мониторинга и инфраструктуры быстрой аналитики для передачи данных открыло новые горизонты науки о принятии решений. В основе науки принятия решений лежит прогнозная аналитика.

Что такое прогнозная аналитика?

Прогнозная аналитика использует множество методов, включая интеллектуальный анализ данных, статистику, моделирование, машинное обучение и искусственный интеллект, для анализа данных в реальном времени и прогнозирования будущего. Прогнозная аналитика позволяет организациям стать проактивными, дальновидными и помочь в принятии будущих решений на основе данных, а не догадок.

В этом блоге мы рассказываем о нашей реализации прогнозирования отказов компонентов в двигателе на основе непрерывного сбора данных с датчиков.

Процесс прогнозной аналитики

Мы использовали данные из журналов системы / устройства, собранные с автомобильного двигателя. Датчики, встроенные в двигатель, отправляют различные значения параметров, такие как температура устройства, давление, прочность. Каждый из этих параметров имеет несколько состояний с их пороговыми значениями. Когда двигатель работает, значения параметров могут пересекать эти пороговые значения, вызывая предупреждения.

Подход

Способ прогнозирования этих предупреждений состоит в том, чтобы сначала предсказать будущие значения этих параметров на основе уже полученных значений. Мы разделили наш подход на два этапа:

Прогнозируйте значения параметров и генерируйте предупреждение, если прогнозируемые значения выходят за предварительно определенный предел.
Постройте модель для прогнозирования событий ошибок с сообщениями об ошибках, используя предсказанные значения из шага 1, чтобы пользователь мог заранее знать, что сообщение об ошибке придет в определенное время с определенной вероятностью.

Предварительная обработка данных

Поскольку данные, созданные из журналов устройства, были неструктурированными и неупорядоченными, для добавления структуры и смысла использовались различные методы предварительной обработки:

преобразование типа данных
удаление выбросов
определение шаблонов для проверки ошибок во время выполнения
поиск конкретных команд, которые дают информацию о состоянии и значениях параметров.
обработка пропущенных значений

Построение модели и прогнозирование

Мы прогнозируем значения параметров на следующий час и их состояния на основе уже собранных данных и использования модели LSTM (Long-short-term memory). Например, если параметр имеет два состояния, мы построили модели для обоих состояний и непрерывно предсказывали значения на следующий час.
С помощью прогнозируемых значений параметров и сопоставления прогнозируемых значений с руководствами к устройствам у нас была информация о том, когда значение может выйти за пределы своего порогового значения. Используя эту информацию, мы разработали систему для отправки предупреждений за 5 минут до ожидаемого времени предупреждения.
Мы построили модель классификации для событий как Ошибка или Нет ошибки на основе прогнозируемых значений параметров, полученных на первом этапе. Для построения модели классификации мы разделили данные на обучающую и тестовую наборы в соотношении 70:30. Чтобы преодолеть проблему дисбаланса классов, мы применили метод повышения дискретизации к обучающим данным и снова разделили эти 70% данных на обучающие и тестовые наборы. Цель этого разделения - проверить нашу модель как на сбалансированных, так и на несбалансированных данных.

Мы протестировали различные алгоритмы машинного обучения как на сбалансированных, так и на несбалансированных данных. Используемые модели классификации: Логистическая регрессия, Повышение градиента и Случайный лес. Среди всех этих алгоритмов производительность модели случайного леса как на сбалансированных, так и на несбалансированных тестовых данных была намного лучше, чем у двух других, как показано ниже.

Как видно из вышесказанного, процент ошибок класса, задаваемый моделью случайного леса, минимален по сравнению с другими алгоритмами.

Развертывание и обслуживание модели

Мы разработали тестовую панель инструментов под названием Predictive Maintenance Tool со следующими функциями:

Пользователь может загрузить журналы устройства вручную или запустить инструмент, чтобы узнать, когда произойдет ошибка, на основе событий времени выполнения.
Отобразите график прогнозируемых значений для различных значений параметров.
Место для ручного ввода ошибки, которая произошла неожиданно, а не в руководстве к устройству, но устранена инженером по обслуживанию / ремонту, чтобы они могли добавить ее для использования в будущем.

Проблемы

Дисбаланс данных вызвал проблему меньшего количества информации для классификации событий как «Ошибка» и «Нет ошибки».
Грязные данные.
Одновременное появление нескольких ошибок.
Сопоставление прогнозируемых значений параметров с руководствами.
Из-за колебаний устройств во время выполнения существует разрыв в генерируемом значении журналов.

Заключение

Дисбаланс данных вызвал проблему меньшего количества информации для классификации событий как «Ошибка» и «Нет ошибки».
Грязные данные.
Одновременное появление нескольких ошибок.
Сопоставление прогнозируемых значений параметров с руководствами.
Из-за колебаний устройств во время выполнения существует разрыв в генерируемом значении журналов.

Модель машинного обучения для прогнозной аналитики хорошо зарекомендовала себя, предоставляя предупреждения до того, как значения двигателя превысят пороговые значения, что позволило избежать дорогостоящих затрат на ремонт для владельцев автомобилей. По мере встраивания моделей машинного обучения в периферийные устройства сочетание таких локально генерируемых предупреждающих предупреждений с машинным обучением на стороне сервера для обеспечения цикла обратной связи обеспечит эффективность и аварийное восстановление во всех вертикалях, таких как автомобили, производство, сельское хозяйство и здравоохранение.

Первоначально опубликовано на https://47billion.com 23 октября 2020 г.

Прогнозная аналитика и обслуживание событий с использованием машинного обучения

Вопросы по теме