Наука о данных: сделать мир лучше

Bosch хорошо известен своим качеством в производстве бытовой техники. Bosch может быть ведущим производителем бытовой техники благодаря своей приверженности качеству. Bosch даже заходит так далеко, что записывает данные на каждом этапе своей сборочной линии. Записывая данные на каждом этапе производственного процесса, Bosch может применять расширенную аналитику для улучшения производственных процессов. [1] В 2016 году компания Bosh создала на Kaggle конкурс с открытым исходным кодом, который позволяет людям любого происхождения и уровня опыта использовать методы обработки данных для устранения внутренних сбоев Bosch. Kagglers должны прогнозировать внутренние отказы, используя тысячи измерений и тестов, проведенных для каждого компонента на сборочной линии. Это позволит Bosch предлагать конечному пользователю качественную продукцию по более низкой цене. [1] Призы предлагаются в размере 30 000 долларов США за первое, второе и третье места, при этом победитель, занявший первое место, получает 15 000 долларов США, занявший второе место — 10 000 долларов США, а победитель третьего места — 5 000 долларов США.

Усовершенствованные методы обнаружения неисправностей с помощью датчиков интеллектуального анализа данных все чаще требуются в промышленности. Ведика и др. в журнале IEEE Intelligent Systems Journal обсуждает необходимость в усовершенствованных алгоритмах, которые могут обеспечить автоматическое раннее обнаружение и диагностику неисправностей на угольных мельницах, чтобы можно было своевременно принимать меры по контролю. Vedika et al объясняет, как системы обнаружения отказов на тепловых электростанциях и угольных мельницах используют фиксированные пределы сигналов тревоги, которые настраиваются для переменных процесса в распределенной системе управления (DCS), активируя сигнал тревоги, когда значение переменной пересекает верхний или нижний предел. Система реагирует на аномалии только после того, как произошло серьезное повреждение. [2]

Когда передовые алгоритмы применяются к данным, полученным от датчиков, неисправности могут быть обнаружены до того, как будет обнаружено повреждение, экономя материалы, повышая производительность, следовательно, увеличивая прибыль для компании и снижая потребительские расходы. [2] Vedika et al вводят дополнительный шаг в текущем алгоритме, называемом моделью адаптивного обучения (ALM). Текущий алгоритм имеет процесс запуска и остановки, инициированный работником. Сбор данных осуществляется датчиками на протяжении всего процесса, данные предварительно обрабатываются, а затем используются моделью. Данные ищут остаточную информацию на основе шума от установки, а затем выводят информацию о том, обнаружена ли неисправность или нет. Ведика и др. вводят модель адаптивного обучения (ALM) сразу после анализа остаточного поколения. ALM внедряется для изучения отклонения от износа оборудования, которое происходит на предприятии.

Чтобы использовать данные с датчиков, Ведика и др. объясняют два основных типа предварительной обработки данных для приложений FD. В статье обсуждается использование предварительной обработки данных в автономном режиме, которая включает предварительную обработку обучающего набора данных, используемого для разработки модели. [2] Предварительная обработка данных в режиме онлайн включает в себя предварительную обработку данных в режиме онлайн во время обнаружения неисправности. Предварительная обработка данных в основном применяется для уменьшения пропущенных значений, выбросов и случайного шума в данных. Vedika et al. объясняют, что общие методы работы с пропущенными значениями включают удаление регистра; вменение с использованием среднего значения, медианы и модального значения; и k-Ближайший сосед (k-NN) Вменение. [2] В журнале объясняется, почему статистические модели, такие как правило редактирования 3σ, z-оценка и ящичные диаграммы, наиболее подходят для количественных данных с действительными значениями. Для устранения шума предлагается несколько подходов, таких как линейные фильтры, вейвлет-анализ и алгоритм Савицкого — Голея. Данные, получаемые от датчиков, используются для обнаружения сбоев в системе, что позволяет техническим специалистам останавливать производственную линию при обнаружении истинных положительных результатов. Технические специалисты ремонтируют или настраивают линию, переобучают данные на основе настроек и перезапускают линию без потери материала или серьезных повреждений.

В статье «Анализ данных и выбор функций для диагностического обслуживания: тематическое исследование в металлургической промышленности» Марта и др. описывают, как машинное обучение и интеллектуальный анализ данных могут применяться в промышленных условиях для прогнозирования возможных отказов компонентов. Компоненты заменяются непосредственно перед поломкой системы. Компания InValue, работающая в металлургической отрасли, использует методы машинного обучения и интеллектуального анализа данных, чтобы раскрыть новые знания об эксплуатации и обслуживании оборудования, собранные модулем сбора данных. [3] Собранная информация о конкретных рабочих параметрах используется для предотвращения износа компонентов машин. При обнаружении износа компоненты заменяются, предотвращая катастрофический отказ и максимально увеличивая производительность.

Интернет вещей (I.O.T) и внедрение 5G все больше и больше компаний будут использовать большие данные в своих процессах. Машинное обучение и интеллектуальный анализ данных будут использоваться для открытия неизвестного, что улучшит операции, повысит производительность, излечит болезни и сократит расходы потребителей. Data Scientist со знанием предметной области будет становиться все более востребованным, или, возможно, специалисты в предметной области со знанием методов обработки данных станут ключом к индустриальному будущему?

Процитированные работы

[1] Марта и др., Анализ данных и выбор функций для профилактического обслуживания: тематическое исследование в металлургической промышленности, International Journal of Information Management,vol. 46, нет. https://doi.org/10.1016/j.ijinfomgt.2018.10.006, стр. 252–262, 2019 г.

[2] Б. П. П. С. Ведика Агравал, «Повышение надежности систем обнаружения неисправностей для промышленных приложений», IEEE Intelligent Systems,vol. Том: 33, вып. 3, стр. 28–39, 2018.

[3] Kaggle, Производительность производственной линии Bosch, 2016 г. [Онлайн]. Доступно: https://www.kaggle.com/c/bosch-production-line-performance. [По состоянию на 25 августа 2019 г.].