МАЛЫЕ ДАННЫЕ IoT НАМНОГО ВАЖНЕЕ, ЧЕМ БОЛЬШИЕ ДАННЫЕ IoT

Несмотря на все недавние прорывы в машинном обучении, большие данные не решат никаких реальных проблем в инженерных операциях.

Контекст

Нынешние тенденции, похоже, указывают на склонность к использованию «больших данных» для решения любой проблемы, требующей той или иной формы аналитики.

Существует очень узкий набор задач, которые на самом деле решаются с помощью больших данных. На самом деле есть признаки того, что решения для работы с большими данными редко решают какие-либо серьезные проблемы на предприятиях, инвестировавших в эту технологию. Узкий набор проблем, которые удалось решить с помощью больших данных, в основном включает машинное зрение, распознавание речи и другие формы распознавания образов.

Проблема

Проблема в том, что очень небольшой процент проблем реального мира проявляется в виде паттернов. К сожалению, даже в таких областях, как распознавание изображений и обработка естественного языка (NLP), где существует множество шаблонов, есть много исключений, которые быстро сделают приложение для работы с большими данными бесполезным. Например, в кругах продвинутого машинного обучения (ML) и глубокого обучения принято говорить о распределении домена набора данных в отношении набора данных, используемого для разработать и обучить модель машинного обучения распознаванию шаблонов в определенной области. Бесполезно, например, использовать даже миллиард изображений для обучения модели, которая должна распознавать различные типы горнодобывающего оборудования, когда ни одно из этих миллиардов изображений не содержит ни одного изображения тяжелой машины, не говоря уже о со специальным применением в горнодобывающей промышленности.

Вот тут и начинаются все проблемы.

Когда дело доходит до большинства реальных жизненных проблем, чрезвычайно сложно классифицировать все проблемы с точки зрения паттернов. На самом деле, у природы есть способ сделать так, чтобы проблемы, с выученными шаблонами, исчезли естественным образом. Люди, в частности, стали особенно хорошо распознавать закономерности в проблемах и, следовательно, столь же хорошо справляются с решением подобных проблем. Отсюда и различные комментарии, написанные о больших данных черных дырах.

По сути, самые важные и важные выводы, которые у нас есть, исходят из предубеждений. Такие книги, как Озарение, Парадокс выбора, Черный лебедь и Простые эвристики, которые делают нас умными, показывают важную роль, которую предубеждения играют в самых важных решениях, которые мы принимаем в жизни. Предубеждения, по определению, используют очень малые объемы данных. Все вышеупомянутые книги показывают постоянную тенденцию этих предубеждений, ведущих к лучшему принятию решений в основном благодаря (не вопреки) меньшему количеству данных.

Это означает, что большие данные — не панацея. Что еще более важно, большие данные, скорее всего, создадут больше проблем, чем решат.

Интернет вещей + большие данные — это проблема

Когда дело доходит до инженерных операций, большие данные имеют тесную связь с IoT из-за следующих факторов:

необходимость управления гарантийными обязательствами по инженерному оборудованию
необходимость контролировать и управлять доступностью оборудования, производительностью и качеством продукции
необходимость отслеживать использование машины и общее состояние, включая работоспособность и местоположение
широкая доступность электроники (и, следовательно, сенсорной информации) в современных инженерных машинах
ошеломляющие объемы (временных рядов) данных, производимых машинами в 24-часовой операционной среде

Поэтому заманчиво иметь пристрастие к использованию «больших данных» в инженерных операциях. Это ошибка.

Во-первых, по причинам, изложенным выше, большие объемы данных не обязательно приведут к более разумному пониманию. Никакой объем машинного обучения на основе больших данных не даст лучших результатов, чем инженер-оператор сможет принимать лучшие оперативные решения благодаря большему количеству экранов компьютеров, на которые можно смотреть. и другие гаджеты или инструменты для использования. Более конкретные причины этого включают отсутствие согласованных шаблонов в инженерных операциях, преобладание очень узкого набора шаблонов, которые не обязательно поддаются готовности к машинному обучению или экономически эффективным приложениям ML, а также широкое использование эвристики. в инженерных операциях (например, регулярные проверки, ожидаемый жизненный цикл оборудования и плановое техническое обслуживание).

Проблема, с которой должны столкнуться сторонники больших данных для инженерных операций, заключается в том, что некоторые из этих эвристик кодифицированы в операционных процедурах, правилах безопасности и рабочих процессах многих производственных сред. Своим существованием они обязаны потребности в избыточности (в отличие от эффективности). Если аргумент в пользу аналитики больших данных в инженерных операциях должен быть успешным, то его сторонники должны быть осторожны, чтобы не структурировать свои аргументы вокруг неэффективности плановых проверок и т. д., а скорее вокруг избыточную информацию можно получить из центрального интерфейса с поддержкой ИИ. Но с использованием больших данных или без них внешний интерфейс должен взаимодействовать недвусмысленно и прозрачно, то самое, что нейронная сеть поддерживает модели больших данных. не предназначены для того, чтобы быть в состоянии сделать. Если подумать об этом с другой стороны, то от инженеров, отвечающих за заводы, часто ожидают не только ответов на проблемы, но и пояснений, как они приходят к этим ответам, ради ясности и достижения соответствия бизнес-процессам. сотрудников и контролирующих органов.

Во-вторых, проблема измерения в машинах весьма критична. Если то, что и как выполняется измерение, неверно, данные бесполезны. Это гораздо большая проблема, чем кажется. Большинство датчиков машин (измерительных приборов) имеют более сложную конструкцию, чем их системы управления. Кроме того, эти датчики довольно часто измеряют неверные переменные (переменные) (см. анализ первопричин). Это серьезная проблема, которую нужно исправить. Даже самые передовые компании по разработке пассажирских авиалиний, такие как Boeing, все еще усердно работают над решением этой проблемы.

В-третьих, распознавание образов в машинах чрезвычайно сложно. Факторы, касающиеся машинной среды, использования, того, как она работает, а также понимание набора общих проблем и анализа первопричин важнее, чем конкретное нацеливание на все общие шаблоны в состояниях и поведении машины. В частности, машинные шаблоны sensor-data упаковываются в машинную среду и контекст; таким образом, анализ наблюдаемых/зарегистрированных закономерностей, даже если он правильный (весьма маловероятно), все равно не даст рентабельных результатов по отношению к сделанным инвестициям в «большие данные».

Решение

В большинстве случаев гораздо проще попытаться понять проблемы, с которыми сталкивается группа инженеров (заказчик!), прежде чем кто-то автоматически предположит и предположит, что новая технология просто лучше. В инженерных областях, в которых я работал, таких как телекоммуникации, военные, производство, логистика и деревообработка/строительство, клиенты сталкиваются с общими проблемами:

Общая эффективность оборудования, в.р.т. закупки (в частности, в отношении того, какое оборудование у какого поставщика следует покупать)
Риски безопасности при эксплуатации
Операционные потери из-за простоев, краж, аварий/происшествий, трудовых споров, прогулов, вандализма

В большинстве случаев для решения этих задач требуются лишь меньшие объемы данных.

Что довольно часто встречается в инженерных операциях, так это найти OEM-производителей, операторов, мастеров, техников, инженеров, сотрудников службы безопасности и другого вспомогательного персонала, обладающихэкспертными знаниями, в совокупности, которые могли бы решить большинство (если не все) ) проблемы. Эти инсайты основаны на закономерностях, которые наблюдал каждый из этих ролевых игроков, будучи экспертами в предметной области (SME) в своей сфере деятельности. По отдельности ни одна из их идей не привела к каким-либо реальным улучшениям в инженерных операциях. Их идеи могут действительно оказать влияние только вместе.

Именно такое понимание привело к энтузиазму в отношении возможного влияния и роли больших данных в инженерных операциях. Но классифицировать это как проблему больших данных — неправильное понимание. Во-первых, данные, наблюдаемые соответствующими МСП, часто основаны на опыте. Это не обязательно большие или большие данные.Во-вторых, шаблоны, общие для точек данных, записанных SME, часто больше связаны со сложными взаимозависимостями, чем с простым вводом-выводом. метки (т.е. для обучения алгоритмов глубокого обучения). Большинство этих зависимостей имеют вероятность перехода, равную 1. Они так же надежны, как закон всемирного тяготения (т. е. если механизатор не придет в свою смену, машина сама не включится). В-третьих, некоторые из опытных людей-операторов могут оценивать измерения и делать много значимых выводов из этих измерений с использованием нескольких простых эвристических погрешностей (в отличие от «больших данных»).

Интернет вещей в инженерных операциях должен решать следующие задачи:

сосредоточьтесь на проведении правильных измерений, правильно
решить проблемы процессов (сбора данных) (для «чистых данных»), оцифровки (т. е. безбумажных систем) и автоматизации, прежде чем пытаться решить любую «аналитическую» проблему
сосредоточиться на измерениях, связанных с операционными (особенно безопасностью) рисками и потерями

Аналитика данных в инженерных операциях должна решать следующие задачи:

напрямую отвечать на вопросы, касающиеся OEE, операционных рисков и убытков
сбор и анализ фрагментов данных, полученных от МСП, для решения операционных проблем
сбор и анализ точек данных от датчиков машин IoT для улучшения OEE

При внимательном рассмотрении большинство этих проблем больше связано с моделью архитектуры данных, чем с «большими данными». Модель должна быть направлена на предоставление нужного количестваинформации (не больше и не меньше) нужному человеку, в нужном месте и в нужное время. Если модель ориентирована на машину с «большими данными» ИИ, она, следовательно, потерпит неудачу. Отсюда и растущее в последнее время беспокойство по поводу провала проектов «больших данных».

muchiniwam.co.za

castrydigital.com

МАЛЫЕ ДАННЫЕ IoT НАМНОГО ВАЖНЕЕ, ЧЕМ БОЛЬШИЕ ДАННЫЕ IoT

Контекст

Проблема

Интернет вещей + большие данные — это проблема

Решение

Вопросы по теме