Экспоненциально взвешенное скользящее среднее без среднего или стандартного отклонения?

Привет, я собрал некоторые технологические данные за 3 года и хочу воспроизвести перспективный анализ EWMA, чтобы увидеть, сможет ли мой заданный параметр сглаживания обнаружить все важные изменения (без слишком большого количества ложных срабатываний).

Похоже, что большинство учебников и литературы, которые я просматривал, используют среднее значение и стандартное отклонение для расчета контрольных пределов. Обычно это «контролируемое» среднее значение и стандартное отклонение от некоторых исторических данных или среднее значение и стандартное отклонение совокупности, из которой взяты образцы. У меня нет ни той, ни другой информации.

Есть ли другой способ расчета контрольных пределов?

Существует ли вариант диаграммы EWMA, в котором не используются среднее значение и стандартное отклонение?

Любые творческие идеи?

заранее спасибо


person user3295481    schedule 25.06.2014    source источник
comment
Чтобы убедиться, что я понимаю это: вы можете вычислить среднее значение и дисперсию EWMA, но у вас нет базовой линии для их сравнения? Мне кажется, что у вас есть контролируемая техника (которая предполагает, что вы можете определить, как она должна выглядеть), но вам нужна неконтролируемая техника (которая только ищет различия, не называя одно состояние хорошим, а другое плохим). Что касается неконтролируемых методов, на ум приходит кластеризация, но ее необходимо модифицировать, чтобы применить к временным рядам. Как насчет обобщенного отношения правдоподобия (GLR)?   -  person Jim Pivarski    schedule 25.06.2014
comment
Если мы обратимся к en.wikipedia.org/wiki/EWMA_chart, я могу вычислить Zi для моя заданная лямбда, но когда дело доходит до контрольных пределов, у меня нет исторических данных для вычисления T и S. Спасибо, я изучу GLR, а также опубликую на Cross Validated.   -  person user3295481    schedule 25.06.2014
comment
Кроме того, это, вероятно, должно пройти перекрестную проверку: stats.stackexchange.com   -  person Jim Pivarski    schedule 25.06.2014
comment
Да, T и S - это среднее значение и стандартное отклонение базового распределения, которое либо задано априори, либо определено из набора обучающих данных. Набор обучающих данных представляет, как должны выглядеть данные, следовательно, это метод с учителем, а вам нужен метод без учителя. GLR не имеет экспоненциального взвешивания, но динамически находит разрыв в данных между двумя разными распределениями и объединяет данные с каждой стороны разрыва, чтобы получить более надежные результаты. Это может быть то, что вы хотите.   -  person Jim Pivarski    schedule 25.06.2014


Ответы (1)


С практической/операционной точки зрения использование только статистического анализа исторических данных встречается редко. Да, он дает некоторое представление о том, как работает процесс (и его система управления), однако наиболее важным на сегодняшний день является хорошее понимание и знание «технических ограничений».

Я имею в виду эксплуатационные пределы, которые определяются техническими характеристиками и рабочими характеристиками различных единиц оборудования. Это позволяет получить хорошее представление о том, как должен вести себя процесс (с точки зрения оптимальной рабочей точки и верхних/нижних контрольных пределов), и где находятся области наибольшего отклонения от оптимального. Это имеет очень мало общего со статистическим анализом исторических данных и в значительной степени с технологическим проектированием/металлургией - в зависимости от типа процесса, с которым вы имеете дело.

Пределы контроля в конечном итоге определяются тем, чего ХОЧЕТ руководитель процесса / инженер-технолог, которые обычно (но не всегда) находятся в пределах паспортной мощности оборудования.

Если вы работаете в рамках операционных ограничений и занимаетесь оптимизацией процессов, то да, статистический анализ используется более широко и может дать хорошее представление. В зависимости от изменчивости вашего процесса, того, насколько хорошо настроена ваша система управления и однородности вашего кормового продукта, выбранные верхние/нижние контрольные пределы будут различаться. Хорошей отправной точкой является оптимальная рабочая точка (например, 100 м3/ч), затем используйте разумный объем исторических данных для расчета стандартного отклонения и установите верхний предел 100 + 1 стандартное отклонение, а нижний предел 100 - 1 стандартное отклонение. разв. Это ни в коем случае не «жесткое и быстрое» правило, но это разумная отправная точка.

person Stracky    schedule 07.02.2016