Как рассчитать расстояние Махаланобиса между двумя временными рядами равных размеров?

Я занимаюсь интеллектуальным анализом данных по данным временных рядов. Мне нужно рассчитать расстояние или сходство между двумя сериями равных размеров. Мне было предложено использовать Евклидово расстояние, Космическое сходство или расстояние Махаланобиса. Первые два не дали никакой полезной информации. Кажется, я не могу понять различные руководства в Интернете.

So,

Учитывая два вектора A (a1, a2, a3, ..., an) и B (b1, b2, b3, ..., bn), как найти расстояние Махаланобиса между ними?

(Я получил совет по использованию этих мер расстояния в самом SO, и есть вопрос о том, как рассчитать сходство Cos; пожалуйста, подумайте, прежде чем закрывать этот вопрос)


person Shailesh Tainwala    schedule 24.06.2010    source источник
comment
Чтобы вычислить расстояние Махаланобиса, вам нужна информация о корреляциях между вашими векторными координатами как случайными величинами (т.е. как a2 зависит от a1 и т. Д.). У вас есть эта информация? Если у вас достаточно очков, вы можете оценить корреляции ...   -  person Jens    schedule 24.06.2010


Ответы (1)


Вы должны оценить ковариационную матрицу.

Соответствующие статьи в Википедии: this и this.

Для многомерных векторов (n наблюдений p-мерной переменной) формула для расстояния Махаланобиса имеет вид

alt text

Где S - это величина, обратная ковариационной матрице, которая может быть оценена как:

alt text

где alt text- i-е наблюдение (p-мерной) случайной величины. и

alt text

Будьте осторожны: использование расстояния Махаланобиса между вашими векторами имеет смысл только в том случае, если все ожидаемые значения ваших векторов совпадают.

Я всегда думал, что расстояние Махаланобиса используется только для классификации данных и обнаружения выбросов, таких как отбрасывание экспериментальных данных (своего рода тесты «правда / ложь»). Никогда не слышал об использовании его в качестве «аналогичного» расстояния.

HTH!

person Dr. belisarius    schedule 24.06.2010
comment
О, так что сначала мы должны создать ковариационную матрицу на основе ВСЕХ наших экспериментов, а затем использовать эту матрицу для расстояния? Вау, большое спасибо за это объяснение! - person VMAtm; 02.03.2016