Ух ты, это название беспорядок! Это потому, что мы собираемся рассмотреть 4 концепции, и написание каждой из них по отдельности может привести к еще большему беспорядку. Как бы то ни было, надеюсь, вы здесь после этого титула и готовы заняться математикой 😎

Среднее значение суммы случайных некоррелированных / коррелированных переменных:

Прежде чем рассматривать дисперсию случайных величин, давайте поговорим об их средних значениях.

Скажем, в среднем ожидается увидеть 4 человека в зеленой футболке за день (назовем это X). Таким образом, среднее количество людей в зеленой футболке, которых можно ожидать увидеть за день, составляет 4 человека. Мы также знаем, что в среднем ожидается увидеть 3 собак в день (назовем это Y).

Итак, какова ожидаемая ценность встречи с людьми в зеленой футболке и собакой через день? Можно ожидать увидеть 4 зеленых футболки и 3 собак, поэтому ожидаемое значение их суммы составляет всего 4 +3 = 7.

Не имеет значения, коррелированы ли переменные или коррелированы, среднее значение их суммы - это просто сумма их индивидуальных средних.

Среднее значение разности случайных / коррелированных переменных:

Это похоже на предыдущую часть, но мы будем вычитать значения вместо добавления, потому что это похоже на вопрос, сколько еще экземпляров из X я ожидаю увидеть, чем Y.

В нашем примере это 4–3 = 1. Можно ожидать увидеть на 1 случай людей в зеленой футболке больше, чем с собакой.

Дисперсия суммы случайных некоррелированных величин:

В другом рассказе, который я опубликовал, я упомянул вычитание их средних значений из параметров, чтобы заставить их использовать одно и то же пространство. Очень важно понять этот момент для понимания следующих концепций, поэтому было бы полезно прочитать эту историю.

Мы сделаем то же самое для X и Y. Итак, теперь они находятся в одном пространстве, мы можем добавить их, чтобы исследовать свойства их суммы.

Это также удовлетворяет общие концепции пространства. вектор s - это сумма случайных величин X и Y (и его среднее значение, вычтенное из него, чтобы разделить то же пространство с другими параметрами).

Прежде чем двигаться дальше, я хочу, чтобы вы показали вам, что дисперсия - это величина вектора параметра, деленная на количество измерений этого параметра.

Формальное определение дисперсии 😒:

Дисперсия линейной алгебры 👍

Итак, если мы хотим найти дисперсию X + Y, все, что нам нужно сделать, это просто вычислить величину вектора X + Y- (среднее (x) + среднее (y)) в этом пространстве.

Они перпендикулярны друг другу, поэтому мы можем использовать теорему Пифагора для вычисления величины s.

Если разделить обе стороны на N, получим:

Это дисперсия суммы случайных величин!

Дисперсия разности случайных некоррелированных величин:

Все, что связано с одним и тем же пространством, можно применить и к этому случаю.

Разделите каждую сторону на N:

Дисперсия суммы коррелированных переменных:

Если переменные коррелированы, угол между ними не равен 90⁰.

Но наша цель та же. Мы хотим вычислить величину суммы этих двух векторов и разделить на N, чтобы получить дисперсию. Для этого воспользуемся законом косинусов.

Если разделить обе части на N

Это дисперсия суммы коррелированных переменных!

Дисперсия разности коррелированных переменных:

Это дисперсия разности коррелированных переменных!

(Знак ковариации в формуле может отличаться от других формул из-за выбора тета)

Наша тета:

Другой выбор теты:

Вау, это был интенсивный, но интуитивный вывод. Мы вывели дисперсию суммы / разности случайных и коррелированных величин, просто используя линейную алгебру.

Не запоминай, оставайся интуитивно понятным 👍😎