НЕПРЕРЫВНЫЕ РАСПРЕДЕЛЕНИЯ
Если возможные значения случайной величины могут принимать последовательность из бесконечного числа последовательных значений, мы имеем дело с непрерывным распределением.
Основные характеристики: —
- Иметь бесконечно много последовательных возможных значений.
- Используйте новые формулы для получения вероятности конкретных значений и интервалов.
- Невозможно сложить отдельные значения, составляющие интервал, поскольку их бесконечно много.
- Может быть выражена графиком или непрерывной функцией.
- График состоит из плавной кривой.
- Чтобы вычислить вероятность интервала, нам нужны интегралы.
- У них есть важная кумулятивная функция распределения (CDF).
Примеры непрерывного распространения: —
- Нормальное распределение.
- Студенты-T Распределение.
- Распределение хи-квадрат.
- Экспоненциальное распределение.
- Логистическая дистрибуция.
НОРМАЛЬНЫЕ РАСПРЕДЕЛЕНИЯ
Нормальное распределение представляет собой распределение, которому соответствует большинство естественных событий.
Обозначение: —
- Y ~ N(μ, σ²)
Основные характеристики: —
- Его график представляет собой колоколообразную кривую, симметричную, с тонкими хвостами.
- E(Y) = μ
- Var(Y) = σ²
- 68% всего его значения должны попадать в этот интервал: (μ-σиμ+σ).
Примеры и использование: —
- Часто наблюдается в размерах животных в дикой природе.
- Может быть стандартизирован для использования Z-таблицы.
СТАНДАРТИЗАЦИЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
Чтобы стандартизировать любое нормальное распределение, нам нужно преобразовать его так, чтобы среднее значение равнялось 0, а дисперсия и стандартное отклонение равнялись 1.
Важность стандартного нормального распределения: —
- Новая переменная z представляет, на сколько стандартных отклонений от среднего находится каждое соответствующее значение.
- Мы можем преобразовать любое нормальное распределение в стандартное нормальное распределение, используя преобразование, показанное выше.
- Удобен в использовании из-за таблицы известных значений его CDF, называемой таблицей Z-score или просто Z-таблицей.
РАСПРЕДЕЛЕНИЕ T СТУДЕНТОВ
Нормальное распределение представляет собой небольшое приближение размера выборки к нормальному распределению.
Обозначение: —
- Y ~ t(k)
Основные характеристики: —
- Приближение небольшого размера выборки к нормальному распределению.
- Его график представляет собой колоколообразную кривую, симметричную, но с толстыми хвостами.
- Учитывает экстремальные значения лучше, чем нормальное распределение.
- если k›2: E(Y) = μи Var(Y) = s² x (k / k-2)
Пример и использование: —
- Часто используется в анализе при изучении небольшой выборки данных, которая обычно соответствует нормальному распределению.
РАСПРЕДЕЛЕНИЕ ХИ-КВАДРАТ
Обозначение: —
- Y ~ X²(k)
Основные характеристики: —
- Его график асимметричен и скошен вправо.
- E(Y) = k
- Var(Y) = 2k
- Распределение хи-квадрат представляет собой квадрат t-распределения.
Пример и использование: —
- Часто используется для проверки качества прилегания.
- Содержит таблицу известных значений CDF, которая называется X²-таблица. Разница только в том, что таблица показывает, какая часть таблицы.
ЭКСПОНЕНЦИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ
Экспоненциальное распределение обычно наблюдается в событиях, которые значительно изменяются на ранней стадии.
Обозначение: —
- Y ~ Exp(𝜆)
Основные характеристики: —
- Плато как PDF, так и CDF после определенного момента.
- E(Y) = 1 / 𝜆
- Var(Y) = 1 /𝜆²
- Мы часто используем натуральный логарифм для преобразования значений таких распределений, поскольку у нас нет таблицы известных значений, таких как нормальное или хи-квадрат.
Пример и использование: —
- Часто используется с динамически изменяющимися переменными, такими как трафик онлайн-сайтов или радиоактивный распад.
ЛОГИСТИЧЕСКАЯ РАСПРЕДЕЛЕНИЕ
Непрерывное логистическое распределение наблюдается при попытке определить, как непрерывные переменные входные данные могут повлиять на вероятность бинарного результата.
Обозначение: —
- Y ~ Логистика(μ, s)
Основные характеристики: —
- E(Y) = μ
- Var(Y) = s² xπ² / 3
- Функция CDF активизируется, когда мы достигаем значений, близких к среднему.
- Чем меньше параметр масштаба, тем быстрее он достигает значений, близких к 1.
Пример и использование: —
- Часто используется в спорте, чтобы предвидеть, как производительность игрока или команды может определить исход матча.