Вероятность — Непрерывные распределения

НЕПРЕРЫВНЫЕ РАСПРЕДЕЛЕНИЯ

Если возможные значения случайной величины могут принимать последовательность из бесконечного числа последовательных значений, мы имеем дело с непрерывным распределением.

Основные характеристики: —

Иметь бесконечно много последовательных возможных значений.
Используйте новые формулы для получения вероятности конкретных значений и интервалов.
Невозможно сложить отдельные значения, составляющие интервал, поскольку их бесконечно много.
Может быть выражена графиком или непрерывной функцией.
График состоит из плавной кривой.
Чтобы вычислить вероятность интервала, нам нужны интегралы.
У них есть важная кумулятивная функция распределения (CDF).

Примеры непрерывного распространения: —

Нормальное распределение.
Студенты-T Распределение.
Распределение хи-квадрат.
Экспоненциальное распределение.
Логистическая дистрибуция.

НОРМАЛЬНЫЕ РАСПРЕДЕЛЕНИЯ

Нормальное распределение представляет собой распределение, которому соответствует большинство естественных событий.

Обозначение: —

Y ~ N(μ, σ²)

Основные характеристики: —

Его график представляет собой колоколообразную кривую, симметричную, с тонкими хвостами.
E(Y) = μ
Var(Y) = σ²
68% всего его значения должны попадать в этот интервал: (μ-σиμ+σ).

Примеры и использование: —

Часто наблюдается в размерах животных в дикой природе.
Может быть стандартизирован для использования Z-таблицы.

СТАНДАРТИЗАЦИЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ

Чтобы стандартизировать любое нормальное распределение, нам нужно преобразовать его так, чтобы среднее значение равнялось 0, а дисперсия и стандартное отклонение равнялись 1.

Важность стандартного нормального распределения: —

Новая переменная z представляет, на сколько стандартных отклонений от среднего находится каждое соответствующее значение.
Мы можем преобразовать любое нормальное распределение в стандартное нормальное распределение, используя преобразование, показанное выше.
Удобен в использовании из-за таблицы известных значений его CDF, называемой таблицей Z-score или просто Z-таблицей.

РАСПРЕДЕЛЕНИЕ T СТУДЕНТОВ

Нормальное распределение представляет собой небольшое приближение размера выборки к нормальному распределению.

Обозначение: —

Y ~ t(k)

Основные характеристики: —

Приближение небольшого размера выборки к нормальному распределению.
Его график представляет собой колоколообразную кривую, симметричную, но с толстыми хвостами.
Учитывает экстремальные значения лучше, чем нормальное распределение.
если k›2: E(Y) = μи Var(Y) = s² x (k / k-2)

Пример и использование: —

Часто используется в анализе при изучении небольшой выборки данных, которая обычно соответствует нормальному распределению.

РАСПРЕДЕЛЕНИЕ ХИ-КВАДРАТ

Обозначение: —

Y ~ X²(k)

Основные характеристики: —

Его график асимметричен и скошен вправо.
E(Y) = k
Var(Y) = 2k
Распределение хи-квадрат представляет собой квадрат t-распределения.

Пример и использование: —

Часто используется для проверки качества прилегания.
Содержит таблицу известных значений CDF, которая называется X²-таблица. Разница только в том, что таблица показывает, какая часть таблицы.

ЭКСПОНЕНЦИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

Экспоненциальное распределение обычно наблюдается в событиях, которые значительно изменяются на ранней стадии.

Обозначение: —

Y ~ Exp(𝜆)

Основные характеристики: —

Плато как PDF, так и CDF после определенного момента.
E(Y) = 1 / 𝜆
Var(Y) = 1 /𝜆²
Мы часто используем натуральный логарифм для преобразования значений таких распределений, поскольку у нас нет таблицы известных значений, таких как нормальное или хи-квадрат.

Пример и использование: —

Часто используется с динамически изменяющимися переменными, такими как трафик онлайн-сайтов или радиоактивный распад.

ЛОГИСТИЧЕСКАЯ РАСПРЕДЕЛЕНИЕ

Непрерывное логистическое распределение наблюдается при попытке определить, как непрерывные переменные входные данные могут повлиять на вероятность бинарного результата.

Обозначение: —

Y ~ Логистика(μ, s)

Основные характеристики: —

E(Y) = μ
Var(Y) = s² xπ² / 3
Функция CDF активизируется, когда мы достигаем значений, близких к среднему.
Чем меньше параметр масштаба, тем быстрее он достигает значений, близких к 1.

Пример и использование: —

Часто используется в спорте, чтобы предвидеть, как производительность игрока или команды может определить исход матча.

Вероятность — Непрерывные распределения

НЕПРЕРЫВНЫЕ РАСПРЕДЕЛЕНИЯ

НОРМАЛЬНЫЕ РАСПРЕДЕЛЕНИЯ

СТАНДАРТИЗАЦИЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ

РАСПРЕДЕЛЕНИЕ T СТУДЕНТОВ

РАСПРЕДЕЛЕНИЕ ХИ-КВАДРАТ

ЭКСПОНЕНЦИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

ЛОГИСТИЧЕСКАЯ РАСПРЕДЕЛЕНИЕ

Вопросы по теме