НЕПРЕРЫВНЫЕ РАСПРЕДЕЛЕНИЯ

Если возможные значения случайной величины могут принимать последовательность из бесконечного числа последовательных значений, мы имеем дело с непрерывным распределением.

Основные характеристики: —

  • Иметь бесконечно много последовательных возможных значений.
  • Используйте новые формулы для получения вероятности конкретных значений и интервалов.
  • Невозможно сложить отдельные значения, составляющие интервал, поскольку их бесконечно много.
  • Может быть выражена графиком или непрерывной функцией.
  • График состоит из плавной кривой.
  • Чтобы вычислить вероятность интервала, нам нужны интегралы.
  • У них есть важная кумулятивная функция распределения (CDF).

Примеры непрерывного распространения: —

  1. Нормальное распределение.
  2. Студенты-T Распределение.
  3. Распределение хи-квадрат.
  4. Экспоненциальное распределение.
  5. Логистическая дистрибуция.

НОРМАЛЬНЫЕ РАСПРЕДЕЛЕНИЯ

Нормальное распределение представляет собой распределение, которому соответствует большинство естественных событий.

Обозначение: —

  • Y ~ N(μ, σ²)

Основные характеристики: —

  • Его график представляет собой колоколообразную кривую, симметричную, с тонкими хвостами.
  • E(Y) = μ
  • Var(Y) = σ²
  • 68% всего его значения должны попадать в этот интервал: (μ-σиμ+σ).

Примеры и использование: —

  • Часто наблюдается в размерах животных в дикой природе.
  • Может быть стандартизирован для использования Z-таблицы.

СТАНДАРТИЗАЦИЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ

Чтобы стандартизировать любое нормальное распределение, нам нужно преобразовать его так, чтобы среднее значение равнялось 0, а дисперсия и стандартное отклонение равнялись 1.

Важность стандартного нормального распределения: —

  • Новая переменная z представляет, на сколько стандартных отклонений от среднего находится каждое соответствующее значение.
  • Мы можем преобразовать любое нормальное распределение в стандартное нормальное распределение, используя преобразование, показанное выше.
  • Удобен в использовании из-за таблицы известных значений его CDF, называемой таблицей Z-score или просто Z-таблицей.

РАСПРЕДЕЛЕНИЕ T СТУДЕНТОВ

Нормальное распределение представляет собой небольшое приближение размера выборки к нормальному распределению.

Обозначение: —

  • Y ~ t(k)

Основные характеристики: —

  • Приближение небольшого размера выборки к нормальному распределению.
  • Его график представляет собой колоколообразную кривую, симметричную, но с толстыми хвостами.
  • Учитывает экстремальные значения лучше, чем нормальное распределение.
  • если k›2: E(Y) = μи Var(Y) = s² x (k / k-2)

Пример и использование: —

  • Часто используется в анализе при изучении небольшой выборки данных, которая обычно соответствует нормальному распределению.

РАСПРЕДЕЛЕНИЕ ХИ-КВАДРАТ

Обозначение: —

  • Y ~ X²(k)

Основные характеристики: —

  • Его график асимметричен и скошен вправо.
  • E(Y) = k
  • Var(Y) = 2k
  • Распределение хи-квадрат представляет собой квадрат t-распределения.

Пример и использование: —

  • Часто используется для проверки качества прилегания.
  • Содержит таблицу известных значений CDF, которая называется -таблица. Разница только в том, что таблица показывает, какая часть таблицы.

ЭКСПОНЕНЦИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

Экспоненциальное распределение обычно наблюдается в событиях, которые значительно изменяются на ранней стадии.

Обозначение: —

  • Y ~ Exp(𝜆)

Основные характеристики: —

  • Плато как PDF, так и CDF после определенного момента.
  • E(Y) = 1 / 𝜆
  • Var(Y) = 1 /𝜆²
  • Мы часто используем натуральный логарифм для преобразования значений таких распределений, поскольку у нас нет таблицы известных значений, таких как нормальное или хи-квадрат.

Пример и использование: —

  • Часто используется с динамически изменяющимися переменными, такими как трафик онлайн-сайтов или радиоактивный распад.

ЛОГИСТИЧЕСКАЯ РАСПРЕДЕЛЕНИЕ

Непрерывное логистическое распределение наблюдается при попытке определить, как непрерывные переменные входные данные могут повлиять на вероятность бинарного результата.

Обозначение: —

  • Y ~ Логистика(μ, s)

Основные характеристики: —

  • E(Y) = μ
  • Var(Y) = s² xπ² / 3
  • Функция CDF активизируется, когда мы достигаем значений, близких к среднему.
  • Чем меньше параметр масштаба, тем быстрее он достигает значений, близких к 1.

Пример и использование: —

  • Часто используется в спорте, чтобы предвидеть, как производительность игрока или команды может определить исход матча.