КОДЕКС

Биномиальное распределение - Учебное пособие по вероятностям с Python

Биномиальное распределение - глубокое погружение в дискретное распределение вероятностей случайной величины с примерами на Python

В этой статье мы подробно рассмотрим биномиальное распределение. мы увидим вывод среднего и дисперсии биномиального распределения.

Оглавление:

  1. Что такое случайная переменная?
  2. Типы случайных переменных?
  3. Дискретная случайная переменная?
  4. Непрерывная случайная переменная.
  5. Распределения вероятностей.
  6. Вероятностные массовые функции
  7. Функции плотности вероятности
  8. Кумулятивные функции распределения
  9. Среднее значение биномиального распределения.
  10. медиана биномиального распределения
  11. режим биномиального распределения.
  12. Дисперсия биномиального распределения.
  13. Стандартное отклонение биномиального распределения.
  14. Среднее отклонение биномиального распределения.
  15. Асимметрия биномиального распределения.
  16. Реализация Python.
  17. Ресурсы.
  18. Заключение.

Что такое случайная переменная?

Случайная величина - это функция, которая присваивает действительное число каждому результату в пространстве выборки случайного эксперимента. Случайная величина, которая может принимать только конечное число или бесконечную последовательность значений. Это означает, что здесь присутствует некоторая случайность.

Обозначение используется, чтобы различать случайную величину и действительное число.

Случайная величина обозначается заглавной буквой, например X. После проведения эксперимента измеренное значение случайной величины обозначается строчной буквой, например x = 70 миллиампер.

Свойства:

  • Каждому конкретному значению случайной величины можно присвоить некоторую вероятность.
  • Объединение всех вероятностей, связанных со всеми различными значениями случайной величины, дает значение 1 (целое).

Примеры:

  1. Предположим, что кубик брошен дважды и нас интересует, сколько раз появляется нечетное число. Пусть X будет количеством появлений нечетного номер. Если кубик брошен дважды, нечетное число может появиться "0" умноженное на (т.е.. Мы можем иметь четное число, оба раза ) или один раз (т.е., у нас может быть нечетное число в одном броске и четное число в другом броске ) или дважды (т.е.. у нас может быть нечетное число одновременно ). Здесь X может принимать значения 0, 1, 2 и является переменной величиной, ведущей себя случайным образом, и поэтому мы можем назвать ее «случайной величиной» . Также обратите внимание, что его значения действительны и определены в пространстве выборки.

Вот примерное пространство:

Вот результат каждого значения, которое может принимать X (x - случайная величина).

Вероятность каждого исхода:

2. Другой пример случайной величины - результат подбрасывания монеты. Рассмотрим распределение вероятностей, при котором вероятность появления результатов случайного эксперимента не одинакова. Если случайная переменная, X - это количество голов, которое мы получаем от подбрасывания двух монет, то X может быть 0, 1 или 2. Это означает, что при подбрасывании двух монет у нас может не быть орла, одной или обеих орлов.

Типы случайных переменных:

  1. Дискретная случайная величина
  2. Непрерывная случайная величина

Дискретная случайная переменная:

Случайная величина называется дискретной случайной величиной, если она имеет конечное или счетное возможное количество значений. Счетное количество значений означает значения, которые могут быть расположены в последовательности, то есть значения, которые имеют взаимно однозначное соответствие с набором натуральных чисел, то есть на основе трех-четырех последовательных известных терминов.

Дискретная случайная величина не всегда представляет собой счет. у нас может быть дискретная случайная величина, которая принимает значения 1.5, 2.5 и 3.5. Они не учитывают данные, но у нас есть три возможных значения, так что это будет дискретная случайная величина.

Пример дискретной случайной величины:

  • Количество лотерейных билетов, купленных до первого выигрышного билета - Ну, мы можем получить выигрышный билет по нашему первому выигрышному билету, или нам, возможно, придется дождаться второго билета, или нам, возможно, придется дождаться третьего билета, чтобы это произошло. прочь до бесконечности. О, бесконечность слова кажется некрасивой, но это все равно счетное количество значений. Это по-прежнему наша дискретная случайная величина.
  • Количество курсов, которые принимает случайно выбранный студент университета - здесь возможные значения: 0 (в некоторых ситуациях студент не посещает курсы), 1, 2 и 3. Здесь есть некоторые максимальные значения. Так что это все еще счетное количество значений. Это будет дискретная случайная величина.
  • Количество царапин на поверхности.
  • Доля дефектных деталей на 1000 протестированных.
  • Количество переданных битов, полученных с ошибкой.
  • Количество планет вокруг звезды.

Непрерывная случайная переменная:

Говорят, что непрерывная случайная величина может принимать все значения в интервале. Случайная величина называется непрерывной случайной величиной, если она может принимать все возможные действительные (то есть целые, а также дробные) значения между двумя определенными пределами.

Пример непрерывной случайной величины:

  • Температура города в различные моменты времени в течение дня является примером непрерывной случайной величины, поскольку температура принимает бесчисленные значения, то есть может принимать и дробные значения. Это будет непрерывная случайная величина, потому что она может принимать значения в определенном диапазоне или пределах.
  • Например, вероятность того, что спортсмен финиширует за ровно 10 секунд, очень-очень мала, то есть почти равна нулю, поскольку очень редко удается финишировать за фиксированное время. Здесь вероятность указана для интервала, то есть нас может заинтересовать определение в качестве вероятности того, что спортсмен завершит гонку в интервале, скажем, от 10 до 12 секунд.
  • Пусть непрерывная случайная величина X обозначает ток, измеренный в тонкой медной проволоке в миллиамперах. Предположим, что диапазон X (измеренный в мА) равен [0, 20].
  • Пусть X = длина в метрах.
  • Пусть X = температура в ◦F.
  • Пусть X = время в секундах.

Вероятностная массовая функция (PMF):

Функция массы вероятности (PMF) - это функция, которая дает вероятность того, что дискретная случайная величина в точности равна некоторому значению.

Пусть X - дискретная случайная величина, которая принимает значения \ x1, \ x2,… и пусть P [X = xi] = p (xi). Это называется вероятностной функцией масс. где p (xi), i = 1,2… определено для значений x1, x2, …… ..

Пусть X - дискретная случайная величина, которая может принимать значения x = 0,1,2 ……, тогда P [X = xi] = p (xi) называется PMF, если она удовлетворяет следующим свойствам.

Примечание. Итак, дискретная случайная величина представлена ​​функцией массы вероятности.

Свойства:

  1. Сумма всех вероятностей в PMF должна быть 1.

2. Все возможные значения вероятности должны быть больше или равны 0.

Функции плотности вероятности (PDF):

Пусть X - непрерывная с.в. принимая значения в определенных диапазонах α ≤ X ≤ b, тогда функция P (X = x) = f (x) называется функцией плотности вероятности, если она удовлетворяет следующим свойствам.

Примечание. Функция плотности вероятности f (x) может использоваться для описания распределения вероятностей непрерывной случайной величины X.

Свойства:

  1. Все возможные значения вероятности должны быть больше или равны 0.

f (x) ≥ 0

2. Сумма всех вероятностей в PMF должна быть 1.

3. Вероятность того, что X находится между a и b, определяется как интеграл от f (x) от a до b.

Биномиальное распределение:

Биномиальное распределение - очень важное дискретное распределение вероятностей. Биномиальное распределение имеет две возможные вероятности исхода: УСПЕХ или НЕУДАЧА в случайном эксперименте, который повторяется несколько раз.

В основе биномиального распределения лежат предположения о том, что для каждого испытания существует только один результат, что каждое испытание имеет одинаковую вероятность успеха и что каждое испытание является взаимоисключающим или независимым друг от друга

Биномиальные распределения также должны соответствовать следующим трем критериям:

  1. Испытания независимы. Это означает, что результат одного исследования не влияет на результат любого другого исследования.
  2. Каждое испытание дает только два возможных результата, помеченных как «успех» и «неудача».
  3. Испытания зафиксированы. Другими словами, вы можете рассчитать вероятность того, что что-то произойдет, только если вы сделаете это определенное количество раз. Это здравый смысл - если вы подбросите монету один раз, вероятность получить хвост составляет 50%. Если вы подбросите монету 20 раз, ваша вероятность получить хвост очень, очень близка к 100%.

Определение:

Говорят, что дискретная случайная величина X подчиняется биномиальному распределению с параметрами n и p, если она принимает только конечное число неотрицательных целочисленных значений, а ее функция массы вероятности задается следующим образом:

  • для x = 0,1,2,3, …… n
  • Где P (Успех) = p, вероятность успеха в одном испытании, и она остается постоянной от испытания к испытанию.
  • P (Неудача) = 1 - p = q, вероятность неудачи в одном испытании
  • X представляет количество успехов в n попытках.
  • n = количество испытаний.

Примеры:

  1. Если новое лекарство вводится для лечения болезни, оно либо лечит болезнь (это успешно), либо не лечит болезнь (это неудача).
  2. Если вы покупаете лотерейный билет, вы либо выиграете, либо нет. По сути, все, о чем вы можете подумать, может быть только успехом или неудачей и может быть представлено биномиальным распределением.
  3. Сбалансированный шестигранный кубик бросается трижды. Какова вероятность того, что 5 выпадет ровно дважды - мы определим успех как выпадение 5, а неудачу как выпадение чего-либо, кроме 5.

Среднее биномиальное распределение:

Среднее значение - это мера центра или середины распределения вероятностей.

Ожидаемое значение или среднее значение биномиального распределения рассчитывается путем умножения количества испытаний на вероятность успеха. Среднее значение биномиального распределения равно np.

среднее или ожидаемое значение дискретной случайной величины X обозначается как μ или E (X), тогда

С помощью приведенной выше формулы мы можем получить среднее значение биномиального распределения.

Среднее значение биномиального распределения:

Дисперсия биномиального распределения:

Дисперсия - это мера дисперсии или изменчивости распределения. Дисперсия говорит нам о том, насколько данные распределены по обширной территории или распределению.

Дисперсия дискретной случайной величины X, обозначенной как σ2 или V (X), поэтому

С помощью приведенной выше формулы мы можем получить дисперсию биномиального распределения.

Дисперсия биномиального распределения:

Стандартное отклонение биномиального распределения

Стандартное отклонение - это средняя степень изменчивости вашего набора данных. Он сообщает вам, в среднем, насколько далеко каждая оценка отличается от среднего значения. Он измеряет абсолютную изменчивость распределения; чем выше дисперсия или изменчивость, тем больше стандартное отклонение и больше будет величина отклонения значений от их среднего значения.

Низкое стандартное отклонение указывает на то, что значения имеют тенденцию быть близкими к среднему значению набора, в то время как высокое стандартное отклонение указывает, что значения разбросаны в более широком диапазоне.

Квадратный корень из дисперсии называется стандартным отклонением.

Стандартное отклонение дискретной случайной величины X обозначается как σ,

Стандартное отклонение биномиального распределения:

Реализация Python:

Возьмем формулировку проблемы: в прежние времена вероятность успеха любой попытки позвонить по телефону составляла 0,8. Итак, какова вероятность получить 7 успехов из 10 попыток?

Здесь вероятность успеха p = 0,8 и q = 0,2, количество следов n = 10, количество успехов x = 7 = k. Итак, функция массы вероятности

Ответ = 0,20133.

давай сделаем это на питоне

Гистограмма биномиального распределения:

Среднее:

Разница:

Стандартное отклонение:

Ресурсы.

[1] Биномиальное распределение, Википедия, https://en.wikipedia.org/wiki/Binomial_distribution

[2] Биномиальное распределение, SciPy.org, https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.binom.htm

[3] Дисперсия, стандартное отклонение, Википедия, https://en.wikipedia.org/wiki/Variance.

[4] В отношении ИИ: https://medium.com/towards-artificial-intelligence/bernoulli-distribution-probability-tutorial-with-python-90061ee078a.

[5] Гики для гиков, Код, https://www.geeksforgeeks.org/python-binomial-distribution/

[6] Биномиальное распределение, statisticshowto.com, https://www.statisticshowto.com/probability-and-statistics/binomial-theorem/binomial-distribution-formula/#:~:text=Worked%20Examples-,What% 20is% 20a% 20Binomial% 20Distribution% 3F, означает% 202% 2C% 20или% 20 дважды ).

Заключение:

Мы узнали, как использовать биномиальное распределение из реальной жизни. Биномиальное распределение. Мы увидели, как можно реализовать случайную переменную и биномиальное распределение в Python. Если этот учебник поможет вам легко понять, тогда хлопайте в ладоши по вашим выражениям.