Когда я изучал дистрибутив, поверьте мне, я смешивал две разные концепции друг с другом. Мы решили упростить эти запутанные вещи для учащихся, и это то, что мы упрощаем -

  1. Вернемся к вероятности
  2. Типы данных в распределении
  3. Распределения вероятностей

В разделе «Распределение вероятностей» мы собираемся понять различные распределения: Бернулли, Биномиальное, Геометрическое, Паскаль, Пуассона, Равномерное, Нормальное и т. Д.

Давайте начнем эту серию с понимания вероятности.

Возвращение к вероятности

Во многих задачах науки о данных нас просят предсказать значения некоторых переменных. Но в статистике многие события невозможно предсказать с полной уверенностью или уверенностью. В таких случаях мы выясняем их вероятность понять: «Насколько вероятно, что эти предсказания верны, используя идею вероятности».

Мы не сможем отдать должное вероятности, пока не поймем ее с помощью универсальных вероятностных примеров — Бросание монеты, Бросание кости/кубиков.

При подбрасывании монеты возможны два исхода — «орел» (H) и «решка» (T). Можно сказать, что вероятность приземления монеты на H составляет 1/2 (0,50), а вероятность приземления монеты на T составляет 1/2 (0,50). Когда бросается один кубик, мы можем получить 6 возможных исходов, т. е. 1, 2, 3, 4, 5, 6. Вероятность выпадения любого одного числа на кубике составляет 1/6 (0,16). Вы можете задаться вопросом, как мы получаем эти значения 0,50 или 0,16 в качестве вероятности.

На изображении выше показана формула вероятности. В случае с «бросанием игральной кости», если я спрошу: «Когда бросается игральная кость, какова вероятность того, что выпадет 3?» Игральная кость состоит из чисел от 1 до 6, и, следовательно, за один раз у нас может быть 3 только один раз. Таким образом, согласно формуле, определенной выше, возможен только 1 исход из 6 исходов.

P(выпадение 3 на кубике) = 1/6 = 0,16 или 16 %.

Таким образом, мы можем сказать —

Когда пользователь бросает кубик, есть 16% шанс, что он может получить 3, и это верно для любого другого числа, поскольку все события равновероятны.

Хватит уже о вероятности. Давайте разберемся, что такое статистическое распределение?

Вы знали?

Средний рост мужчины в Индии составляет 5 футов 5 дюймов.

Как кто-то может придумать это число? Бьюсь об заклад, без обследования это вообще невозможно. Тот, кто это сделал, взял достаточный образец, подсчитал рост каждого человека и разложил в ведра или в табличном формате. Что-то вроде ниже -

Из вышесказанного мы можем сделать вывод, что -

  • Средняя высота от 5 до 6 футов
  • Люди меньше 5 футов и выше 6 футов относительно редки.

Здесь мы разделили данные на 4 бина. Что, если мы используем меньший размер ячейки для измерений? Если мы сделаем это — мы получим более точные результаты следующим образом:

Если вы наблюдаете приведенный выше рисунок,

  • Большая часть данных находится на высоте от 5 до 6 футов.
  • Но мы можем быть более точными и сказать, что большая часть данных лежит в диапазоне от 5,25 до 5,75 футов.

Измеряя большее количество людей с использованием меньших ячеек, мы получаем более точные оценки того, как распределяется рост.

Мы также можем нарисовать кривую для аппроксимации гистограммы. Кривая рассказывает ту же историю, что и гистограмма.

  • Существует низкая вероятность получить высоту менее 5 футов и выше 6 футов, поскольку большая часть данных находится в диапазоне от 5 до 6 футов.

Таким образом, и гистограмма, и кривая являются распределениями. Так как это говорит нам, как распределяются вероятности измерений.

Типы данных в дистрибутивах

Обычно мы сталкиваемся с двумя типами данных:

  1. Дискретные.Дискретные данные могут принимать любое целочисленное значение. Пример: 0, 5, 100
  2. Непрерывный.Непрерывные данные могут принимать любое значение из диапазона значений. Пример: 2,34, 56,6

Типы вероятностных распределений

До сих пор мы видели некоторые основные предпосылки для понимания различных типов вероятностных распределений.

Распределение вероятностей — это не что иное, как таблица, которая дает вероятность (в таблице) для каждого значения случайной величины.

Существуют в основном два типа распределения вероятностей:

  • Дискретное распределение вероятностей
  • Непрерывное распределение вероятностей

При дискретном распределении — Случайная величина X может иметь дискретное (исчисляемое), обычно конечное число значений. Проще говоря, если случайная величина является дискретной величиной (что означает, что она содержит исчисляемые конечные значения), то ее распределение вероятностей называется дискретным распределением вероятностей.

Вот список часто используемых дискретных распределений в науке о данных:

  • Бернулли
  • Биномиальный
  • Отрицательный бином
  • Геометрический
  • Пуассон

Дискретная функция вероятности также известна как функция массы вероятности (PMF).

При непрерывном распределении — случайная величина X может иметь бесконечное число различных значений (обычно несчетных). Проще говоря, если случайная величина является непрерывной величиной, ее распределение вероятностей называется непрерывным распределением вероятностей.

Непрерывное распределение вероятностей отличается от дискретного распределения вероятностей следующими способами:

  • Выборочное пространство дискретного распределения вероятностей конечно, поэтому мы можем записать частоту каждого отдельного значения, тогда как для непрерывного распределения вероятностей выборочное пространство бесконечно, и мы не можем записать частоту каждого отдельного значения. Таким образом, непрерывное распределение не может быть выражено в табличной форме. Следовательно, непрерывное распределение вероятностей выражается в виде графика или уравнения.
  • Уравнение непрерывного распределения вероятностей известно как функция плотности вероятности (PDF).

Вот список часто используемых непрерывных распределений в науке о данных:

  • Равномерное непрерывное распределение вероятностей
  • Нормальное распределение
  • Стандартное нормальное распределение
  • Распределение T Стьюдента
  • Распределение хи-квадрат
  • Экспоненциальное распределение
  • Логистическая дистрибуция

Давайте сначала разберемся с дискретным распределением вероятностей, а затем рассмотрим непрерывное распределение вероятностей.

Дискретное распределение вероятностей

Равномерное дискретное распределение вероятностей

В этом типе дискретного распределения вероятность каждого исхода одинакова. Вот почему мы называем это «Единым», и поскольку оно дискретно, что означает, что у нас есть конечные (счетные) наборы чисел.

Таким образом, мы можем определить равномерное дискретное распределение вероятностей как -

Говорят, что дискретная случайная величина X имеет равномерное распределение, если вероятность каждого значения одинакова. Таким образом, мы можем определить PMF как 1/N

Как правило, мы обозначаем равномерное дискретное распределение вероятностей как U (a, b), где a и b не что иное, как диапазон значений. (а ‹ б)

Значения постепенно изменяются от самого низкого значения, a, до самого высокого значения, b.

a, a+1, a+2, a+3, . . . . b-3, b-2, b-1, b

Таким образом, мы можем сказать N (количество значений) = b-a+1

Универсальный пример вероятности броска игральной кости здесь подходит, так как вероятность выпадения случайной величины игральных костей в одном эксперименте одинакова.

Мы можем обозначить это как X ~U(1,6), что означает — переменная X следует равномерному дискретному распределению вероятностей в диапазоне значений от 1 до 6.

На приведенной выше диаграмме «Высота прямоугольника» задается PMF —

Высота прямоугольника = PMF = 1/N = 1/b-a+1

Если вы наблюдаете, как количество результатов увеличивается, высота прямоугольника уменьшается.

  • Общая PMF дискретного распределения вероятностей = 1/b-a+1
  • Ожидаемое значение E(X) дискретного распределения вероятностей = (a+b)/2
  • Дисперсия дискретного распределения вероятностей = (b-a+1)²-1/12

Пример -

Номер телефона выбирается случайным образом из справочника. Предположим, что X обозначает последнюю цифру выбранного телефонного номера. Найти вероятность того, что последняя цифра выбранного числа

  • 6
  • Менее 3
  • Больше или равно 8

Последняя цифра может быть любой от 0 до 9. Таким образом, здесь a = 0, а b = 9.

  • Последняя цифра 6, P(X=6) = 1/b-a+1 = 1/10 = 0,1
  • Меньше 3, что означает P(X=0,1,2) = 1/10 + 1/10 + 1/10 = 0,1 + 0,1 + 0,1 = 0,3
  • Больше или равно 8 означает, что P(X=8,9) = 1/10 + 1/10 = 0,1 + 0,1 = 0,2

Распределение Бернулли

Распределение Бернулли является частным случаем биномиального распределения. Но между ними тоже есть тонкая разница. Не волнуйтесь, как только мы поймем биномиальное распределение, разница между двумя распределениями станет ясна.

Распределение Бернулли — это дискретное распределение вероятностей одного испытания Бернулли.

Я уверен, что вы не поняли приведенное выше определение, так как есть технический термин — испытание Бернулли. Давайте сначала это поймем.

Испытание Бернулли — это статистический эксперимент, который имеет только два исхода. Например -

  • При подбрасывании монеты возможны два исхода: Орел или Решка.
  • Результат экзамена, есть два исхода: Pass или Fail
  • Матч по крикету или футбольный матч, вы либо выиграете, либо проиграете.

Помните, что эти два исхода взаимоисключающие друг друга, то есть они не могут случиться вместе. Вы либо выигрываете матч, либо проигрываете, но не можете иметь и то, и другое.

Теперь давайте еще раз обратимся к определению и попробуем упростить его.

Распределение Бернулли - это дискретное распределение вероятностей, которое имеет только два бинарных исхода 0 и 1 в одном испытании. С точки зрения вероятности 0 связан с 1-p (неудачей), 1 связан с p (успехом).

  • р = вероятность успеха
  • 1-p (q) = Вероятность отказа

В распределении Бернулли нам часто нужно присваивать 0 и 1 результатам. В общем, мы присваиваем 1 для успеха (здесь успех означает интересующий нас результат) и 0 для отказа (здесь отказ означает результат, который нас не интересует).

Ожидаемое значение E (X) распределения Бернулли изменяется в зависимости от того, как вы назначаете или маркируете свой результат.

  • E(X) = p … когда 1 = успех
  • E(X) = 1-p … когда 1 = Неудача

Мы также можем написать E(X) как:

E(X) = 1 * p + 0 * (1-p) … что в конечном итоге равно p

Таким образом, подставив p и 1-p в формулу дисперсии -

σ² = (X₀-μ)² * p(X₀) + (X₁-μ)² * p(X₁)

σ² = (0-p)² * (1-p) + (1-p)² * p

σ² = p * (1-p)

Биномиальное распределение

Я надеюсь, что вы поняли распределение Бернулли без каких-либо сомнений. Если да, то для вас будет легкой прогулкой понять биномиальное распределение.

В распределении Бернулли мы видели, что эксперимент или испытание повторяются только один раз. Подбрасывание монеты один раз и получение результата любого из двух является случаем распределения Бернулли, тогда как многократное подбрасывание монеты и получение результата любого из двух является случаем биномиального распределения. Вот и все. В этом разница.

Таким образом, мы можем определить биномиальное распределение как:

Биномиальное распределение — это дискретное распределение вероятностей, которое соответствует последовательности идентичных событий Бернулли.

В случае биномиального распределения необходимо соблюдать определенные правила, чтобы иметь такое распределение. Эти правила таковы:

  • У вас должно быть фиксированное количество испытаний
  • Испытания должны быть независимыми (исход одного испытания не влияет на другое) Возьмем пример двухкратного подбрасывания монеты, результат первого броска или испытания не влияет или не влияет на второй бросок или испытание.
  • Каждое испытание должно иметь только два исхода: Успех и Неудача.
  • Обратите внимание, что вероятность успеха остается неизменной во всех испытаниях.

Применение биномиального распределения должно ответить на вопрос, как показано ниже:

" Подбросьте правильную монету 3 раза, какова вероятность того, что выпадет 2 орла?"

Мы ответим на поставленный выше вопрос, но давайте сначала проверим, соответствует ли это биномиальным правилам или нет.

  • Фиксированное количество следов: Да, 3 попытки, упомянутые в приведенном выше примере.
  • Испытания должны быть независимыми: Да, результат одного следа не влияет на другие испытания.
  • Каждое испытание должно иметь два исхода: здесь H и T — два исхода.
  • Вероятность успеха остается одинаковой во всех трейлах: поскольку наша цель — получить решку 4 раза, а вероятность получить решку в каждом трейле остается одинаковой, то есть 1/2.

Попробуем решить приведенный выше пример с точки зрения вероятности. Во-первых, у нас будет выборочное пространство всех событий. Скажем, С

S = { ЧЧЧ, ЧЧЧ, ЧЧЧ, ЧЧЧ, ЧЧЧ, ЧЧ, ТЧ, ТТТ

Теперь, если вы посмотрите на это внимательно, есть только 3 исхода, которые дают нам 2 орла (H): HHT, HTH, THH.

Таким образом, вероятность выпадения двух орлов равна 3/8. Вот как вы рассчитываете, используя простые концепции вероятности. Но что, если вопрос приходит с большим числом, например: «Подбросьте правильную монету 1000 раз, какова вероятность того, что выпадет 501 решка?» В таком сценарии нецелесообразно вычислять вероятность, используя концепцию выборочного пространства. .

Теперь вы можете спросить, если не использовать демонстрационное пространство, как мы решим вышеуказанную проблему? Мы можем воспользоваться помощью комбинаторики, чтобы решить нашу проблему. Например, получение 501 решки из 1000 проб — это не что иное, как выбор 501 элемента из выборки из 1000.

Здесь n — количество испытаний, а x — количество успешных попыток, которые мы рассматриваем. По сути, мы проводим n испытаний Бернулли с параметром p и смотрим на x успехов среди n следов Бернулли. Это можно записать как

Таким образом, функция вероятности биномиального распределения определяется выражением

Конечно, биномиальное распределение выражается как X ~ Binomial(n, p), где n — это общее количество фиксированных испытаний, а p — вероятность успеха.

Теперь давайте узнаем ожидаемое значение E (x) и дисперсию биномиального распределения. В случае ожидаемого значения E(x) похоже на то, что мы видели в распределении Бернулли. Так как Бернулли был связан с одним испытанием, а биномиал связан с несколькими n следами.

Следовательно,

  • E(x) = p * n
  • σ² = n * p * (1-p)

Важное замечание о биномиальном распределении заключается в том, что, поскольку n означает, что фиксированное число испытаний увеличивается, и p, и (1-p) не бесконечно малы, оно хорошо аппроксимирует распределение Гаусса. Взгляните на ниже

Давайте рассмотрим несколько примеров, чтобы лучше понять биномиальное распределение:

  • Честная монета подбрасывалась 100 раз, какова вероятность того, что решка выпадет ровно 52 раза?

Здесь успех — это получение орла на монете, а неудача — это решка на монете. То, что мы дали, n = 100, x = 52, p = 0,5, q = 0,5

Давайте подключим эту информацию к функции Binomail,

P(X=52) = [100 ! / (100–52)! * 52!] * [0.5⁵² * 0.5⁴⁸]

P(X=52) = 0.07352

  • Вероятность того, что на кубике выпадет 4, равна 30%, а кости бросают 10 раз, найти вероятность того, что 4 выпадет ровно 8 раз, не более 8 раз.

Здесь успех - получить 4 на кости. А неудача — это выпадение 1,2,3,5,6 на кубиках. То, что мы дали, это n = 10, x = 8, p = 0,30, q = 0,70 … Для первого случая

P(X=8) = [10! / (10–8)! * 8!] * [0.30⁸ * 0.70²]

P(X=8) = 0.0014467

Во втором случае нас попросили рассчитать биномиальную вероятность для «не более» 8 раз. Таким образом, x = 0,1,2,3,4,5,6,7,8. В таком сценарии нам нужно рассчитать все x, а затем, используя правило сложения вероятности, нам нужно сложить эти числа вместе. Поскольку этот расчет немного велик, чтобы сделать его вручную, я предлагаю вам онлайн-калькулятор, чтобы решить эту проблему. Вот тот, который я использую

https://stattrek.com/online-calculator/binomial.aspx

Геометрическое распределение

Теперь мы узнаем о геометрическом распределении и сразу после него об отрицательном биномиальном распределении. Эти два распределения очень близки к биномиальному распределению или распределению Бернулли. Если вы разобрались с биномиальным распределением и распределением Бернулли, то понять их будет очень легко.

Геометрическое распределение — это дискретное распределение вероятностей, которое представляет количество испытаний, необходимых для достижения первого успеха.

Это полезно для моделирования ситуаций, в которых необходимо знать, сколько попыток, вероятно, необходимо для успеха, и, таким образом, имеет приложения к моделированию населения, эконометрике, возврату инвестиций (ROI) исследований и так далее.

Правила, которые мы упомянули в биномиальном распределении, применимы и здесь, поэтому я не буду здесь повторяться.

Теперь давайте сформируем PMF (функция массы вероятности) для геометрического распределения.

Чтобы добиться первого успеха на испытании xᵗʰ -

  • Первые испытания x-1 должны быть неудачными. Мы представляем неудачу как 1-p = q, а x-1 представляет испытания. Следовательно, [1-p]^x-1
  • Испытание xᵗʰ должно пройти успешно. Это п

Давайте получим PMF геометрического распределения, используя приведенную выше информацию,

Ожидаемое значение E(x) или среднее значение и дисперсия геометрического распределения определяются по формуле

  • μ = 1/p
  • σ = 1-p/p²

Пример:-

Кубик бросают до тех пор, пока не выпадет 6. Каково полученное геометрическое распределение?

Выше представлена ​​древовидная диаграмма рассматриваемого нами события. Если на кубике выпало 6, то мы останавливаемся, так как это соответствует нашей цели. Но, если не получается с первой попытки, пробуем вторую, третью и так далее.

При первом испытании мы можем получить 6, а можем и нет. Если мы получаем 6, то мы останавливаемся, а если нет, то переходим к следующему испытанию. Если мы хотим узнать вероятность конкретной «попытки», то -

P(Получение 6 на первом испытании) = 1/6

Приведенная выше вероятность говорит нам о том, что мы получим 6 с первой попытки. Если мы хотим найти вероятность того, что во втором испытании выпадет 6, то:

P(Получение 6 во втором испытании) = (5/6) * (1/6)

Здесь (5/6) обозначает неудачу в получении 1 6 в первой попытке. Таким образом, вероятность не получить 6 на первом испытании равна 5/6.

P(Получение 6 баллов в III испытании) = (5/6) * (5/6) * (1/6) = (5/6)² * (1/6)

P(Получение 6 на внутривенном испытании) = (5/6) * (5/6) * (5/6) * (1/6) = (5/6)³ * (1/6)

Вы можете видеть, как формируется узор. Поэтому мы можем сказать,

P( Получение 6 на n-й попытке) = (5/6)^n-1 * (1/6)

Это также можно изобразить графически, как на следующем рисунке.

В математической записи мы можем определить геометрическое распределение как

x ~ гео(P)

Отрицательное биномиальное распределение

Отрицательное биномиальное распределение очень похоже на биномиальное распределение с одним отличием:

  • В биномиальном распределении количество испытаний (значение n) фиксировано, тогда как в отрицательном биномиальном распределении мы продолжаем наш эксперимент до тех пор, пока не будет обнаружено «r» успехов.
  • В биномиальном распределении мы обычно ищем вероятность выпадения 8 орлов, если вы подбрасываете монету 10 раз, тогда как в отрицательном биномиальном распределении вы неоднократно подбрасываете монету и подсчитываете количество раз, когда монета падает орлом. Этот эксперимент продолжается до тех пор, пока вы не получите 8 орлов.

Давайте используем приведенную выше информацию и определим отрицательное биномиальное распределение -

Отрицательная биномиальная случайная величина (X) — это количество повторных испытаний, которые приведут к успеху «r» в отрицательном биномиальном эксперименте. Распределение вероятностей отрицательной биномиальной случайной величины называется отрицательным биномиальным распределением.

Примечание. Отрицательное биномиальное распределение также известно в мире статистики как «распределение Паскаля».

Чтобы рассчитать отрицательное биномиальное распределение вероятностей, нам нужно иметь значения x, r, p. Получив эти значения, мы можем рассчитать отрицательное биномиальное распределение, используя следующую PMF:

Если мы определим среднее значение отрицательного биномиального распределения как среднее количество испытаний, необходимых для получения «r» успехов, то среднее значение равно:

Дисперсия отрицательного биномиального распределения равна

Пример:-

Лицо, проводящее телефонные опросы, должно получить еще 3 заполненных опроса, прежде чем его работа будет завершена. По каждому случайно набранному номеру есть 9% шанс достучаться до взрослого, который заполнит анкету. Какова вероятность того, что 3-й завершенный опрос произойдет при 10-м звонке?

Здесь у нас есть x = 10, p = 0,09, r = 3. Давайте подставим эти значения в PMF, и мы получим -

P( x= 10, r=3, p=0.09) = (10–1) C (2–1) * 0.09³ * 0.91⁷

P(x, r, p) = 0.013

Распределение Пуассона

Допустим, наша задача состоит в том, чтобы подсчитать количество повторений события в заданной единице времени, расстояния, площади и объема. . Например -

  • Количество ДТП за день.
  • Количество телефонных звонков, поступивших в колл-центр в час
  • Количество бракованной продукции в процессе производства

Принимая во внимание вышеизложенное, вот как мы определяем распределение Пуассона

Распределение Пуассона — это дискретное распределение вероятностей, которое показывает, сколько раз событие может произойти в течение определенного времени, расстояния, площади и объема.

Теперь давайте посмотрим на важные характеристики распределения Пуассона.

  • Количество вхождений на каждом интервале или указанном континууме может варьироваться от НУЛЯ до БЕСКОНЕЧНОСТИ.
  • Он описывает распределение нечастых или редких событий
  • Каждое событие не зависит от других событий
  • Он описывает дискретные события в течение интервала или заданного континуума (время, расстояние, площадь и объем).
  • Ожидаемое количество вхождений E(x) предполагается постоянным на протяжении всего эксперимента.

Не бей головой, если не понял выше. Мы собираемся упростить ситуацию с помощью одного приложения. Но перед этим давайте посмотрим на PMF распределения Пуассона -

Здесь,

  • λ = # вхождений на указанном интервале или континууме
  • x = # вхождения, которые нас интересуют
  • e = База Natural Log, равная 2,1718282

Другое распределение, которое мы видели до сих пор, легко понять теоретически, но я считаю, что это не случай распределения Пуассона. Это можно лучше понять с помощью приложения. Давайте перейдем прямо к нему.

Применение:-

Допустим, вы управляете ресторанным бизнесом и хотите проверить, сколько клиентов посещают ваш ресторан во время закрытия, то есть с 22:30 до 23:00. (Возможно, вы хотите установить время закрытия вашего ресторана с помощью данных) Ваше наблюдение показало, что в среднем 8 клиентов обедают вне дома в это конкретное время. Вычислите вероятность того, что за определенный период времени в ресторане пообедают ровно 10 клиентов.

Давайте запишем, какие данные у нас есть, когда мы посмотрим на приведенный выше пример:

  • Наблюдаемое среднее значение составляет 8 клиентов, это # ​​случаев за указанный интервал. то есть λ
  • Здесь мы рассчитываем вероятность пообедать ровно 10 клиентов, это то, что нас интересует, таким образом, x = 10
  • e = 2.1718282

Подставьте это значение в приведенную выше формулу, чтобы получить желаемый результат.

Теперь я воспользуюсь помощью Excel для расчета кумулятивных вероятностей, чтобы вы лучше поняли.

Вышеприведенная таблица описывает распределение вероятностей по ранжированию значения x. Согласно характеристикам распределения Пуассона: значение x может варьироваться от o до ∞ (теоретически)

Выше гистограмма построена с использованием распределения вероятности Пуассона (таблица), и мы можем сделать следующие выводы:

  • P(x), где x равно 7 и 8, имеют одинаковое значение (приблизительно 0,14, показано зеленой полосой). Это означает, что вероятность прихода 7 или 8 клиентов одинакова. На среднее это не влияет.
  • После среднего значения 8 значение вероятности уменьшается.
  • Нам было интересно узнать вероятность прибытия 10 клиентов в заданный временной интервал примерно 0,1 (показана оранжевой полосой на графике).

В нашей задаче мы специально попросили рассчитать вероятность прибытия 10 клиентов в заданный временной интервал. Что, если мы хотим рассчитать более 10 клиентов, прибывающих в этот временной интервал? Это очень просто -

1-зеленый = оранжевый

Таким образом, мы должны рассчитать кумулятивную вероятность P(x ≤ 9), которая будет вероятностью всех зеленых полос, показанных ниже. В таблице выше посмотрите на кумулятивную вероятность x = 9, это даст нам P (x ≤ 9).

Таким образом, P(x ≤ 9) = 0,7166. Теперь мы добавим это в нашу формулу для расчета более 10 клиентов, прибывающих в этот временной интервал.

1-зеленый = оранжевый,

1–0,7166 = оранжевый

Следовательно, оранжевый = 0,2834.

Это означает, что вероятность прибытия 10 клиентов в данный временной интервал равна 0,2834.

Непрерывное распределение вероятностей

Равномерное непрерывное распределение вероятностей

Удивлены, увидев эту раздачу снова? Поверьте, это не то же самое. Мы видели единообразие в дискретном распределении, но также возможно иметь единообразие, когда данные непрерывны.

Во-первых, давайте поймем разницу между дискретным и непрерывным равномерным распределением с помощью следующей картинки.

  • В отличие от дискретного распределения, непрерывное распределение может иметь ценность.
  • Поскольку оно принимает непрерывные значения, оно образует прямоугольную форму (как показано выше). Таким образом, это распределение также известно как прямоугольное распределение.
  • Оба распределения имеют постоянную вероятность.
  • Примером непрерывного равномерного распределения является доставка пиццы. Когда вы заказываете пиццу из дома, ее доставляют от 20 до 30 минут.

Непрерывное распределение, определяемое двумя параметрами: a и b. Записывается как X ~ U (a, b)

  • а = минимум
  • б = максимум

В случае непрерывной случайной величины площадь под графиком должна быть равна 1

p * b-a = 1

Поэтому p = 1/b-a

Ожидаемое значение E(x) и дисперсия непрерывного равномерного распределения приведены ниже.

  • Ожидаемое значение E(x) есть не что иное, как средняя точка между a и b. Следовательно, E(x)=(a + B)/2
  • Var(X) = (b-a)²/12

Приложения:-

В среднем 30 мин. телешоу имеют 22 мин. самой программы. Предположим, что распределение вероятностей количества минут фактической программы равномерно распределено от минимума 18 минут. до 26 мин.

  • Какова вероятность P(x) шоу будет длиться не менее 25 мин. телепрограммы?
  • Какова вероятность того, что шоу завершится между 21 и 25 минутами телепередачи?
  • Какова вероятность того, что программа будет длиться от 22,32 до 24,77 минут?

Прежде чем мы решим вышеуказанные 3 задачи, давайте напишем, какая информация у нас есть. То есть а = 18, b = 26.

Теперь давайте посчитаем E(X), Var (X) и самое главное высоту прямоугольника.

  • E(x) = a + b / 2 = 18 + 26 / 2 = 22
  • Var(x) = (b-a)²/12 = (26–18)²/12 = 5,33
  • Высота прямоугольника = 1/b-a = 1/26–18 = 1/8 = 0,125

После того, как мы завершили вычисление высоты прямоугольника, мы можем решить поставленные задачи, нарисовав график. Вот почему нам нужно заранее рассчитать высоту прямоугольника.

  • Какова вероятность P(x) того, что шоу будет длиться не менее 25 минут. телепрограммы?

P(x) = X₂-X₁ / b-a = (26–25)/(26–18) = 1/8 = 0.125

Вероятность того, что шоу будет длиться (общее время) от 25 мин. до 26 мин. составляет ок. 12%

  • Какова вероятность того, что шоу завершится между 21 и 25 минутами телетрансляции?

P(x) = X₂-X₁ / b-a = (25–21)/(26–18) = 4/8 = 1/2 = 0.5

Вероятность того, что шоу будет длиться (общее время) между 21 мин. до 25 мин составляет ок. 50%

  • Какова вероятность того, что шоу будет длиться от 22,32 до 24,77 минут программы?

P(x) = X₂-X₁ / b-a = (24.77–22.32)/(26–18) = 2.45/8 = 0.306

Вероятность того, что шоу будет идти (общее время) с 22,32 до 24,77 минут, составляет примерно 30%.

Нормальное распределение

Данные могут быть распределены по-разному, они могут быть смещены влево, вправо или в распределении может не быть четкой закономерности. Но в реальной жизни существует множество сценариев, в которых данные могут быть сосредоточены вокруг среднего значения, образующего кривую в форме колокола. Здесь вы видите нормальное распределение.

Как мы уже говорили, существует множество реальных сценариев, в которых преобладает нормальное распределение. Позвольте мне выделить некоторые из них ниже -

  • Высота людей
  • Оценка IQ людей
  • Оценки на тесте
  • Бросаем кубик

Но что такое нормальное распределение?

Это непрерывное распределение вероятностей, симметричное относительно среднего значения, которое описывает, что данные собираются чаще или чаще вблизи своего среднего значения, чем данные, находящиеся далеко от среднего значения. Нормальное распределение также известно как Распределение Гаусса и Распределение кривой Белла, поскольку оно принимает форму Белла.

Есть много характеристик, связанных с нормальным распределением, которые необходимо понимать.

  • Он симметричен по своей природе.
  • В нормальном распределении среднее значение, медиана и мода аналогичны.
  • 50% значений меньше, а 50% значений больше среднего.
  • Эмпирическое правило позволяет определить долю значений, находящихся в пределах определенного расстояния от среднего значения. (Мы объясним это позже в этой части)

Параметры нормального распределения:

Здесь будут обсуждаться два параметра, связанных с нормальным распределением.

  • Среднее (мк)
  • Стандартное отклонение (σ)

Обратите внимание, что нормальное распределение не имеет своего положения или формы. Среднее значение распределения описывает его положение, а стандартное отклонение описывает его форму. Позвольте мне показать вам, что я имею в виду.

Давайте обсудим эти параметры более подробно:

Значит

Как мы уже говорили ранее, в нормальном распределении среднее описывает свое положение. Посмотрите на приведенный ниже пример: -

  • На графике определены 4 различных нормальных распределения: синее, красное, оранжевое и зеленое.
  • Распределение синего, красного и оранжевого цветов, имеющее среднее значение = 0 и стандартное отклонение 0,2, 1 и 5 соответственно. Таким образом, эти распределения помещаются в одно и то же место или позицию (с одинаковым средним значением), но с разными стандартными отклонениями. Поскольку стандартное отклонение не равно, форма распределений вообще не равна. Здесь мы можем заключить, что чем ниже стандартное отклонение, тем выше пик кривой. По мере увеличения стандартного отклонения форма распределения становится плоской (посмотрите на распределение Орейджа, имеющее стандартное отклонение = 5).
  • Среднее значение распределения Грина равно -2, поэтому позиция находится слева от 0.
  • Среднее значение распределения представляет собой любое числовое значение, но в зависимости от положительного или отрицательного значения оно помещается слева или справа от нуля. Очень важно понимать, что иногда вы оказываетесь в ситуации, когда нужно определить, имеют ли две выборки или две совокупности статистически разные средние значения. Например, если вы проводите эксперимент с двумя группами выборок или населения и хотите проверить, одинаковы ли средние значения двух групп или нет.

Стандартное отклонение

Стандартное отклонение в нормальном распределении представляет собой форму распределения (точнее, определяет его ширину). Стандартное отклонение определяет, насколько далеко значения в распределении от его среднего значения. Давайте лучше разберемся в этом, воспользовавшись приведенным выше дистрибутивом.

  • Тщательно проанализировав синие и оранжевые распределения, мы можем сделать вывод, что

«Чем меньше значение стандартного отклонения (σ), тем уже ширина и выше распределение. По мере увеличения стандартного отклонения ширина распределения увеличивается, а высота распределения уменьшается».

  • В приведенном выше примере синий и зеленый имеют более узкое распределение, поскольку значение σ равно 0,2 и 0,5 соответственно.
  • Когда распределение имеет более высокий пик (что означает более узкую ширину), выше вероятность того, что значения не упадут далеко от среднего. По мере увеличения разброса распределения также увеличивается вероятность того, что наблюдения будут дальше от среднего.

Мы не можем завершить обсуждение нормального распределения без описания эмпирического правила нормального распределения.

Эмпирическое правило нормального распределения

В статистике эмпирическое правило также известно как правило трех сигм, где каждая сигма представляет собой стандартное отклонение от среднего значения.

Ниже наблюдение можно сделать вывод сверху:

  • 68 % данных находятся в пределах 1 сигмы или 1 стандартного отклонения, т. е. μ-σ среднего
  • 95% данных находятся в пределах 2-сигма или 2-х стандартных отклонений, т.е. μ-2σ от среднего значения.
  • 99,7% данных находятся в пределах 3-сигма или 3-х стандартных отклонений, т.е. μ-3σ от среднего значения.
  • Почти все значения лежат в пределах трех стандартных отклонений от среднего.
  • Данные, отклоняющиеся от 3 стандартных отклонений, считаются выбросом.

Из-за % данных, связанных с каждым стандартным отклонением, это правило также известно как «Правило 68–95–99,7».

Пример. Рост 95 % учащихся в школе составляет от 1,1 м до 1,7 м.

В этом случае, во-первых, нам нужно найти среднее значение и стандартное отклонение, предполагая, что данные нормально распределены.

  • Среднее значение = (1,1 м + 1,7 м) / 2 = 1,4 м
  • 95% — это 2 стандартных отклонения по обе стороны от среднего (всего 4 стандартных отклонения), поэтому:

1 стандартное отклонение = (1,7–1,1 м) / 4 = 0,6 м / 4 = 0,15 м

Особый случай нормального распределения: стандартное нормальное распределение

Как мы видели, с помощью значений параметров можно изменить положение и форму нормального распределения. Таким образом, нормальное распределение может иметь множество различных положений и форм при изменении значения параметра. Однако в частном случае нормального распределения значения параметров оставались постоянными. Это среднее значение = 0, а стандартное отклонение = 1. Это распределение также известно как Z-распределение.

Нормальная случайная величина стандартного нормального распределения называется стандартной оценкой или Z-оценкой. Стандартная оценка или z-оценка представляет собой количество стандартных отклонений выше или ниже среднего значения.

  • Стандартная оценка +1,5 означает, что наблюдение на 1,5 стандартного отклонения выше среднего или среднего значения.
  • Стандартная оценка -1,5 означает, что наблюдение на 1,5 стандартного отклонения ниже среднего или среднего значения.
  • Помните, что среднее значение имеет z-оценку = 0.

Это и есть стандартное нормальное распределение. Но до сих пор мы не обсуждали, как нам нужно преобразовать нормальное распределение в стандартное нормальное распределение. Этот процесс известен как стандартизация. Как мы проводим стандартизацию? Путем расчета z-показателя. Чтобы стандартизировать данные, необходимо преобразовать необработанные измерения в Z-показатели.

Поэтому при стандартизации каждое значение в нормальном распределении вычитается из среднего и делится на стандартное отклонение по приведенной ниже формуле.

Поэтому обычно мы обозначаем значение как x, среднее значение как μ и стандартное отклонение как σ. Таким образом, приведенная выше формула становится.

где X = необработанное значение, которое необходимо преобразовать в z-оценку, μ = среднее значение совокупности, σ = стандартное отклонение совокупности.

Примечание. Процесс стандартизации позволяет сравнивать наблюдения и рассчитывать вероятности для разных групп населения. Простыми словами, это позволяет нам сравнивать яблоки с апельсинами.

Поскольку мы много раз говорим о сравнении яблок с апельсинами, давайте сделаем это практически, чтобы понять это. Сравним их вес. Представьте, что у нас есть яблоко весом 110 грамм и апельсин весом 100 грамм.

В этом случае, если мы сравним веса, данные в сыром виде, то легко сделать вывод, что яблоко весит больше, чем апельсин. Однако это неправильный способ сравнения, поскольку вес населения в обоих случаях разный. Таким образом, нам нужно стандартизировать его, преобразовав необработанное значение в z-оценку. В следующей таблице приведены предполагаемые параметры популяции.

Давайте посчитаем z-оценку: -

  • Яблоко: - (110–100) / 15 = 0,66.
  • Оранжевый: - (100–140) / 25 = -1,6

Наблюдая за числами, мы можем заключить, что:

  • Z-показатель для яблока положительный +0,66, что означает, что наше яблоко весит больше, чем среднее яблоко.
  • Z-показатель для апельсина отрицательный -1,6, что означает, что апельсин ниже среднего значения.

  • Используя Z-показатели, мы узнали, как каждый фрукт соответствует своему распределению и как они соотносятся друг с другом.

Стандартизация полезна, когда у нас есть нормальное распределение. Однако мы можем предвидеть, что данные распределяются таким образом (у нас не может быть нормального распределения каждый раз). Решающим фактором нормального распределения является то, что требуется много данных, и это не всегда так. Когда у нас меньше данных или размер выборки меньше 30; мы не будем рассматривать это как нормальное распределение данных до тех пор, пока не будет явно указано, что эта выборка является нормальной. Если размер выборки ограничен, это означает, что выбросы могут повлиять на анализ. Допустим, размер нашей выборки меньше 30, и в этом случае мы не предполагаем нормальное распределение. В таком сценарии мы можем использовать Т-распределение Стьюдента (это приближение небольшого размера выборки для нормального распределения).

Мы узнаем о распределении Стьюдента через некоторое время, но перед этим важно понять «Распределение по выборке» и «Центральную предельную теорему» в статистике.

Выборочное распределение

Общая идея выборочного распределения заключается в использовании выборки для оценки генеральной совокупности. Но каково распределение выборки?

Распределение выборки – это распределение вероятностей выборочной статистики, взятой из генеральной совокупности.

Позвольте мне объяснить, что я имею в виду под приведенным выше определением. Допустим, мы взяли m выборку из населения. Как только мы набираем m выборку, мы вычисляем ее статистику. Вычисление статистики означает вычисление среднего значения, стандартного отклонения, диапазона, пропорции и т. д. Это может быть что угодно, не только ограниченное средним значением, но и для целей понимания, мы вычисляем среднее значение каждой m выборки и обозначаем его как ( х-бар).

Как только мы вычисляем для m выборок, распределение известно как выборочное распределение выборочного среднего. Как я уже сказал вначале, цель выборочного распределения состоит в том, чтобы использовать выборку для оценки населения, что я имею в виду, используя выборочную статистику для оценки статистики населения. (Используйте для оценки μ)

Центральная предельная теорема (ЦПТ)

Центральная предельная теорема — основная теорема в области статистики. Ранее мы изучали выборочное распределение, которое послужит основой для этой теоремы.

Эта теорема говорит нам, что независимо от того, какую форму имеет распределение населения, распределение выборочных средних имеет приблизительно нормальное распределение, если размер выборки (n) достаточно велик

Предположим, что мы делаем выборку из совокупности, имеющей среднее и дисперсию.

Случай 1:-

При размере выборки › 30

Если n > 30, независимо от того, как выглядит популяция (перекос вправо или влево, в середине или в форме буквы U и т. д.). распространять их, то это будет нормальное распространение.

  • Как мы видели в распределении выборки, среднее значение выборки приближается к среднему значению генеральной совокупности.

  • Стандартное отклонение выборочного среднего не равно стандартному отклонению генеральной совокупности. Потому что стандартное отклонение выборки изменяется вместе со средним значением выборки. Имейте это в виду: больше выборка, меньше стандартное отклонение.

Случай 2:-

Когда Размер выборки (n) ≤ 30 И население нормально распределено

Если n ≤ 30 и мы указали "Население нормально распределено", то выборочное распределение выборочного среднего также нормально распределено.

Случай 3:-

Когда n ≤ 30 и у нас нет информации о распределении населения

Если исходная совокупность не имеет нормального распределения, распределение выборочных средних не будет нормально распределено, когда размер выборки мал.

Все вышеупомянутые случаи объясняются в виде таблицы ниже.

Распределение Стьюдента

В конце нормального распределения мы обсудили, как мы не можем предположить нормальное распределение, когда размер выборки ограничен (как правило, размер выборки ‹ 30). В сценарии с ограниченной выборкой, если вы помните, мы используем нечто, называемое t-распределением Стьюдента. Теперь давайте разберемся с t-распределением Стьюдента более подробно.

Распределение Стьюдента — это непрерывное распределение вероятностей, которое выглядит почти идентично нормальному распределению (только немного короче и толще), которое используется для оценки параметра совокупности, когда размер выборки невелик или стандартное отклонение совокупности неизвестно.

Когда у нас нет информации о стандартном отклонении популяции, это означает, что значение необходимо оценить, это увеличивает неопределенность, поэтому хвост в t-распределении толще, чтобы учесть эту дополнительную неопределенность, которая означает появление значений, отличных от среднего.

Зачем использовать дистрибутив t?

  • Согласно CLT, выборочное распределение статистики соответствует нормальному распределению, если размер выборки, взятой из совокупности, достаточно велик. Следовательно, мы знаем стандартное отклонение населения, поэтому мы можем вычислить z-оценку. После этого мы можем вычислить вероятности с помощью нормального распределения.
  • В реальном сценарии большую часть времени у нас нет информации о стандартном отклонении генеральной совокупности, или также может возникнуть ситуация, когда размер выборки мал. В таком сценарии мы не можем использовать z-оценку, мы должны использовать что-то, называемое t-оценкой / t-статистикой, используя приведенную ниже формулу.

Здесь x̄ = выборочное среднее | μ = среднее значение населения | S = стандартное отклонение выборки | n = размер выборки

Распределение t-статистики известно как t-распределение Стьюдента или просто t-распределение. В математике t-распределение записывается в символической форме следующим образом

X ~ t(k):случайная величина x подчиняется t-распределению с k степенями свободы.

У t-распределения есть только один параметр — «степени свободы». Давайте разберемся в этом подробнее.

Степени свободы

  • В статистике степени свободы (DF) указывают количество независимых значений, которые могут изменяться в анализе без нарушения каких-либо ограничений.
  • Как правило, степени свободы (DF) равны размеру вашей выборки за вычетом количества параметров, которые вы хотите оценить.
  • В t-тесте мы знаем, что когда у вас есть выборка и оценивается среднее значение, у вас есть n-1 степень свободы (DF) => Только один параметр, который мы оцениваем здесь. Вот почему n-1.

Ожидаемое значение E(x) и дисперсия t-распределения Стьюдента приведены ниже.

  • E(x) = μ …if k > 2
  • Var(x) = s² * k / k-2

Случаи использования:
распределение Стьюдента в основном используется при проверке гипотез, чтобы решить, принимать или не принимать нулевую гипотезу.

В приведенном выше двустороннем тесте

  • Область отторжения (область на двух хвостах) можно описать с помощью z-показателя или t-показателя.
  • Центральная область известна как область принятия, где, если ваши p-значения попадают где-то в этой области, ваша гипотеза будет принята.
  • Если ваш z-показатель или t-показатель меньше -1,96 и больше 1,96, ваша гипотеза будет отклонена.

Распределения Гаусса и распределения Стьюдента являются одними из наиболее важных непрерывных распределений вероятностей в статистике и машинном обучении.

Распределение Стьюдента можно использовать в качестве заполнителя для Гаусса, когда дисперсия генеральной совокупности неизвестна или когда размер выборки невелик. Оба тесно связаны друг с другом строгим и формальным образом.

Логнормальное распределение

Многие из нас знают о нормальном распределении, но, возможно, очень немногие знают о логарифмически нормальном распределении. Здесь я попытаюсь упростить эту концепцию понятным языком.

Логарифмически-нормальное распределение – это распределение вероятностей случайной величины, логарифм которой соответствует нормальному распределению.

Есть много реальных случаев, которые следуют логарифмически-нормальному распределению, например публикация комментариев на форумах, пребывание в Интернете и т. д.

В общем, большинство логарифмически нормальных распределений являются результатом использования натурального логарифма, основание которого равно e=2,718. Однако логарифмически нормальное распределение можно масштабировать с использованием другого основания, которое влияет на форму логарифмически нормального распределения.

Если случайная величина X имеет логарифмически нормальное распределение, то Y = ln(X) имеет нормальное распределение. Аналогичным образом, если Y имеет нормальное распределение, то экспоненциальная функция Y, т. е. X = exp(Y), имеет логарифмически нормальное распределение.

Пусть Z будет стандартной нормальной переменной, что означает, что распределение вероятностей является нормальным с центром в 0 и с дисперсией 1. Тогда логарифмически нормальное распределение определяется как распределение вероятностей случайной величины

Термин «логарифмически нормальный» происходит от результата логарифмирования обеих сторон:

Поскольку Z является нормальным, μ + σZ также является нормальным (преобразования просто масштабируют распределение и не влияют на нормальность), а это означает, что логарифм X нормально распределяется (отсюда и термин логарифмически нормальный).

На приведенном выше графике красное распределение с μ = 0 и σ = 0,25 имеет почти нормальное распределение. По мере увеличения дисперсии распределение смещается вправо, как показано на графике выше.

Примечание. Логарифмически-нормальное распределение в основном искажено.

Как проверить логарифмически нормальное распределение?

  • Шаг 1. Возьмите натуральный журнал нужной переменной.
  • Шаг 2. Используйте различные статистические тесты для проверки нормальности (график QQ и т. д.)
  • шаг 3: если шаг 2 выполнен успешно, мы можем сказать, что желаемая переменная имеет логарифмически нормальное распределение.

Распределение по степенному закону

В статистике степенной закон представляет собой функциональную зависимость между двумя величинами, при которой относительное изменение одной величины приводит к пропорциональному изменению другой величины. Можно сказать, что относительное изменение X вызывает пропорциональное относительное изменение Y.

Предположим, что приведенный выше график описывает продажи продуктов в соответствии со степенным распределением, где зеленый цвет описывает 80% от общего объема продаж, полученных 20% продуктов. Таким образом, видно, что продукты, которые находятся в левой области, которой немного, преобладают во всех продажах.

Пример: площадь квадрата

Area_of_Square =

  • Если длина квадрата равна 2, то площадь будет 2² = 4.
  • Если длина квадрата равна 4, то площадь будет 4² = 16.

Распределение по степенному закону имеет вид Y = k X^α, где:

  • X и Y представляют собой интересующие переменные,
  • α – показатель степени закона,
  • k является константой.

Если вы возьмете обратное степенному распределению, то Y = X^-1, которое также считается степенным. Так как изменение одной величины приводит к отрицательному изменению другой.

Степенной закон описывает экспоненциальное распределение, при котором несколько отдельных точек составляют большую часть значения в совокупности. Проще говоря, это принцип Парето (80:20) на стероидах:

Нормальное распределение предполагает, что все население будет распределено по территории, а подавляющее большинство людей будет находиться в районе среднего значения. Например, если бы вы построили график распределения весов всего взрослого населения страны, оно, вероятно, напоминало бы нормальное распределение — большая доля людей близка к среднему, а доля людей — нет. людей, падающих по мере того, как вы удаляетесь от среднего значения с обеих сторон.

С другой стороны, популяции, подчиняющиеся степенному закону, полностью смещены в одну сторону. Подумайте о распределении богатства — вы знаете, как они оперируют статистикой о том, что на 1 % людей приходится 50 % мирового богатства? Это степенной закон.

Некоторые примеры таких явлений с этим типом распределения:

  1. Распределение доходов,
  2. Сила землетрясения,
  3. Размер городов по населению.
  4. Продажи продукции компаний

Как проверить, подчиняются ли две величины степенному закону распределения или нет?

Шаг 1:

Запишите оба количества.

Шаг 2:

Постройте эти значения журнала друг с другом

Шаг 3.

Если они показывают линейную зависимость, это указывает на то, что две величины имеют степенное распределение. (Как показано ниже)

Распределение Парето

Как мы указали выше, распределение по степенному закону, это распределение Парето очень похоже на распределение по степенному закону.

Распределение Парето в просторечии стало известно как принцип Парето или «правило 80–20», а иногда его называют «принципом Мэтью». сильный>. Это правило гласит, что, например, 80% богатства общества принадлежит 20% его населения.

Всякий раз, когда распределение следует степенному закону, это не что иное, как распределение Парето. Распределение Парето — это асимметричное распределение с тяжелыми хвостами, которое иногда используется для моделирования этого распределения доходов. Основой распределения является то, что большая часть населения имеет низкий доход, в то время как лишь немногие люди имеют очень высокие доходы.

Математически распределение Парето обозначается как X ~ Парето(Xm, α)Здесь Xm можно рассматривать как μ и α. strong> можно рассматривать как σ (поскольку они почти одинаковы)

PDF распределения Парето определяется как

Наблюдения:

  • Xm равен 1 (см. диаграмму выше), что означает, что пик распределения равен 1.
  • Зеленая линия имеет альфа = 1, синяя линия имеет альфа = 2, красная линия имеет альфа = 3, а темная черная линия имеет альфа = бесконечность.
  • По мере того, как альфа уменьшается, упитанность в хвосте увеличивается. Вы можете заметить, что у зеленой линии хвост толще, чем у двух других.
  • Когда альфа становится/равняется бесконечности, PDF выглядит как дельта-функция (что означает, что она имеет только одно значение, а все остальное равно НУЛЮ)
  • Вы можете наблюдать черную линию, которая похожа на дельту, у которой все НУЛЬ, но с одним значением (т.е. 1), где можно увидеть пик. Такая функция называется Дельта-функция Дирака.

Читатели, мы видели множество распределений от дискретных до непрерывных. Я старался изо всех сил объяснить это очень доходчиво. Если вы по-прежнему считаете, что какие-то концепции неясны и нуждаются в отдельном объяснении, я сделаю отдельный пост, чтобы объяснить их более подробно. Не стесняйтесь комментировать ниже для этого.

Я сослался на диаграмму, некоторые ключевые понятия, определения с различных веб-сайтов. Я помещаю их в справочный раздел. Пожалуйста, проверьте и их.

Использованная литература:-