Теперь из моего предыдущего блога Статистика повсюду мы поняли, что статистика — это изучение данных и то, как мы можем использовать их для принятия обоснованных решений.

Существует два основных вида статистики:

  1. Описательная статистика
  2. Выводная статистика

Описательная статистика похожа на описание того, что вы видите. Это способ обобщить и представить данные таким образом, чтобы их было легко понять. Вот пример: представьте, что у вас есть мешок с шариками, в котором 20 красных, 10 синих и 5 зеленых шариков. Описательная статистика поможет вам описать содержимое сумки. Например, можно сказать, что красных шариков больше, чем синих или зеленых.

Описательная статистика используется для обобщения и описания данных. Эти статистические данные могут помочь нам понять характеристики набора данных, такие как центральная тенденция (типичное или среднее значение), изменчивость (насколько разбросаны данные) и распределение (как данные распределены по разным значениям). . Некоторые общие описательные статистики включают в себя:

1. Среднее: среднее арифметическое набора чисел. Например, среднее значение чисел 1, 2 и 3 равно (1+2+3)/3 = 2.

2. Медиана: среднее значение набора чисел, когда они расположены по порядку. Например, медиана чисел 1, 2 и 3 равна 2.

3. Мода: значение, которое чаще всего встречается в наборе чисел. Например, форма чисел 1, 2, 2 и 3 равна 2.

Диапазон: разница между наибольшим и наименьшим значениями в наборе чисел. Например, диапазон чисел 1, 2 и 3 составляет 3–1 = 2.

Вывод статистики похож на обоснованное предположение. Это способ использовать данные, которые у вас есть, чтобы делать выводы о большей группе вещей. Например, допустим, вы хотели узнать, какой цвет мрамора является самым популярным среди всех видов мрамора. Вы можете случайным образом выбрать 50 шариков из мешка и записать их цвета. Затем вы можете использовать логическую статистику, чтобы сделать предположение о том, какого цвета могут быть все шарики в мешке. Это пример использования логической статистики, чтобы сделать вывод о большей группе вещей на основе меньшей выборки данных.

Логическая статистика использует теорию вероятностей для оценки того, насколько вероятно, что конкретный результат мог произойти случайно. Некоторые распространенные статистические методы вывода включают:

1. Доверительные интервалы: диапазон значений, которые, вероятно, содержат истинное значение генеральной совокупности. Например, если бы мы хотели оценить средний рост всех людей в определенной стране, мы могли бы взять выборку людей и вычислить средний рост. Затем мы могли бы использовать логическую статистику для построения доверительного интервала, который сообщил бы нам диапазон значений, в пределах которого мы на 95% уверены, что истинное среднее значение генеральной совокупности находится.

2. Проверка гипотез: способ определить, является ли тот или иной результат статистически значимым (т. е. маловероятно ли его появление случайно). Например, если бы мы хотели проверить, является ли новое лекарство более эффективным, чем плацебо, мы могли бы случайным образом распределить одних пациентов на получение лекарства, а других — на плацебо, а затем сравнить результаты между двумя группами, используя логическую статистику. Если разница между группами достаточно велика, мы можем заключить, что лекарство действительно более эффективно, чем плацебо.

В следующей части этого блога мы углубимся в Центральную Тенденцию и ее общие Меры.