Понимание p-значения на простом английском языке с примерами!

Насколько по моему опыту, изучение и понимание p-значения было трудной задачей, чтобы усвоить эту конкретную концепцию, требуется некоторое время. Вот почему я решил написать об этом и попытаться объяснить как можно больше простыми словами с некоторыми подходящими примерами.

Концепция p-значения является неотъемлемой частью логической статистики. Поскольку мы делаем наши выводы на выборочных данных, а не на всей популяции. Логическая статистика сообщает, что мы на самом деле оцениваем то, что нельзя измерить напрямую. Возьмем пример испытаний вакцины Covid-19, там мы оценивали ее эффективность на определенном количестве образцов, а не на всем населении во время испытаний.

При оценке результатов существует некоторая вероятность ошибок, и те значимые результаты, которые мы наблюдаем, могут быть получены из-за некоторых случайных факторов, например ошибок выборки и некоторых случайных вещей, которые могут произойти. Итак, чтобы количественно оценить наши результаты и показать, насколько уверенно мы оцениваем наши результаты на основе выборочных данных, когда появляется значение p. значение p определяется как «вероятность того, что результаты, по крайней мере, столь же экстремальные, как и результаты, полученные при анализе выборочных данных, обусловлена ​​случайностью». Далее это можно объяснить как вероятность получения наблюдаемой разницы (или большей) в мера результата, учитывая отсутствие различий между методами лечения населения. Значение p — это значение вероятности, и оно находится между 0 и 1.

Давайте возьмем пример препарата X, который помогает снизить вес. Здесь мы проводим эксперимент, чтобы проверить эффективность этого препарата. Во-первых, мы возьмем случайные выборки и разделим их на две группы группа A и группа B. Группа A получает плацебо или не получает активных ингредиентов и называется контролируемой группой, тогда как группа B получает препарат X. Начиная с эксперимента, мы будем наблюдать за индивидуальным весом обеих групп. и будет продолжаться до дня 30. Предположительно мы обнаружили, что в конце эксперимента средняя разница в группе А равна 0, тогда как в группе Б средняя разница в весе составляет 1 кг.

Если мы хотим сначала обобщить приведенные выше результаты для населения, нам нужно подумать, одинакова ли разница между весом людей, получающих эффект плацебо, и людей, принимающих препарат X!

Здесь мы определим нулевую гипотезу, которая утверждает, что разница между группами, получающими плацебо и препарат X, останется прежней. Затем мы определим, если значение null истинно, то каковы были бы шансы увидеть разницу в весе в 1 кг в группе, получавшей препарат X (группа B) из образца, по сравнению с группой плацебо( группа А). Чтобы узнать результаты нулевой гипотезы, мы будем использовать статистические тесты, такие как t-критерий, дисперсионный анализ и т. д., чтобы определить наше p-значение. И чем меньше p-значение, тем сильнее доказательство против нулевой гипотезы.

Если значение p для приведенного выше примера окажется равным 0,02 или прибл. 2% можно определить результаты следующим образом:

Если нулевая гипотеза верна (средние значения для двух совокупностей равны), то существует 2%-ная вероятность наблюдения большой (или большей) разницы, которую мы измерили в нашей выборке. Проще говоря, мы можем продолжить уточните, что разница в весе среди тех, кто получал препарат X, такая же, как и разница в весе у тех, кто получал плацебо, но вероятность потери веса на 1 кг (или более) между группами выборки составляет 2 %.

Этот 2%-й шанс может произойти из-за ошибки выборки или случайного шума. При выполнении случайной выборки могут быть шансы, что некоторые внешние факторы могут повлиять на результаты, например, образцы, которые были собраны для группы A, не имеют эффективных высокометаболических генов, которые не приводят к дальнейшей потере веса, тогда как образцы, которые были собраны для группы B, включают людей с генами высокого метаболизма, что приводит к более быстрому снижению веса. И эта случайная выборка происходит исключительно по совпадению, и это может повлиять на p-значение.

В заключение в статье хорошо объяснено значение p на основе примера с наркотиками и видно, что значение p колеблется от 0 до 1, когда значение p ближе к 0, у нас есть убедительные доказательства против нашей нулевой гипотезы. А p-значение помогает наблюдать за вероятностью получения разницы (или большей) в результате, учитывая, что не существует разницы между лечением двух групп населения.

Надеюсь, вам понравится это читать. Оставляйте свои критические отзывы и, пожалуйста, следите за мной в среде, чтобы узнать больше о таких темах, связанных с наукой о данных.

Ссылки

https://www.investopedia.com/terms/p/p-value.asp#:~:text=A%20p%2Dvalue%20is%20a,значимость%20of%20%20наблюдаемая%20разница.

Статистика в двух словах, Сара Босло О'РЕЙЛИ