Публикации по теме 'statistics'


Цепь Маркова Монте-Карло
Повышение вашего понимания MCMC до среднего уровня Когда я изучал цепь Маркова Монте-Карло (MCMC), мой инструктор сказал нам, что есть три подхода к объяснению MCMC. «Базовый : MCMC позволяет нам использовать компьютеры для сбора байесовской статистики. Промежуточный : MCMC - это метод, который может найти апостериорное распределение интересующего нас параметра. В частности, этот тип алгоритма генерирует моделирование Монте-Карло способом, основанным на свойстве Маркова, а затем..

Как визуализировать центральную предельную теорему в Python
Центральная предельная теорема утверждает, что выборочное распределение выборочных средних приближается к нормальному распределению по мере увеличения размера выборки. Средние выборки будут сходиться к нормальному распределению независимо от формы генеральной совокупности. То есть популяция может быть смещенной в положительную или отрицательную сторону, нормальной или ненормальной. Центральная предельная теорема тесно связана с Законом больших чисел, который гласит, что: По мере..

Распределение данных против выборочного распределения
Комплексное математическое исследование Добро пожаловать в увлекательное путешествие по миру статистики, где мы собираемся приступить к исследованию двух наиболее фундаментальных и увлекательных концепций: распределения данных и выборочного распределения. Целью этой статьи является не только определение и описание этих терминов, но и раскрытие сложной математической красоты, скрывающейся за ними. Независимо от того, являетесь ли вы опытным статистиком или любопытным новичком, это..

Критерий хи-квадрат — Поправка Йейта на непрерывность в R
Поправка Йейтса на непрерывность используется в конкретном сценарии при проверке независимости в таблице сопряженности. Определение Чтобы понять статистику хи-квадрат Пирсона с использованием распределения хи-квадрат, необходимо предположить, что непрерывное распределение хи-квадрат может представлять дискретную вероятность наблюдаемого биномиальные частоты в таблице. В этом предположении есть предвзятость. Чтобы исправить это смещение, мы делаем Коррекцию непрерывности Йейта на..

Преодоление ограничений традиционных экспериментов с помощью Holdout Testing
В этой совместной статье Apratim Mukherjee и Rudrendu Paul делятся своим опытом в области методов тестирования Holdout в продуктовом бизнесе. Опираясь на свой опыт работы в сфере высоких технологий, авторы предоставляют подробный обзор различных типов и приложений статистических методов, используемых для оценки эффективности моделей машинного обучения на новых данных. Введение Тестирование на выносливость Тестирование удержания — это статистический метод, используемый для..

Машинное обучение: понимание целей центрирования и масштабирования
Использование преобразователей (MinMaxScaler, StandardScaler, RobustScaler) Введение В этой статье представлены концепции центрирования и масштабирования. На примере реального использования я объясняю преимущества центрирования и масштабирования данных. Углубляемся в простые расчеты и пояснения, рассматривая готовые методы Scikit-Learn. Технически мы сравниваем MinMaxScaler, StandardScaler и RobustScaler. Они являются частью методов преобразователей, облегчающих предварительную..

Выбор подходящего коэффициента корреляции
Обзор концепции корреляции и ее использования в проектах по науке о данных. Автор сценария : Юваль Коэн , Дэвид Грабуа Введение: Один из самых фундаментальных вопросов статистического обучения — взаимосвязь между переменными. Оценка степени связи между двумя переменными может помочь принять правильные решения в повседневных задачах, связанных с наукой о данных, по разным причинам: Уменьшите сложность модели — реализуя выбор признаков на основе корреляции. Уменьшите..