Публикации по теме 'statistics'
Цепь Маркова Монте-Карло
Повышение вашего понимания MCMC до среднего уровня
Когда я изучал цепь Маркова Монте-Карло (MCMC), мой инструктор сказал нам, что есть три подхода к объяснению MCMC.
«Базовый : MCMC позволяет нам использовать компьютеры для сбора байесовской статистики. Промежуточный : MCMC - это метод, который может найти апостериорное распределение интересующего нас параметра. В частности, этот тип алгоритма генерирует моделирование Монте-Карло способом, основанным на свойстве Маркова, а затем..
Как визуализировать центральную предельную теорему в Python
Центральная предельная теорема утверждает, что выборочное распределение выборочных средних приближается к нормальному распределению по мере увеличения размера выборки.
Средние выборки будут сходиться к нормальному распределению независимо от формы генеральной совокупности. То есть популяция может быть смещенной в положительную или отрицательную сторону, нормальной или ненормальной.
Центральная предельная теорема тесно связана с Законом больших чисел, который гласит, что:
По мере..
Распределение данных против выборочного распределения
Комплексное математическое исследование
Добро пожаловать в увлекательное путешествие по миру статистики, где мы собираемся приступить к исследованию двух наиболее фундаментальных и увлекательных концепций: распределения данных и выборочного распределения. Целью этой статьи является не только определение и описание этих терминов, но и раскрытие сложной математической красоты, скрывающейся за ними. Независимо от того, являетесь ли вы опытным статистиком или любопытным новичком, это..
Критерий хи-квадрат — Поправка Йейта на непрерывность в R
Поправка Йейтса на непрерывность используется в конкретном сценарии при проверке независимости в таблице сопряженности.
Определение Чтобы понять статистику хи-квадрат Пирсона с использованием распределения хи-квадрат, необходимо предположить, что непрерывное распределение хи-квадрат может представлять дискретную вероятность наблюдаемого биномиальные частоты в таблице. В этом предположении есть предвзятость.
Чтобы исправить это смещение, мы делаем Коррекцию непрерывности Йейта на..
Преодоление ограничений традиционных экспериментов с помощью Holdout Testing
В этой совместной статье Apratim Mukherjee и Rudrendu Paul делятся своим опытом в области методов тестирования Holdout в продуктовом бизнесе. Опираясь на свой опыт работы в сфере высоких технологий, авторы предоставляют подробный обзор различных типов и приложений статистических методов, используемых для оценки эффективности моделей машинного обучения на новых данных.
Введение
Тестирование на выносливость
Тестирование удержания — это статистический метод, используемый для..
Машинное обучение: понимание целей центрирования и масштабирования
Использование преобразователей (MinMaxScaler, StandardScaler, RobustScaler)
Введение
В этой статье представлены концепции центрирования и масштабирования. На примере реального использования я объясняю преимущества центрирования и масштабирования данных.
Углубляемся в простые расчеты и пояснения, рассматривая готовые методы Scikit-Learn.
Технически мы сравниваем MinMaxScaler, StandardScaler и RobustScaler. Они являются частью методов преобразователей, облегчающих предварительную..
Выбор подходящего коэффициента корреляции
Обзор концепции корреляции и ее использования в проектах по науке о данных.
Автор сценария : Юваль Коэн , Дэвид Грабуа
Введение:
Один из самых фундаментальных вопросов статистического обучения — взаимосвязь между переменными. Оценка степени связи между двумя переменными может помочь принять правильные решения в повседневных задачах, связанных с наукой о данных, по разным причинам:
Уменьшите сложность модели — реализуя выбор признаков на основе корреляции. Уменьшите..