Публикации по теме 'statistics'


Как узнать, какой статистический тест использовать для проверки гипотез?
Когда какой тест использовать - Т-тест, Тест хи-квадрат, ANOVA. Статистика - неотъемлемая часть науки о данных и машинного обучения. Статистика - это подполе математики, которая относится к формализации отношений между переменными в форме математических уравнений. Он пытается найти отношения между переменными, чтобы предсказать результаты. Суть статистики - это изучение сбора, анализа, интерпретации, представления и организации. Существует множество статистических тестов для..

Все алгоритмы машинного обучения, которые вы должны знать в 2022 году
Интуитивно понятные объяснения самых популярных моделей машинного обучения Не забудьте подписаться здесь , чтобы не пропустить новую статью о руководствах по науке о данных, хитростях и советах, жизненных уроках и многом другом! В прошлом году я написал статью под названием Все алгоритмы машинного обучения, которые вы должны знать в 2021 году , так почему же я пишу еще одну для 2022 года? Неужели за последний год появилось так много новых алгоритмов? Ну нет. Но в этом..

Что такое Эксперименты? (Контрасты)
Дисперсионный анализ может дать нам указание на то, что не все группы лечения имеют одинаковую среднюю реакцию, но ANOVA сам по себе не говорит нам, какие методы лечения отличаются или чем они отличаются. Для этого нам нужно взглянуть на средства лечения или, что то же самое, на эффекты лечения. Один из методов изучения эффектов лечения называется контрастированием. Это позволяет нам сосредоточиться на конкретной узкой особенности данных. Контрасты принимают форму разницы между средними..

Введение в алгоритм Витерби
В последнем посте о скрытых марковских моделях (HMM) мы ни разу не решили проблему поиска наиболее вероятной последовательности используемых монет. Если вы не читали сообщение о HMM, я настоятельно рекомендую вам это сделать. Для тех из вас, кто этого не сделал, я обрисую проблему. Допустим, к вам подошел какой-то гуру и сказал вам взять монету из сумки (в сумке всего две монеты) и подбросить монету. Вы увидите либо голову, либо хвост. Затем вы кладете монету обратно в пакет и..

Углубленный взгляд на байесовское обновление
Его происхождение, теория и приложения. Статистический анализ — это аспект научных исследований и бизнес-стратегий, которые постоянно развиваются, чтобы помочь нам лучше понимать окружающий мир и ориентироваться в нем. В этой области модификация гипотез и прогнозов по мере представления новых фактов во многом зависит от байесовской корректировки ученых и бизнеса. Названный в честь преподобного Томаса Байеса, математика XVIII века, байесовский подход отличается от классического или..

Центральная предельная теорема (CLT) — На примере футболки
Я генеральный директор многомиллиардной компании (в моем самом смелом воображении;), которая собирается отпраздновать платиновый юбилей разнообразными мероприятиями в нескольких городах. В рамках мероприятий моя компания будет раздавать сладости, прохладительные напитки, а также футболки для сотрудников, которые будут одеты и придут по этому случаю. В моей компании 2 лакха сотрудников, и ожидается, что приедет около 1 лакха (исходя из предыдущих данных о праздновании Золотого юбилея)..

Хорошая модель (в науке о данных)
В науке о данных модели решают все . Мы, специалисты по данным, создаем их прототипы, делаем наброски. (Хорошие) модели изображают и изображают мир, людей, здания, взаимодействия и даже любовь — см. ниже. Но как построить хорошую модель? Как мы узнаем, полезно ли это? Как мы узнаем, является ли он представителем мира? Один из вопросов класса Профессор Гэри Кинг , который не дает мне покоя до сих пор, заключался в том, как мы будем моделировать человека. Например, это хорошая..