Публикации по теме 'statistics'
Проверка гипотезы
Проверка гипотезы
Что это такое и как это сделать в Python
В этой короткой статье, которую я написал в соавторстве с Артуром Мелло , вы откроете для себя тестирование гипотез в новом свете и узнаете, как выполнять некоторые из его распространенных тестов на Python для ваших важных проектов по науке о данных.
Почему это актуально?
Гипотеза — это утверждение или предпосылка, которую мы хотим проверить. Проверка гипотез — это способ подкрепить ваши выводы данными более научным..
Понимание центральной предельной теоремы
Для того, чтобы получить здоровое и правильное понимание ваших данных, вам необходимо практическое знание статистики.
Центральная предельная теорема — одна из таких важных концепций, которая формулирует самые основы всей статистики и позволяет глубже погрузиться в нее. Я надеюсь, что у вас есть основные предварительные условия, такие как распределение данных, вероятности и т. д., прежде чем читать эту статью.
Прежде всего, формальное определение CLT гласит, что выборочное..
Все, что вам нужно знать о технике PCA в машинном обучении
Подробное объяснение наиболее широко используемого метода уменьшения размерности.
Кто-нибудь сталкивался с ситуацией, связанной с большим количеством переменных при построении модели, и беспокоился о низкой точности и эффективности? В таком случае вам на помощь придет анализ основных компонентов (PCA) ✌️
Что такое анализ главных компонентов (PCA)?
Это один из наиболее широко используемых методов уменьшения размерности для преобразования большего набора данных в меньший набор..
Байесовская статистика необходима каждому специалисту по анализу данных
Байесовская статистика в основе науки о данных
Наука о данных имеет глубокие корни в байесовской статистике, и вместо того, чтобы давать исторический фон сэра Томаса Байеса, я дам вам общий взгляд на байесовскую статистику, теорему Байеса и то, как использовать ее в качестве инструмента в вашей работе! Байесовская статистика укоренена во многих аспектах науки о данных и машинного обучения, поэтому прочная основа на этих принципах невероятно важна.
Теорема Байеса в ее основе..
10 статистических методов, которыми должны овладеть специалисты по данным
10 статистических методов, которыми должны овладеть специалисты по данным
Независимо от того, как вы относитесь к сексуальности Data Science, просто невозможно игнорировать непреходящую важность данных и нашу способность анализировать, систематизировать и контекстуализировать их. Опираясь на свои обширные данные о занятости и отзывы сотрудников, Glassdoor поставила Data Scientist №1 в своем списке 25 лучших рабочих мест в Америке . Таким образом, роль остается неизменной, но,..
Понятия науки о данных, объясненные пятилетнему ребенку
Простое описание технических концепций в интервью
Я видел много вопросов на собеседовании по науке о данных, в которых вас просят «описать мне [вставить концепцию науки о данных], как если бы я был пятилетним ребенком. Обсудив это с моей сестрой, которая учится на учителя начальной школы, мы решили, что этот вопрос немного преувеличен, возможно, для акцента или для того, чтобы привлечь внимание. Поэтому я решил сохранить броское название, но эта статья будет немного больше..
Почему вы должны выбирать свои гипотезы ДО того, как изучать данные
Сидя на уроке статистики, мой профессор часто повторял, насколько важно решить гипотезы, которые нужно проверить, прежде чем смотреть на данные. Он высмеивал идею интеллектуального анализа данных и заявлял, что любой, кто формулирует свои гипотезы после просмотра данных, обречен на провал.
Он никогда не говорил почему.
Я видел похожие мысли, отраженные в руководящих принципах по разработке медицинских испытаний: перед началом рандомизированного контрольного испытания для проверки..