Это последняя неделя 2019 года, и большинство людей, включая меня, уже перешли к 2020 году, размышляя — анализируя 2019 год — лелея уроки и достижения 2019 года — планируя лучший 2020 год!

Аналитика данных, машинное обучение, искусственный интеллект и большие данные — это модные слова почти во всех вертикалях/отраслях, особенно в здравоохранении, науках о жизни и фармацевтической промышленности. Молодые специалисты много раз спрашивали меня, какие ключевые понятия в биостатистике, эпидемиологии и анализе данных необходимо освоить? Эта заключительная статья года частично предназначена в качестве моих рекомендаций, кратких советов и приемов для всех молодых специалистов, работающих в области науки о данных, прикладной статистики, и особенно для тех, кто занимается аналитикой данных в здравоохранении, таких как Healthcare — Life Sciences — Clinical Sciences. . Вот некоторые из выводов, полученных из опыта и практики биостатистики, эпидемиологии, управления здоровьем населения, работающих с реальным мировым здравоохранением и клиническими данными. Они предназначены больше как указатели на обучение.
Вот мои 5 лучших советов и выводов:

1) Хорошо знать, что такое стандартный дистрибутив, знать, почему он стал стандартным инструментом моделирования. Тем более знайте его ограничения в медицинских данных !!
2) Несмотря на обучение на уровне STAT101, но часто забываемое (или часто упускаемое из виду маркетологами), ясно понимать, что корреляция НЕ является причинно-следственной связью
3) Знать и четко понимать типы распределения статистической выборки. Применяйте различные распределения, насколько это возможно, к любым данным, а затем попытайтесь найти подходящее для ваших данных.

4) Тест хи-квадрат - это один из тестов, который поможет вам в области анализа данных здравоохранения, эпидемиологии и даже чистой статистики.

5) Это моя любимая Центральная предельная теорема (ЦПТ). На мой взгляд, если кто-то спросит меня об одной концепции, которая является универсальной и охватывает различные области аналитики, науки о данных и занимает центральное место в проверке гипотез, прогнозной аналитике и использует больше всего .. это CLT! период !

Что такое CLT и почему это важно (см. также ссылку на учебник)

  • Центральная предельная теорема (ЦПТ) утверждает, что распределение выборочных средних приближается к нормальному распределению по мере увеличения размера выборки.
  • Размеры выборки, равные или превышающие 30, считаются достаточными для удержания CLT.
  • Ключевым аспектом CLT является то, что среднее выборочных средних и стандартных отклонений будет равно среднему значению генеральной совокупности и стандартному отклонению.
  • Достаточно большой размер выборки может точно предсказать характеристики генеральной совокупности.

Вот ссылка на учебник по CLT, который я бы порекомендовал

Я инвестирую время и прилагаю усилия, чтобы понять CLT

  • CLT похожа на классическую музыку хиндустани.. в том смысле, что она раскрывает «рааг» в новой форме каждый раз, когда артист выступает!
    -Понимание применения CLT — это непрерывный процесс обучения. . Его значение можно найти во всем: от предсказания политических выборов до вероятности того, что кто-то выиграет в лотерею в определенный день, до неэффективности звездного игрока команды премьер-лиги во время ключевого матча до результата терапии в определенной когорте. предметов !
  • Сохраняйте веру в CLT .. никогда не недооценивайте силу CLT !! Тогда жизнь Data Scientist будет легкой прогулкой!
  • Если вы хорошо понимаете CLT, большая часть вашей работы по науке о данных наполовину сделана!!
  • Научитесь применять критерий хи-квадрат. Он решит большинство ваших аналитических проблем и даст вам четкое представление о данных и визуализации данных!
  • CLT учит вас чему-то новому каждый день вашей жизни .. до самой смерти !! (а может быть и после этого!)

Прощай 2019 .. ты был хорош .. 2020 будет лучше !

Вот ссылка на мой личный блог с моим последним блог-постом года о философии, которая направляет мою жизнь и профессиональную карьеру: Празднование того, чтобы быть живым!

Бхайрави года 2019 — Страдание облагораживает тебя.. делает тебя лучше!