Публикации по теме 'r'
Прогнозируйте отток клиентов с помощью машинного обучения
Прогнозировать скорость оттока
Для компании важно сохранить своих клиентов. Это просто анализ телекоммуникационных данных и моделирование.
1. Состав проекта (определение проблемы)
Кто покидает компанию? Какие услуги нужны компании? прогноз скорости оттока
2. Сбор данных
Вот данные [kaggle]( https://www.kaggle.com/blastchar/telco-customer-churn )
churn <- read.csv("~.csv")
3.ЭДА
Просто проверьте соотношение цели
#1
Важно определить соотношение..
Автоматическое обучение DAG — часть 2 — Просто потому что
Первоначально опубликовано на https://iyarlin.github.io 21 января 2020 г.
В предыдущем посте мы видели, что одно из основных отличий между классическим ML и Causal Inference — это дополнительный шаг использования правильного набора настроек для функций предиктора.
Чтобы найти правильный набор настроек, нам нужен DAG, который представляет отношения между всеми функциями, относящимися к нашей проблеме.
Одним из способов получения DAG является консультация экспертов в предметной..
Какой язык программирования следует изучить специалистам по данным в первую очередь?
Какой язык программирования следует изучить специалистам по данным в первую очередь?
R, Python, SQL или что-то еще?
Когда я начал свою первую настоящую работу в качестве дипломированного актуарного аналитика в 2000-х годах, первое, что сделал мой начальник, - это вручил мне экземпляр The Little SAS Book и посоветовал мне научиться SAS. .
У меня была работа, на которой мне нужно было уметь обрабатывать данные и подгонять к ним статистические модели, и я не собирался далеко..
Приложения R - Часть 4: Нелинейная регрессия
Всем привет!
В предыдущих разделах серии приложений R мы делали приложения, связанные с линейной регрессией и логистической регрессией. Вы можете получить доступ к моим статьям по ссылкам ниже:
Приложения R - Часть 1: Простая линейная регрессия Приложения R - Часть 2: Множественная линейная регрессия Приложения R - Часть 3: Логистическая регрессия
В этой части приложений серии R мы исследуем структуры данных, в которых взаимосвязь между переменными не является линейной, и..
Прогнозы на основе стандартных моделей в R
Фон
Stan ( http://mc-stan.org ) - вероятностный язык программирования для оценки гибких статистических моделей. Если вас интересует байесовское моделирование, обычно вам не нужно искать дальше Стэна. В нем есть почти все, что вам нужно для определения произвольно сложных моделей, явного указания предшествующих распределений и диагностики производительности моделей.
Однако одна область, в которой отсутствует Стэн, - это повторное использование оценочных моделей для прогнозирования новых..
R Еженедельник 2017–37 Социальные науки, Время, Сравнить
Выделять
Визуализация данных для социальных наук — практическое введение в R и ggplot2 Время тибблов: Тибблы с учетом времени Не сравнивай числовые значения (кроме случаев, когда это работает)
Инсайты
R Markdown для документов с логотипами, водяными знаками и фирменными стилями
Не сравнивай числовые значения (кроме случаев, когда это работает) Лето ggplot2 — ууууу! 👩💻🚙👯: Моя стажировка в GoogleDrive Написание и публикация моего первого пакета R
R в..
5 эффективных приемов Python и R для специалистов по данным
Полезные фрагменты кода на R и Python
Мы начали серию статей о советах и приемах для специалистов по данным (в основном на Python и R). Если вы пропустили предыдущие взносы:
Vol. 1:
10 советов и приемов для специалистов по данным Полезные фрагменты кода на R и Python betterprogramming.pub
Vol. 2:
10 удивительных советов и приемов для специалистов по данным Еще несколько полезных фрагментов..