Публикации по теме 'data-science'


10 не очень интуитивно понятных вещей о программировании на R
Зачем использовать R для науки о данных R традиционно считался предпочтительным языком вычислений статистиков и некоторых академических исследователей из-за большого количества доступных статистических пакетов и большого сообщества. Возможно, самая большая сила R заключается в простоте, с которой решаются задачи обработки данных и статистического анализа. Кроме того, такие пакеты, как ggplot2, генерируют высококачественную визуализацию, делая анализ данных и отчеты приятными,..

Использование машинного обучения для классификации писем с жестким отказом - часть 1
Эта серия статей призвана показать, как определять электронные письма с жестким отказом с помощью методов машинного обучения. В части 1 мы рассмотрим разработку функций и исследовательский анализ. Что такое жесткий отказ электронной почты? Эта терминология широко используется в маркетинге и относится к возвращенным сообщениям электронной почты , которые возникают, когда сообщение электронной почты отклоняется почтовым сервером. Есть два основных типа отскока: Жесткий возврат:..

(1/5) Развертывание прогностических моделей в науке — Получите реальную ценность для бизнеса из данных
Вам может показаться, что построение аналитической модели — это цель науки о данных. И ты был бы не один. Компании обычно жалуются, что около 70% аналитических проектов терпят неудачу, и главная причина не в плохих прогнозах. Это потому, что многие команды не знают, как финишировать. Существуют важные шаги, помимо создания прогностических моделей. Немного фона: Чтобы бизнес осознал ценность аналитики, модели науки о данных должны предоставляться заинтересованным сторонам и..

XGBoost, LightGBM или CatBoost - какой алгоритм повышения я должен использовать?
XGBoost, LightGBM или CatBoost - какой алгоритм повышения я должен использовать? Деревья с градиентным усилением стали популярными алгоритмами, когда дело доходит до обучения табличным данным. За последние пару лет нам посчастливилось иметь не только одну реализацию усиленных деревьев, но и несколько алгоритмов повышения, каждый со своими уникальными характеристиками. В этом блоге мы попытаемся определить, существует ли один настоящий убийственный алгоритм, который превосходит их..

Что магистр наук о данных может (и не может) сделать для вас
Недавно я получил степень магистра наук о данных после двух лет практической работы в аспирантуре. Учитывая некоторый интерес со стороны людей через LinkedIn и мои прошлые публикации на Medium, я подумал, что некоторым может быть полезно прочитать мою обратную оценку решения и то, что я получил больше всего из этого опыта. Я также хотел обсудить, чего вы должны и чего не должны ожидать от получения степени магистра. Если вы прочитали заголовок, закатили глаза и подумали: «Вот и снова,..

Обучение нейронной сети игре в блэкджек
Обучение нейронной сети игре в блэкджек Мы обучаем нейронную сеть, чтобы увидеть, может ли применение глубокого обучения улучшить нашу стратегию блэкджека В прошлый раз мы разработали код для имитации блэкджека. И с помощью этого моделирования мы обнаружили ключевые факторы преимущества казино . Вот краткий обзор наших предыдущих выводов: Казино получают преимущество над игроками в блэкджек, заставляя игроков действовать раньше дилера (и действовать на основе неполной..

Классификация звука с помощью сверточной нейронной сети
Сверточные нейронные сети (CNN) являются одной из наиболее эффективных сетевых моделей, используемых для классификации изображений, учитывая способность алгоритма обрабатывать входные нейроны окнами, улучшая время обучения и точность. Эти преимущества можно использовать для разработки надежной модели классификации с надлежащей предварительной обработкой данных. Проделанная здесь работа сильно повлияла на следующий алгоритм:..