Публикации по теме decision-tree

Публикации по теме 'decision-tree'

Компромисс смещения и дисперсии для моделирования

Интуитивное понимание переобучения и недообучения с помощью моделей статистического обучения на примере. Мысленный эксперимент Предположим, мы пытаемся предсказать некоторые явления Y . Пусть X будет всеми другими переменными во вселенной, кроме Y , которые можно использовать для объяснения Y . Тогда существует некоторая функция g ( X ), которая наилучшим образом предсказывает Y . Наконец, давайте предположим, что Y , будучи случайным событием, невозможно точно предсказать...

Никакой золотой середины.

Эта запись предназначена для объяснения подхода, который я использовал при решении задачи прогнозирования в соревновании, в котором участвовал в прошлом году. Соревнование включало предсказание результата краткосрочных кредитов (N10,000-N50,000). Конкурс был проведен на Kaggle благодаря Data Science Nigeria и One Finance & Investment Limited. Я не собираюсь вдаваться в подробности, а вместо этого попытаюсь выделить важные шаги, которые я предпринял для решения проблемы и получения..

Упрощение машинного обучения: объяснение линейной регрессии, деревьев решений и нейронных сетей

Машинное обучение — это область компьютерных наук, в которой алгоритмы обучения распознают закономерности в данных и делают прогнозы на основе этих закономерностей. Доступно множество моделей машинного обучения, но три популярные модели — это линейная регрессия, деревья решений и нейронные сети. Прежде чем мы начнем, нажмите кнопку Подписаться , чтобы получать уведомления каждый раз, когда публикуется новый учебник. Линейная регрессия Линейная регрессия — это простая..

Алгоритм дерева решений

Что такое дерево решений? Деревья решений — это широко используемые алгоритмы машинного обучения с учителем. Они популярны из-за простоты интерпретации и широкого спектра применений. Они работают как для задач регрессии, так и для задач классификации. Дерево решений состоит из серии последовательных решений или узлов решений по некоторым функциям набора данных. Получающаяся в результате структура, похожая на поток, перемещается с помощью операторов условного управления или правил..

Руководство для начинающих по настройке гиперпараметров случайного леса

Введение в случайный лес Какой образ в первую очередь приходит вам в голову, когда вы думаете о «Случайном лесу»? Он вызывает в воображении образы деревьев и мистической и волшебной страны. И это то, что делает алгоритм случайного леса! Это ансамблевой алгоритм , который объединяет несколько деревьев решений и решает сложные проблемы, чтобы дать нам окончательный результат. Я сбился со счета, сколько раз я полагался на алгоритм случайного леса в своих проектах по машинному..

Категориальный признак в классификаторе дерева решений

Способен обрабатывать как числовые, так и категориальные данные. Однако реализация scikit-learn на данный момент не поддерживает категориальные переменные. — это утверждение, которое мы получили из документации scikit-learn . Да, деревья решений способны обрабатывать как числовые, так и категориальные данные. Теоретически это верно, но при реализации мы должны попробовать одно горячее кодирование для категориальных признаков перед обучением или тестированием модели. Всегда помните,..

Деревья решений

В этом посте мы поговорим об одном из самых важных алгоритмов машинного обучения, который называется деревьями решений. Они важны, потому что без них не были бы изобретены другие современные алгоритмы, такие как бэггинг и бустинг. Сначала давайте поговорим о плюсах и минусах, а затем перефразируем их один за другим по ходу дела. Преимущества: 1- Может использоваться как для классификации, так и для регрессии 2- Могут отображаться графически, поэтому их легко интерпретировать 3-..