Публикации по теме random-forest

Публикации по теме 'random-forest'

Дерево решений вместе с пакетированием и бустингом охватывает большинство проблем науки о данных…

Знаете ли вы, что дерево решений, наряду с бэггингом и бустингом, являются одними из наиболее широко используемых методов в науке о данных (за исключением глубокого обучения)? Дерево решений может решать как проблемы регрессии, так и проблемы классификации, что делает его универсальным инструментом для анализа данных. По своей сути дерево решений начинается с исходных данных в качестве корневого узла и растет за счет создания узлов для группировки похожих выходных данных. Алгоритм..

Понимание случайного леса

Случайный лес — это тип алгоритма, используемый в машинном обучении для прогнозирования на основе набора данных. Это похоже на группу людей, работающих вместе над решением проблемы, где у каждого есть свое мнение и опыт. В Random Forest мы создаем несколько деревьев решений, используя случайные подмножества данных, а затем объединяем прогнозы каждого дерева, чтобы сделать окончательный прогноз. Думайте об этом как о голосовании — каждое дерево решений голосует за то, каким должен быть..

Приведите несколько ситуаций, в которых вы будете использовать SVM поверх алгоритма машинного обучения RandomForest и…

SVM и Random Forest используются в задачах классификации. а) Если вы уверены, что ваши данные свободны от выбросов и чисты, используйте SVM. Наоборот — если ваши данные могут содержать выбросы, тогда Random forest будет лучшим выбором b) Как правило, SVM потребляет больше вычислительной мощности, чем Random Forest, поэтому, если вы ограничены памятью, используйте алгоритм машинного обучения Random Forest . c) Random Forest дает вам очень хорошее представление о важности переменных в ваших..

Настройка гиперпараметра случайного леса

Случайный лес — это ансамблевый алгоритм машинного обучения, который объединяет несколько деревьев решений для создания более надежной и точной модели. Каждое дерево решений в лесу строится независимо путем случайного выбора подмножества обучающих данных и подмножества признаков для каждого разделения. В процессе обучения алгоритм случайного леса создает лес деревьев решений. Каждое дерево…

Изучение, визуализация и моделирование нападения Minnesota Vikings

После недолгих поисков я получил данные за весь сезон 2018 года от NFL savant . Поскольку в душе я фанат Миннесоты, я решил опробовать некоторые методы машинного обучения, чтобы выяснить, смогу ли я найти какие-то поддающиеся количественному измерению способы, в которых викинги могли потерпеть неудачу в прошлом году. Для некоторого начального EDA я решил посмотреть на накопленные ярды по пасам в разбивке как по месту паса, так и по приемнику. Я суммировал все приемные ярды для..

Featurestream.io - Случайные леса++

Наряду с глубоким обучением, Случайные леса являются одной из рабочих лошадок современной науки о данных. Они популярны, потому что с ними часто легко получить хорошие результаты, и они хорошо работают с низко- и среднеразмерными структурированными табличными данными (в отличие от многомерных неструктурированных данных, таких как текст, аудио, изображения), и особенно когда объем данных не велик. Этот пост посвящен некоторым улучшениям случайных лесов, которые мы разработали в..

Информация о предложениях Starbucks

Это отчет о проекте Starbucks. Вы можете найти соответствующий ресурс github по этой ссылке: https://github.com/tylerzhang77/Starbucks-Offer-Analysis . Этот проект содержит весь процесс анализа данных, от импорта данных, предварительной обработки, элементарного анализа до построения, настройки и проверки модели машинного обучения. Я попытаюсь решить три проблемы, перечисленные ниже: Каковы демографические характеристики пользователей, которые завершают предложение? Какие предложения..