Публикации по теме random-forest

Публикации по теме 'random-forest'

Прогноз занятости в несельскохозяйственном секторе США с использованием альтернативных данных RIWI Corp.

Прогноз занятости в несельскохозяйственном секторе США с использованием альтернативных данных RIWI Corp. Эрнест Чан Введение Ежемесячный отчет о занятости в несельскохозяйственном секторе США (NFP), публикуемый Бюро статистики труда США (BLS), является одним из наиболее пристально отслеживаемых экономических показателей как для экономистов, так и для инвесторов. (Когда я вел занятия в известной частной торговой фирме, в пятницу утром, незадолго до 8:30 утра по восточному..

Повышение производительности модели машинного обучения с использованием упаковки

Разберитесь в работе обучения ансамбля Bootstrap Aggregation (Bagging) и реализуйте модель Random Forest Bagging с использованием библиотеки sklearn. Производительность модели машинного обучения говорит нам, как модель работает для невидимых точек данных. Существуют различные стратегии и приемы для повышения производительности модели машинного обучения, некоторые из них: Тонкая настройка гиперпараметра модели ML Использование ансамблевого обучения. Что такое ансамблевое..

Дождь или солнце: что влияет на почасовое использование велосипеда?

Дождь или солнце: что влияет на почасовое использование велосипеда? В велосипедном сообществе есть поговорка: Плохой погоды не бывает, есть только плохо одетые гонщики . Велосипедисты Capital Bikeshare в Вашингтоне получили памятку, потому что единственное, что останавливает велосипедистов округа Колумбия, - это время суток. Согласно моему анализу данных Capital Bikeshare за 2011–2012 годы , пять основных критериев, определяющих почасовую посещаемость, следующие: Какое сейчас..

Анализ удержания клиентов с помощью дерева решений и модели Randon Forest в Python | Машинное обучение

Набор данных Я использовал набор данных Bank Customer Churn от Kaggle. Он содержит 13 функций и 10000 строк. Импортировать необходимые библиотеки import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt from sklearn.preprocessing import MinMaxScaler from scipy import stats Прочитать набор данных df = pd.read_csv(‘file.csv’) df.head() Исследование и очистка данных df.describe() Корреляционный анализ df.corr() Тепловая..

Случайная лесная регрессия

Случайный лес — одна из наиболее эффективных моделей машинного обучения для прогнозной аналитики, что делает ее промышленной рабочей лошадкой для машинного обучения. Модель случайного леса — это тип аддитивной модели, которая делает прогнозы, комбинируя решения из последовательности базовых моделей (конечная модель представляет собой сумму простых базовых моделей). Здесь каждый базовый классификатор представляет собой простое дерево решений. Этот широкий метод использования..

Прогнозирование конечного диастолического объема левого желудочка

Во время своего погружения в науку о данных на Генеральной Ассамблее я работал над множеством различных проектов, от прогнозирования цен на дома в Эймсе, штат Айова, до классификации рукописных чисел с помощью нейронных сетей. Данные - моя страсть, но моя цель - сделать так, чтобы данные работали для всех. В этом проекте я имел в виду человеческий фактор: мне нужна была идея, которая могла бы положительно повлиять на людей, но также идея, для которой я мог бы найти данные. К счастью, мне..

Анализ задержки рейса со случайным лесом и XGBoost

Анализ задержки рейса со случайным лесом и XGBoost Авиационная отрасль вносит значительный вклад в экономику Соединенных Штатов. Следовательно, если рейсы задерживаются, изменяются или отменяются, это оказывает финансовое влияние на несколько компаний ежегодно, влияя на экономику. Кроме того, нельзя игнорировать личную потерю времени и денег, а также стресс и разочарование, возникающие из-за задержек. Поэтому в этой статье рассматривается анализ нескольких рейсов для прогнозирования..