Публикации по теме 'random-forest'


Понимание модели случайного леса и повышения градиента
Я считаю, что на пути к аналитике у каждого был бы момент, когда вам нужно было бы использовать деревья решений , чтобы создать какие-то сегменты, чтобы принять какое-то решение. Скромное Дерево решений уже много лет широко используется в каждой организации. Деревья решений работают на очень простых принципах, это модели, основанные на правилах. В этой статье мы перейдем от деревьев решений к моделям случайного леса и повышения градиента. Когда вы предоставляете дерево решений с..

Прогнозировать результат хоккейной игры с помощью машинного обучения
Использование анализа данных и статистики для прогнозирования исхода спортивных событий не является чем-то новым. Вы смотрите на тенденции, положение за столом, результаты личных встреч и т. д. И не забывайте о, возможно, самой важной вещи: это смутное «чувство» по поводу конкретного результата. Исторически мое «чувство» было совсем не точным, и, как человек, работающий с данными каждый день, я решил настроить модель машинного обучения, чтобы помочь мне улучшить свои результаты при..

Понимание классификации случайных лесов и построение модели в Python
Узнайте, как алгоритм случайного леса работает для задачи классификации. Случайный лес — это алгоритм обучения с учителем. Его можно использовать как для классификации, так и для регрессии. Это также самый гибкий и простой в использовании алгоритм. Лес состоит из деревьев. Говорят, что чем больше в нем деревьев, тем крепче лес. Случайный лес создает деревья решений на случайно выбранных выборках данных, получает прогноз от каждого дерева и выбирает лучшее решение посредством..

Какой кандидат, по прогнозам Random Forest, победит на президентских выборах 2020 года?
В прошлом месяце весь мир думал о том, кто именно победил на президентских выборах в США в 2020 году. В первый вторник ноября многие американцы проголосовали за человека, которого они хотели бы возглавить своей страной в течение следующих четырех лет. . Вечером 3 ноября 2020 года Дональд Трамп был явным победителем, но в одночасье произошли странные события, такие как доставка открепительных удостоверений на пункты подсчета посреди ночи, умершие люди, регистрирующиеся для голосования и..

Машинное обучение 1: Урок 4
Мои личные заметки из класса машинного обучения . Эти примечания будут и дальше обновляться и улучшаться по мере того, как я продолжаю просматривать курс, чтобы по-настоящему понять его. Большое спасибо Джереми и Рэйчел , которые дали мне возможность учиться. Уроки: 1 ・ 2 ・ 3 ・ 4 ・ 5 ・ 6 ・ 7 ・ 8 ・ 9 ・ 10 ・ 11 ・ 12 Перед тем, как начать, вопрос: Можем ли мы суммировать взаимосвязь между гиперпараметрами случайного леса и их влиянием на переобучение,..

Что делает Xtreme Gradient Boosting (XGBoost) чрезвычайно масштабируемым?
Что подразумевается под масштабируемой моделью машинного обучения? Почему желательна масштабируемость? И, наконец, каковы скрытые секреты XGBoost, которые делают эту модель масштабируемой по сравнению с другими аналогами в семействе ансамблевых методов? В этом посте я отвечу на каждый из вышеперечисленных вопросов самым простым языком, а также предоставлю фактическую информацию о каждом из них. Давайте ответим на первый вопрос - в чем смысл масштабируемой модели машинного..

Часть 2. Пошаговое руководство по перекрестной проверке без участия одного человека с помощью Random Forests в Python
Это вторая часть серии, посвященной перекрестной проверке с исключением одного человека и случайными лесами в Python. В первой части подробно описан алгоритм, который мы будем использовать сегодня во второй части для построения графиков важности. Напоминаем, что эти методы были скомпилированы в функцию, опубликованную в Digital Biomarker Discovery Pipeline (DBDP) . Если вы хотите реализовать эту перекрестную проверку в своей работе со случайными лесами, посетите репозиторий на GitHub..