Случайный лес — одна из наиболее эффективных моделей машинного обучения для прогнозной аналитики, что делает ее промышленной рабочей лошадкой для машинного обучения.

Модель случайного леса — это тип аддитивной модели, которая делает прогнозы, комбинируя решения из последовательности базовых моделей (конечная модель представляет собой сумму простых базовых моделей).

Здесь каждый базовый классификатор представляет собой простое дерево решений. Этот широкий метод использования нескольких моделей для повышения эффективности прогнозирования называется объединение моделей. В случайных лесах все базовые модели строятся независимо с использованием другой подвыборки данных.

Почему случайные леса?

Разные модели имеют разные преимущества. Модель случайного леса очень хорошо справляется с табличными данными с числовыми признаками или категориальными признаками с менее чем сотнями категорий. В отличие от линейных моделей, случайные леса способны фиксировать нелинейное взаимодействие между функциями и целью.

Модели на основе дерева не предназначены для работы с очень разреженными функциями.

При работе с разреженными входными данными (например, категориальные объекты большого размера) мы можем либо предварительно обработать разреженные объекты для получения числовой статистики, либо переключиться на линейную модель, которая лучше подходит для таких сценариев. .

Как они работают?

Случайный лес — это метод ансамбля, способный выполнять как задачи регрессии, так и задачи классификации с использованием нескольких деревьев решений и метода, называемого Агрегация начальной загрузки (широко известнаякакбэггинг). ).

Бэггинг включает в себя обучение каждого дерева решений на другой выборке данных, где выборка выполняется с заменой.

Основная идея: объединить несколько деревьев решений при определении конечного результата, а не полагаться на отдельные деревья решений. Если вы хотите узнать больше о случайных лесах, я включил несколько справочных ссылок, которые содержат подробные объяснения по этой теме.

Выполнение

Обратитесь к следующей документации, чтобы понять реализацию регрессии случайного леса.



Использованная литература :

Для более глубокого понимания можно рассмотреть следующее:

  1. Простое объяснение случайного леса
  2. Как работает алгоритм случайного леса в машинном обучении
  3. Регрессия случайного леса: когда она терпит неудачу и почему?