Я не хочу придумывать здесь длинную историю, а скорее перечислю преимущества и недостатки случайных лесов (RF), чтобы иметь краткую справку.

Я более чем рад любым комментариям по перечисленным плюсам и минусам или если у вас есть какие-либо дополнительные комментарии, которые вы хотели бы опубликовать.

Плюсы:

  1. Преодолевает проблему переоснащения деревьев решений
  2. Решает проблемы регрессии и классификации
  3. Хорошо работает как с непрерывными, так и с категориальными переменными
  4. Обрабатывает отсутствующие значения
  5. Не требует дальнейшего масштабирования
  6. Справляется с нелинейностями
  7. Обычно устойчив к выбросам

Минусы:

  1. Более сложный, чем деревья решений
  2. Более длительный период обучения, чем у деревьев решений