Я не хочу придумывать здесь длинную историю, а скорее перечислю преимущества и недостатки случайных лесов (RF), чтобы иметь краткую справку.
Я более чем рад любым комментариям по перечисленным плюсам и минусам или если у вас есть какие-либо дополнительные комментарии, которые вы хотели бы опубликовать.
Плюсы:
- Преодолевает проблему переоснащения деревьев решений
- Решает проблемы регрессии и классификации
- Хорошо работает как с непрерывными, так и с категориальными переменными
- Обрабатывает отсутствующие значения
- Не требует дальнейшего масштабирования
- Справляется с нелинейностями
- Обычно устойчив к выбросам
Минусы:
- Более сложный, чем деревья решений
- Более длительный период обучения, чем у деревьев решений