СЛУЧАЙНЫЙ ЛЕС

АНСАМБЛЬНЫЕ ТЕХНИКИ

Прежде чем мы начнем со случайного леса, нам нужно уточнить метод и его типы метода ансамбля.

Ансамблевый метод

Метод ансамбля - это метод, который создает несколько моделей (со случайным подмножеством строк с перекрытием), а затем объединяет различные модели в одну эффективную модель. Метод ансамбля обычно дает более точные решения, чем отдельная модель.

Технику ансамбля обычно подразделяют на два типа: Бэггинг и Усиление. Здесь в этом блоге мы уделяем особое внимание технике упаковки в мешки.

СУМКА

Агрегирование начальной загрузки, также называемое бэггингом, представляет собой мета-алгоритм ансамбля машинного обучения, разработанный для повышения стабильности и точности алгоритмов машинного обучения, используемых в моделях статистической классификации и регрессии, которые Тренировался параллельно л. Это также снижает дисперсию и помогает избежать переобучения.

Алгоритмы, работающие по принципу метода упаковки:

1. Случайный лес

СЛУЧАЙНЫЙ ЛЕС

Случайный лес или случайный лес решений - это метод обучения совокупности для классификации и регрессии, который работает путем построения множества деревьев решений (со случайным подмножеством строк и функций с перекрытием) во время обучения и вывода класса в форме прогноза Режим (классификация) или Среднее / Медиана / Среднее (Регрессия) отдельные деревья.

Случайный лес исправляет привычку дерева решений к переоснащению, преобразуя высокую дисперсию в низкую дисперсию путем агрегирования.

1. Предположим, что в наборе данных есть столбцы «C» и строки «R» (D).

2. Выбирается случайное подмножество строк и столбцов для создания дерева решений.

3. Другое дерево решений создается со случайным подмножеством строк и столбцов с или без перекрытия подмножества данных вышеупомянутых деревьев решений параллельно ему.

4. Таким же образом мы создаем множество моделей деревьев решений (M1, M2, M3,… .Mn) параллельно в форме начальной загрузки с перекрытием наборов данных или без него.

4. Прогноз дается на основе агрегирования всех выходных данных моделей в форме режима (классификация) или среднего / медианного / среднего ( Регрессия) предсказания отдельных деревьев.

Случайный лес обычно превосходит деревья решений, но их точность ниже, чем у деревьев повышения градиента. Однако характеристики данных могут влиять на их производительность.

Если вы эту статью, не забудьте нажать 👏 ниже, чтобы порекомендовать ее, и если у вас есть какие-либо вопросы, оставьте комментарий, и я постараюсь ответить.

Чтобы лучше узнать мир машинного обучения, подписывайтесь на меня. Это лучший способ узнать, когда я напишу больше подобных статей.

Вы также можете подписаться на меня в Instagram, найти меня в LinkedIn или написать мне по электронной почте. Я был бы рад получить известие от вас.

Это все, ребята, хорошего дня :)