Когда вы слышите ансамбль, что вы представляете? Может быть, припев на первом месте. В мире науки о данных мы также используем ансамблевое обучение. Ансамбль означает создание гармонии, когда более двух вещей взаимодействуют друг с другом для достижения лучшего результата.

Обучение в ансамбле

Чтобы обеспечить более точную модель обучения, мы можем объединить более двух методов машинного обучения. Когда мы пытаемся предсказать одни данные, предсказание может быть выбрано в соответствии с большинством предсказаний, сделанных зависимыми моделями обучения.

Почему мы принимаем ансамблевое обучение

В чем преимущество ансамблевого обучения?
Причина проста. Результат будет точнее.

Метод ансамблевого обучения заключается в том, чтобы определить прогноз большинством голосов из зависимого малого машинного обучения.

Таким образом, единственный случай, когда модель обучения дает неправильные прогнозы, заключается в том, что большинство зависимых машинных обучений предсказывают неправильно. Конечно, когда мы вычисляем вероятность того, что большинство зависимых моделей машинного обучения дают неверный прогноз, эта вероятность определенно ниже, чем вероятность того, что только одна модель машинного обучения предсказывает неизвестные данные. .

Как использовать ансамблевое обучение более эффективно

В основном есть два важных критерия для более эффективного использования ансамблевого обучения.

  1. Использовать полностью независимую обучающую машину. Использование схожих моделей обучения в ансамблевом обучении означает, что они делают одинаковые ошибки. Следовательно, ансамблевое обучение не имеет смысла, поскольку они не могут поддерживать свои ошибки друг друга.
  2. Выбор выборочных данных случайным образом. Выбор выборочных данных из всех данных случайным образом очень важен, когда мы используем ансамблевое обучение.

Класс ансамблевого обучения

Бэгинг

Бэггинг — это краткая форма агрегации начальной загрузки. Бэггинг использует данные, собранные из родительского набора данных. Этот процесс агрегирования называется начальной загрузкой. Начальная загрузка предназначена для формирования новых наборов данных из сбора данных из родительского набора данных.

Это удовлетворяет второму критерию, введенному выше.

Повышение

Повышение имиджа похоже на улучшение слабых моделей машинного обучения.

Мы заставляем модели сосредоточиться на своих ошибках и создаем новую модель обучения. Процесс повторяется.

Укладка

Стекирование — это, буквально, суммирование результатов модели (прогноз).

После предоставления прогнозов новая модель, которую мы пытаемся создать, использует прогнозы в качестве нового атрибута, что означает смешивание наборов данных о поездах и сделанных нами прогнозов.

Этот результат будет более точным при суммировании.