Крикет в Индии — это общая связь, объединяющая людей, даже если у них разные взгляды и убеждения. В Индии это популярный вид спорта, и мы любим крикет. То, как играет нынешняя индийская команда, просто фантастика. Пусть он сделает ставку на тестовую серию в Австралии, которую Индия выиграла со счетом 2: 1 после того, как в первом тестовом матче поставила все на 36. Большое достижение. Или будь то тестовая серия Индия-Англия, в которой Индия с комфортом обыграла Англию со счетом 3–1.
Так что же делает индийскую команду такой сильной?
- Они не просто заботятся о поле. Будь то темп, бодрость, раскачивание, пата, поворотная калитка. Они приложат все усилия, чтобы выиграть матч.
- Сила скамейки очень сильная. В Австралии сборная Индии столкнулась с трудностями при выборе команды из-за травм. Все-таки они выиграли благодаря сильной скамейке запасных.
- У сборной Индии есть игроки для любых условий. Предположим, что калитка качается, тогда у нас есть Бхувнешвар Кумар, поскольку боулинг на качелях - его сила, если прыгучий, то у нас есть Шами, Ишант Шарма может воспользоваться их высотой и темпом, если калитка поворачивается, то Р. Ашвин и Джадеджа могут поймать любого игрока с битой в ловушку. мир. Джасприт Бумра смертоносен для любого типа калиток.
- В отделе ватина у нас есть Вират и Рохит, которые могут забивать в любых условиях, Пуджара и Рахане обеспечивают стабильность команде. Хардик, Пант может уничтожить любой состав боулинга в мире.
- Общий уровень игры индийской команды очень высок.
Здесь мы можем наблюдать глубину индийской команды во всех трех отделах. В сборной Индии есть множество игроков, даже если один из них потерпит неудачу, остальная команда сможет справиться с его неудачей. Поскольку крикет — командная игра.
Попасть в 11 игроков — очень сложная задача. Можно с уверенностью сказать, что они лучшие 11 в стране. Мнения могут быть разные о том, кто кого лучше. Но мы все можем согласиться с тем, что все они игроки выше среднего.
Вы можете подумать, что в названии блога упоминается ансамбль, тогда почему я читаю об индийской команде по крикету?
мы можем найти сходство между индийской командой по крикету и Ensemble в том, как они работают.
Ансамбль
«В одиночку мы можем сделать так мало, вместе мы можем сделать так много». — Хелен Келлер
Ансамбль – это совокупность моделей, которые работают вместе, и совокупность получается лучше, чем отдельная модель в коллекции. Каждая модель имеет свои сильные и слабые стороны. В некоторых ситуациях одна модель работает лучше, чем другая, и наоборот. Таким образом, вместе они могут гораздо лучше справляться с различными ситуациями в команде, дополняя друг друга.
Как и в случае с командой Индии, когда они играют как команда, шансы на победу в матче очень высоки. иногда один или два игрока могут не выступить, но другие могут их заменить.
Сформировать группу моделей и заставить ее работать в алгоритмическом контексте — непростая задача. Давайте посмотрим, как это сделать.
Идея ансамбля
Каждый ансамбль (команда) должен соответствовать следующим критериям
1. Разнообразие
2. Приемлемость
Разнообразие
Сильные и слабые стороны моделей, которые мы собираем, должны дополнять друг друга. Это означает, что отдельные модели делают прогнозы независимыми друг от друга. Нет смысла ставить в команду одинаковых моделей. Тогда не будет разницы между индивидуумом и группой. Представьте, что все 11 игроков в команде — игроки с битой. Даже если они поставят на доску большой тотал, они не смогут его защитить. В конце концов, главная цель — выиграть матч. Более сбалансированная команда имеет больше шансов на победу в матче.
Приемлемость
Каждая модель в ансамбле должна работать значительно лучше, чем случайное угадывание. Он не должен определять выход на основе подбрасывания монеты. Вероятность правильного ответа должна быть выше 0,5. Как и в сборной Индии, игрок должен быть специалистом в своем отделе.
Как внести разнообразие?
- Показывая подмножество обучающих данных для разных моделей. Так что здесь каждая модель будет обучаться на разных данных.
- Обучение каждой модели с различными настройками гиперпараметров. Даже если мы используем 4 логистические регрессии в команде, их поведение будет разным.
- Можно использовать разные классификаторы. Например, коллекция логистической регрессии, SVM, KNN и т. д.
- Показывая различные функции модели. Это изменит поведение каждой модели, даже если все они одного типа.
ансамбль против индивидуального
Фундаментальный вопрос машинного обучения заключается в том, как мы можем ожидать, что модель, построенная с использованием конечного количества обучающих данных, будет хорошо работать с чем-то, чего модель вообще никогда не видела?
При обучении модели мы пытаемся найти правильный набор предположений (значение параметров), набор правил (например, в деревьях решений), которые приводят к правильным ответам на основе данных обучения. вот и все. известно только о конечных обучающих данных. Невидимые данные могут отличаться от данных обучения. В таких ситуациях фиксированные предположения обученной модели не будут работать. Затем в игру вступают проблемы смещения, дисперсии, переобучения.
Ensemble обеспечивает гибкость, здесь разные модели будут иметь разные предположения, поэтому мы не привязаны только к одному набору правил. И в совокупности это поможет справиться с непредвиденными ситуациями. Выходные данные ансамбля основаны на среднем (среднем или моде). Ensemble представляет обобщаемость.
Существуют различные методы ансамбля, такие как голосование, суммирование и смешивание, бэггинг (объединение Bootstrap), усиление. У каждого есть свой способ разнообразия, при условии, что все модели в ансамбле приемлемы.
Конечные примечания
В целом, весь ансамбль — отличный метод для получения более стабильной, более надежной и более универсальной модели.
Я надеюсь, что этот блог был полезен для понимания интуиции, лежащей в основе Ensemble. Прокомментируйте свои мысли, отзывы или предложения, если таковые имеются ниже.
Ссылки: