Публикации по теме 'gradient-boosting'


Проблема с градиентным усилением (Гремлины с градиентным усилением)
Введение С появлением деревьев решений с градиентным усилением (GB) (adaBoost, XGBoost, LGBM) такие системы приобрели заметную популярность по сравнению с другими методами на основе деревьев, такими как Random Forest (RF). Хотя оба они имеют свое место в дорожной карте науки о данных, по моему опыту я предпочитаю модели GB, а не RF из-за невероятно высокой скорости обучения. Хотя, как следует из названия, у меня есть проблема с моделями ГБ, которая обычно не разъясняется специалистам..

Как выбрать количество оценщиков для Gradient Boosting
Простой цикл для настройки вашей модели Введение В науке о данных в наши дни доступно множество алгоритмов. Таким образом, один полезный метод состоит в том, чтобы объединить их в одну модель, чтобы получить лучшее от каждого, что приведет к более точной модели. Используя Scikit-Learn, вы найдете алгоритм Random Forest, который представляет собой разновидность модели ансамбля. С другой стороны, вы также найдете модели Boosting, которые последовательно обучают оценщиков, где..

XGBoost: глубокое погружение в ускорение
Этот блог создается и поддерживается студентами программы профессионального магистра в Школе компьютерных наук Университета Саймона Фрейзера в рамках их кредита на курс. Чтобы узнать больше об этой уникальной программе, посетите SFU PMP . Авторы: Шубхам Малик , Рохан Хароде и Акаш Сингх Кунвар Каждый день мы слышим о новых открытиях в области искусственного интеллекта. Они бывают разных областей применения. Однако задумывались ли вы, какие задачи решаются для..

Повышение градиента для регрессии с нуля
Объяснение и реализация повышения градиента в Python Повышение градиента — это один из методов ансамблевого машинного обучения. Он использует слабых учеников, как и другие в последовательности, для создания надежной модели. Это гибкий и мощный метод, который можно использовать как для задач регрессии, так и для задач классификации. Хороших результатов можно добиться даже при очень небольшой настройке. Он может обрабатывать большое количество функций и не привязан к какому-либо..

Работа с большими данными с ускорением и высокой точностью
Контролируемые модели используются для прогнозирования результатов бизнеса, когда у нас уже есть ответ на основе наборов исторических данных. Вот несколько примеров: конверсия лидов, правильное размещение рекламы, увольнение сотрудников, и тому есть множество применений. Наличие больших наборов данных может привести к более высокой точности, что приведет к более точному прогнозированию и повышению прибыльности или успеха в бизнесе. Но показано, что линейные модели имеют ограниченную..

Забытая начальная оценка в GBM
Машины повышения градиента — отличный дополнительный инструмент в мире, где доминируют нейронные сети. Они преуспевают на относительно небольших табличных наборах данных, на которых нейронные сети работают хуже. В этих моделях есть один гиперпараметр, широко известный как n_estimators , который может вводить в заблуждение. Как правило, когда количество оценщиков равно X , реальное количество всех оценщиков на самом деле равно X+1 . В этой статье мы попытаемся извлечь эту молча..

Изучение деревьев решений, случайных лесов и машин повышения градиента: руководство по древовидным…
Модели машинного обучения на основе деревьев — это популярное семейство алгоритмов, используемых в науке о данных как для задач классификации, так и для задач регрессии. Они особенно хорошо подходят для обработки сложных и нелинейных отношений в данных, что делает их идеальными для широкого спектра приложений.