Публикации по теме 'catboost'


Работа с категориальными данными: Catboost
Я представил проблемы с категориальными данными и машинным обучением с целью продемонстрировать catboost. После обновления моей ОС, переустановки anaconda, обновления pip я наконец установил catboost. Теперь мой старый ноутбук - часть подарка. Что такое кэтбуст Машина не понимает категориальных данных. Поэтому необходимо преобразовать такие категории, как голландский, немецкий, бельгийский, в числовые значения. Простое присвоение им разных уровней (0,1,2) не работает. Если вы..

Как запустить модель регрессора машинного обучения для конкурса Numerai менее чем за 5 минут
Лучше всего я проявляю себя, когда просматриваю модели — Future Hendrix Всем привет, крутые коты и котята, в этой статье я поделюсь моей версией простого числового представления. Краткий обзор того, что это влечет за собой. Во-первых, мы получим данные прямо из источника. У Numerai есть собственный API, поэтому мы можем очень быстро импортировать эту библиотеку Python. После получения данных мы импортируем библиотеку машинного обучения , а затем используем модель регрессора...

SHAP для категориальных функций с CatBoost
Избегайте постобработки значений SHAP категориальных признаков. Сочетание CatBoost и SHAP может дать ценную информацию. Особенно, когда вы работаете с категориальными функциями. То, как CatBoost обрабатывает эти функции, упрощает понимание вашей модели с помощью SHAP. С другими пакетами моделирования нам нужно сначала преобразовать категориальные признаки, используя однократное кодирование. Проблема в том, что каждая бинарная переменная будет иметь свое значение SHAP. Это..

Настройка модели для снижения ложных прогнозов
Настройте свою модель, чтобы классифицировать только с более высокой степенью уверенности Введение При создании модели классификации многие алгоритмы предлагают функцию predict_proba() , чтобы дать нам вероятность того, что это наблюдение будет отнесено к каждому классу. Таким образом, обычно можно увидеть такой вывод: [0.925, 0.075] В предыдущем случае модель на 92,5% уверена, что наблюдение относится к классу 0, и только с вероятностью 7,5% относится к классу 1...

Освоение быстрого повышения градиента в Google Colaboratory с бесплатным графическим процессором
Gradient Boosting on Decision Trees (GBDT) - это современный инструмент машинного обучения для работы с разнородными или структурированными данными. При работе с данными выбор идеального алгоритма сильно зависит от типа данных. Для однородных данных, таких как изображения, звук или текст, лучшим решением являются нейронные сети. А для структурированных данных, например для кредитного рейтинга, рекомендаций или любых других табличных данных, лучшим решением является GBDT. По этой..

Мультиклассовая классификация с автонастройкой CatBoost
CatBoost с HyperOpt становится идеальным инструментом для мультиклассовой классификации… В этой статье мы будем работать с набором данных Kaggle о финиковых плодах. Набор данных состоит из плодов даты 7 типов с 34 связанными функциями. Наша задача состоит в том, чтобы классифицировать финиковые фрукты на 7 классов. Вы можете прочитать больше о наборе данных по ссылке ниже Наборы данных о фруктах 7 класс; Бархи, Деглет Нур, Суккари, Ротаб Мозафати,..

Используйте SHAPELY и CATBOOST для отладки вашей модели.
Catboost — метод бустинга, принимающий данные с категориальными признаками и текстом; для табличных данных очень эффективен; Однако иногда, используя промышленный набор данных, мы можем столкнуться с проблемой переобучения, и вам захочется выполнить отладку, используя важность функции или лучшее формированное значение. Построить модель Просто импортируйте import catboost import pandas as pd import numpy as np import os Откройте набор данных Мы используем набор данных Womens..