Публикации по теме 'categorical-data'


Работа с категориальными данными: Catboost
Я представил проблемы с категориальными данными и машинным обучением с целью продемонстрировать catboost. После обновления моей ОС, переустановки anaconda, обновления pip я наконец установил catboost. Теперь мой старый ноутбук - часть подарка. Что такое кэтбуст Машина не понимает категориальных данных. Поэтому необходимо преобразовать такие категории, как голландский, немецкий, бельгийский, в числовые значения. Простое присвоение им разных уровней (0,1,2) не работает. Если вы..

Статистика для науки о данных, часть 3
Переменные В статистике переменные — это атрибуты или характеристики, которые могут варьироваться или меняться от одного наблюдения к другому. Они являются фундаментальными элементами в изучении и анализе данных. Переменные могут принимать разные значения, и они используются для описания, классификации и количественной оценки различных аспектов изучаемых данных. В статистике есть несколько типов переменных, и они играют решающую роль в понимании и интерпретации данных...

Простые способы обработки категориальных значений с использованием библиотек sklearn и pandas:
Кодирование категориальных переменных — это проблема, с которой могут столкнуться специалисты по данным при применении алгоритмов машинного обучения, поскольку эти алгоритмы поддерживают числовые переменные, но не категориальные переменные. Что такое категориальные переменные? Категориальные данные: означает категории, в которых значения хранятся в виде текста. Другое определение: Категориальные данные — это данные, которые можно разделить на группы, такие как страны, пол, предметы и т...

Использование get_dummies() в кадре данных Pandas для машинного обучения
get_dummies() используется в Pandas для преобразования категориальных переменных в числовые данные и повышения производительности моделей машинного обучения. Это связано с тем, что большинство моделей могут принимать только числовые значения в качестве входных данных. Затем эти новые столбцы можно использовать в алгоритмах машинного обучения или статистических моделях в качестве предикторов. Например. Предположим, у нас есть столбец под названием «Fuel_type» в нашем фрейме данных,..

Обработка признаков: категориальные и числовые
В этой статье мы поймем, как обрабатывать категориальные и числовые признаки в заданном наборе данных. Прежде чем мы начнем с того, как с ними обращаться, давайте сначала разберемся, что означают категориальные и числовые признаки. Давайте разберемся в этом с помощью примера. Скажем, нам даны такие атрибуты, как вес, страна, цвет волос, и цель состоит в том, чтобы определить рост человека. Теперь атрибут вес может принимать реальные значения, то есть его значения могут быть 160,8 см,..

Обработка категориальных переменных
Категориальные переменные — это распространенный тип данных, встречающийся в задачах машинного обучения. Эти переменные представляют категории или метки и часто не являются числовыми по своей природе. Правильная обработка категориальных переменных имеет решающее значение для построения эффективных моделей машинного обучения. В этом уроке мы рассмотрим различные методы и лучшие практики работы с категориальными переменными в ваших проектах машинного обучения. Типы категориальных..

Квантильный кодировщик
Работа с категориальными функциями высокой мощности в задачах регрессии В этом блоге мы представляем Quantile Encoder и Summary Encoder. Это краткий синтез опубликованной статьи, выполненной в сотрудничестве с David Masip , Jordi Nin , Oriol Pujol и Carlos Mougan . Проект содержит: Доклад конференции Реализация python в библиотеке category_encoders Репозиторий с экспериментами с открытыми данными TL;DR Мы модифицируем традиционное целевое кодирование среднего (с..