Публикации по теме 'categorical-data'
Работа с категориальными данными: Catboost
Я представил проблемы с категориальными данными и машинным обучением с целью продемонстрировать catboost. После обновления моей ОС, переустановки anaconda, обновления pip я наконец установил catboost. Теперь мой старый ноутбук - часть подарка.
Что такое кэтбуст
Машина не понимает категориальных данных. Поэтому необходимо преобразовать такие категории, как голландский, немецкий, бельгийский, в числовые значения. Простое присвоение им разных уровней (0,1,2) не работает. Если вы..
Статистика для науки о данных, часть 3
Переменные
В статистике переменные — это атрибуты или характеристики, которые могут варьироваться или меняться от одного наблюдения к другому. Они являются фундаментальными элементами в изучении и анализе данных. Переменные могут принимать разные значения, и они используются для описания, классификации и количественной оценки различных аспектов изучаемых данных.
В статистике есть несколько типов переменных, и они играют решающую роль в понимании и интерпретации данных...
Простые способы обработки категориальных значений с использованием библиотек sklearn и pandas:
Кодирование категориальных переменных — это проблема, с которой могут столкнуться специалисты по данным при применении алгоритмов машинного обучения, поскольку эти алгоритмы поддерживают числовые переменные, но не категориальные переменные.
Что такое категориальные переменные?
Категориальные данные: означает категории, в которых значения хранятся в виде текста.
Другое определение: Категориальные данные — это данные, которые можно разделить на группы, такие как страны, пол, предметы и т...
Использование get_dummies() в кадре данных Pandas для машинного обучения
get_dummies() используется в Pandas для преобразования категориальных переменных в числовые данные и повышения производительности моделей машинного обучения. Это связано с тем, что большинство моделей могут принимать только числовые значения в качестве входных данных.
Затем эти новые столбцы можно использовать в алгоритмах машинного обучения или статистических моделях в качестве предикторов.
Например. Предположим, у нас есть столбец под названием «Fuel_type» в нашем фрейме данных,..
Обработка признаков: категориальные и числовые
В этой статье мы поймем, как обрабатывать категориальные и числовые признаки в заданном наборе данных. Прежде чем мы начнем с того, как с ними обращаться, давайте сначала разберемся, что означают категориальные и числовые признаки.
Давайте разберемся в этом с помощью примера. Скажем, нам даны такие атрибуты, как вес, страна, цвет волос, и цель состоит в том, чтобы определить рост человека.
Теперь атрибут вес может принимать реальные значения, то есть его значения могут быть 160,8 см,..
Обработка категориальных переменных
Категориальные переменные — это распространенный тип данных, встречающийся в задачах машинного обучения. Эти переменные представляют категории или метки и часто не являются числовыми по своей природе. Правильная обработка категориальных переменных имеет решающее значение для построения эффективных моделей машинного обучения. В этом уроке мы рассмотрим различные методы и лучшие практики работы с категориальными переменными в ваших проектах машинного обучения.
Типы категориальных..
Квантильный кодировщик
Работа с категориальными функциями высокой мощности в задачах регрессии
В этом блоге мы представляем Quantile Encoder и Summary Encoder. Это краткий синтез опубликованной статьи, выполненной в сотрудничестве с David Masip , Jordi Nin , Oriol Pujol и Carlos Mougan . Проект содержит:
Доклад конференции Реализация python в библиотеке category_encoders Репозиторий с экспериментами с открытыми данными
TL;DR
Мы модифицируем традиционное целевое кодирование среднего (с..