Публикации по теме 'feature-engineering'


Категориальные данные
Понимание проектирования функций (часть 2) Категориальные данные Стратегии работы с дискретными категориальными данными Вступление Мы рассмотрели различные стратегии разработки функций для работы со структурированными непрерывными числовыми данными в предыдущей статье этой серии . В этой статье мы рассмотрим другой тип структурированных данных, который носит дискретный характер и обычно называется категориальными данными. Работать с числовыми данными часто проще, чем с..

Тайловое кодирование: эффективный метод разреженного кодирования для данных с действительными значениями
Вступление: Возможно, наиболее важной проблемой в машинном обучении (ML) является представление необработанных входных данных, которые можно использовать в качестве хорошего предиктора для модели ML. Такое представление данных часто представляется как вектор признаков , который можно использовать для обучения модели. С появлением глубоких нейронных сетей (DNN), таких как сверточные нейронные сети (CNN), создание таких функций становится более автоматизированным в скрытых слоях, но..

Сокращение и выбор функций
Выбор признаков: Выбор признаков — это один из двух процессов сокращения признаков, второй — извлечение признаков — это процесс, посредством которого подмножество признаков или переменных выбирается из большего набора данных для построения модели. Он также известен как «Выбор переменной/Выбор атрибута/Выбор подмножества переменной ». Основная идея заключается в том, что выбор функций заключается в том, чтобы сосредоточиться на выборе функций , чтобы выбрать функции, которые хорошо..