Публикации по теме 'data-transformation'
Каталог преобразований переменных, чтобы ваша модель работала лучше
КНИГА « МЕТОДЫ АНАЛИЗА ДАННЫХ ДЛЯ ВЫИГРЫША KAGGLE »
Каталог преобразований переменных, чтобы ваша модель работала лучше
10+ преобразований числовых переменных и 7 преобразований категориальных переменных
Преобразование переменных - это способ улучшить работу данных в вашей модели. Переменные данных могут иметь два типа формы: числовая переменная и категориальная переменная , и их преобразование должно иметь разные подходы.
- Преобразование числовой переменной :..
Нелинейность данных
Модель линейной регрессии предполагает линейную связь между откликом и предикторными переменными. Но в некоторых случаях истинная связь между откликом и предикторами может быть нелинейной.
Мы постараемся ответить на следующие вопросы:
Как определить нелинейность данных, особенно при наличии в модели нескольких переменных? Что мы можем сделать, когда связь между зависимой и независимой переменной (переменными) нелинейна?
Выявление нелинейности в данных
Для простой линейной..
Не такое уж страшное руководство по функциональному программированию
Введение
Функциональное программирование - это парадигма программирования, уходящая своими корнями в математику и являющаяся источником множества зловещих терминов и сложных диалогов. Фактически, термин функциональное программирование имеет множество значений и определений, что приводит к возникновению множества недоразумений между программистами. Однако под этой толстой коркой академической теории можно найти простые и легкие в применении концепции, которые сделают код более легким..
[Практика] Предварительная обработка данных спешит на помощь
Мы уже знаем, насколько важна предварительная обработка данных в предыдущей главе. Если вы забыли об этом, вы можете прочитать здесь. Как мы знаем, предварительная обработка данных состоит из 4 этапов: очистка данных, преобразование данных, интеграция данных и сокращение данных. В этой главе мы узнаем о том, как мы используем эту «предварительную обработку данных» с использованием языка программирования Python в Google Colab.
Основная проблема здесь состоит в том, чтобы предсказать,..
Преобразование данных для числовых функций
Это еще одна статья в разделе предварительной обработки машинного обучения. Здесь мы обсудим, как нормализовать или масштабировать данные, чтобы модель могла работать хорошо. Прежде чем приступить к подгонке модели на обучающей выборке, нам следует изучить методы преобразования данных. Это еще один очень важный шаг в уточнении ваших тренировочных данных.
Почему масштабирование данных?
Строго говоря, ваша модель все еще может работать, если вы не примените методы масштабирования к..