Публикации по теме 'data-transformation'


Каталог преобразований переменных, чтобы ваша модель работала лучше
КНИГА « МЕТОДЫ АНАЛИЗА ДАННЫХ ДЛЯ ВЫИГРЫША KAGGLE » Каталог преобразований переменных, чтобы ваша модель работала лучше 10+ преобразований числовых переменных и 7 преобразований категориальных переменных Преобразование переменных - это способ улучшить работу данных в вашей модели. Переменные данных могут иметь два типа формы: числовая переменная и категориальная переменная , и их преобразование должно иметь разные подходы. - Преобразование числовой переменной :..

Нелинейность данных
Модель линейной регрессии предполагает линейную связь между откликом и предикторными переменными. Но в некоторых случаях истинная связь между откликом и предикторами может быть нелинейной. Мы постараемся ответить на следующие вопросы: Как определить нелинейность данных, особенно при наличии в модели нескольких переменных? Что мы можем сделать, когда связь между зависимой и независимой переменной (переменными) нелинейна? Выявление нелинейности в данных Для простой линейной..

Не такое уж страшное руководство по функциональному программированию
Введение Функциональное программирование - это парадигма программирования, уходящая своими корнями в математику и являющаяся источником множества зловещих терминов и сложных диалогов. Фактически, термин функциональное программирование имеет множество значений и определений, что приводит к возникновению множества недоразумений между программистами. Однако под этой толстой коркой академической теории можно найти простые и легкие в применении концепции, которые сделают код более легким..

[Практика] Предварительная обработка данных спешит на помощь
Мы уже знаем, насколько важна предварительная обработка данных в предыдущей главе. Если вы забыли об этом, вы можете прочитать здесь. Как мы знаем, предварительная обработка данных состоит из 4 этапов: очистка данных, преобразование данных, интеграция данных и сокращение данных. В этой главе мы узнаем о том, как мы используем эту «предварительную обработку данных» с использованием языка программирования Python в Google Colab. Основная проблема здесь состоит в том, чтобы предсказать,..

Преобразование данных для числовых функций
Это еще одна статья в разделе предварительной обработки машинного обучения. Здесь мы обсудим, как нормализовать или масштабировать данные, чтобы модель могла работать хорошо. Прежде чем приступить к подгонке модели на обучающей выборке, нам следует изучить методы преобразования данных. Это еще один очень важный шаг в уточнении ваших тренировочных данных. Почему масштабирование данных? Строго говоря, ваша модель все еще может работать, если вы не примените методы масштабирования к..