Публикации по теме 'data-imputation'


Вменение пропущенных значений с помощью подходов на основе машинного обучения
Уже углубившись в подготовку данных в моем предыдущем посте в блоге (ознакомьтесь с Введением в выбор экземпляра в интеллектуальном анализе данных , если интересно), я решил поднять еще одну важную тему предварительной обработки данных, а именно обработку пропущенных значений. В частности, я хочу погрузиться в подходы на основе ML для вменения пропущенных значений, например. используя KNN или кластеризацию K-средних. Соответствующая информация взята из главы 4 García et al. [1], если не..

Краткое руководство по методам импутации отсутствующих данных в Python (2020)
Большинство алгоритмов машинного обучения ожидают полных и чистых наборов данных без шума, к сожалению, реальные наборы данных беспорядочные и содержат несколько пропущенных ячеек, в таких случаях обработка недостающих данных становится довольно сложной. Поэтому в сегодняшней статье мы собираемся обсудить некоторые из наиболее эффективных и действительно простых в использовании методов вменения данных, которые можно использовать для работы с недостающими данными. Итак, без дальнейших..

Методы обработки отсутствующих данных в машинном обучении
Методы обработки отсутствующих данных в машинном обучении: пошаговое руководство на Python Почему важна обработка недостающих данных? Проблема недостающих данных распространена в большинстве областей исследований. Отсутствие данных порождает различные проблемы. Во-первых, отсутствие данных снижает мощность статистических методов. Во-вторых, отсутствующие данные могут вызвать смещение в модели. В-третьих, многие пакеты машинного обучения в Python не принимают отсутствующие..