Публикации по теме 'missing-data'


Все о случайных лесах и обработке в них недостающих значений.
Алгоритм случайного леса - один из самых популярных и самых мощных контролируемых алгоритмов машинного обучения, который может выполнять как задачи классификации, так и регрессии. Как следует из названия, этот алгоритм создает лес с несколькими деревьями решений. В общем, чем больше деревьев решений в лесу, тем надежнее прогноз, что приводит к более высокой точности. Чтобы создать лес с несколькими деревьями решений, мы будем использовать тот же метод, который мы использовали в..

Классификация отказов компонента APS в Scania Trucks
Бизнес-проблема Набор данных состоит из данных, собранных с тяжелых грузовиков Scania при повседневном использовании. Речь идет о системе давления воздуха (APS), которая генерирует сжатый воздух, который используется в различных функциях грузовика, таких как торможение и переключение передач. Положительный класс набора данных состоит из отказов компонентов для определенного компонента системы APS. К отрицательному классу относятся грузовые автомобили с отказами компонентов, не..

Обработка пропущенных значений
Чтобы изучить науку о данных / машинное обучение, нужно иметь представление о том, как обрабатывать данные с пропущенными значениями. Это один из самых важных шагов в области науки о данных. Итак, я расскажу вам, как обрабатывать пропущенные значения. Есть два самых популярных способа: Удаление данных Путем вменения данных Перед запуском существуют предварительные условия: язык Python, pandas, библиотеки NumPy. Давайте начнем с примера: В следующем коде я импортирую..

Как вменить пропущенные значения?
Данные редко бывают чистыми. В большинстве случаев данные отсутствуют или являются неполными. Существует необходимость в предварительной обработке или очистке обучающих данных, поскольку модели машинного обучения не работают, когда данные грязные. Таким образом, мы можем либо игнорировать строки с отсутствующими столбцами данных, либо вменить значения с некоторыми вычисленными выходными данными. Давайте посмотрим на примерные данные. Данные содержат некоторые пропущенные значения,..