Публикации по теме 'feature-selection'


Оптимизация машинного обучения
Введение После нескольких месяцев повторения одних и тех же задач по преобразованию данных и машинному обучению в различных наборах данных я решил удалить всю избыточность в своем основном рабочем процессе обработки данных. Вдохновленный пакетом caret Макса Куна, я надеялся написать критически важные функции один раз, а затем каждый раз повторно использовать их; главное правило информатики; модульность. Пакет caret отлично справляется с этой задачей, однако я обнаружил, что в..

Как обнаружить постоянные, квазипостоянные функции в вашем наборе данных
Выбор функции с использованием fast_ml Введение В большинстве случаев ведущих специалистов по обработке данных выделяют две вещи: Создание функций и Выбор функций . то есть создание функций, которые позволяют получить более глубокое / скрытое представление о бизнесе или клиенте, а затем сделать правильный выбор, какие функции выбрать для вашей модели. Важность выбора функций в машинном обучении Качество модели машинного обучения зависит от ваших данных - мусор на входе, мусор..

Полные методы выбора признаков 4–2 Корреляционный анализ
Обобщить математическую интуицию и продемонстрировать корреляцию, мультиколлинеарность и исследовательский факторный анализ для выбора признаков Полные методы выбора функций Статистическое тестирование и анализ Корреляционный анализ Уменьшение размера Управляется моделью Корреляция и причинность Корреляция — это мера связи между значениями двух переменных, если связь можно аппроксимировать линией, то это линейная корреляция и ее можно представить в..

РИСК ПО УМОЛЧАНИЮ НА ГЛАВНУЮ КРЕДИТУ - Практический пример непрерывного машинного обучения - ЧАСТЬ 2: Разработка и моделирование функций
РИСК ПО УМОЛЧАНИЮ ДЛЯ ДОМАШНЕГО КРЕДИТА - Конечный пример использования машинного обучения - ЧАСТЬ 2: Разработка и моделирование функций «Придумать функции сложно, отнимает много времени и требует экспертных знаний. «Прикладное машинное обучение» - это в основном разработка функций ». - Проф. Эндрю Нг. В первой части серии мы рассмотрели постановку задачи и все предостережения к ней. Мы также рассмотрели исследовательский анализ данных, с помощью которого мы смогли сделать..

В поисках смысла: проблема данных с помощью предиктивного анализа небольшой площади в социальных науках (часть…
Если вы еще не читали Часть 1 этого моего проекта, не стесняйтесь взглянуть. Хотя нет необходимости понимать проблемы, которые я здесь изложил, я объясняю, что такое анализ малых областей, мое вдохновение для этого проекта, то, как я собирал и подготовил свои данные, и с какими трудностями я столкнулся при этом. Работа над этим продолжается, и в ближайшие дни будет третья часть этой серии. Эта статья была первоначально опубликована в августе 2018 года. Это слегка отредактированная..

Выбор функций в программировании на R
Если вам приходится иметь дело с анализом больших данных, машинное обучение с интеллектуальной программой обучения — лучший способ. Многие компьютерные программы основаны на машинном обучении, и для применения данных предусмотрено множество функций с визуализацией и функциональной моделью. Таким образом, машинное обучение — это известная тема, на которой сосредотачивается большинство аналитиков данных, в том числе и я. Обратитесь к моему предыдущему основному проекту, мне пришлось..

Ошибки при применении методов одномерного выбора признаков
"Начиная" Ошибки при применении методов одномерного выбора признаков Когда применять регрессионный F-критерий, дисперсионный анализ и критерий хи-квадрат к непрерывным и категориальным признакам? Контекст В библиотеке Python scikit-learn есть различные методы одномерного выбора функций, такие как F-оценка регрессии, ANOVA и хи-квадрат. Возможно, из-за простоты применения этих методов (иногда всего с одной строкой кода) может возникнуть соблазн просто использовать эти методы, не..