Работа в области машинного обучения — это не только построение различных моделей классификации или кластеризации. Это больше касается подачи правильного набора функций в модели обучения.
Этот процесс добавления в модель нужного набора функций в основном происходит после процесса сбора данных.
Как только у нас будет достаточно данных, мы не будем вводить все данные в модель и ожидать отличных результатов. Нам нужно предварительно обработать данные.
Фактически, сложной и ключевой частью процессов машинного обучения является предварительная обработка данных.
Ниже приведены ключевые вещи, которые мы намеревались сделать на этапе предварительной обработки данных.
- Преобразование функций
- Выбор функции
Преобразование функций – это преобразование уже существующих функций в другие формы. Предположим, вы используете логарифмическую функцию для преобразования нормальных признаков в логарифмические.
Выбор функций – это выбор лучших функций из уже существующих. В этой статье мы изучим основные методы, чтобы выбрать лучшие функции для моделирования.
Прежде чем мы поедем дальше. Давайте посмотрим на оглавление.
Оглавление:
- Почему моделирование — не последний этап
- Роль корреляции
- Расчет важности признаков с помощью методов регрессии
- Использование пакета Caret для расчета важности функции
- Случайный лес для вычисления важности признаков
- Вывод