Работа в области машинного обучения — это не только построение различных моделей классификации или кластеризации. Это больше касается подачи правильного набора функций в модели обучения.

Этот процесс добавления в модель нужного набора функций в основном происходит после процесса сбора данных.

Как только у нас будет достаточно данных, мы не будем вводить все данные в модель и ожидать отличных результатов. Нам нужно предварительно обработать данные.

Фактически, сложной и ключевой частью процессов машинного обучения является предварительная обработка данных.

Ниже приведены ключевые вещи, которые мы намеревались сделать на этапе предварительной обработки данных.

  • Преобразование функций
  • Выбор функции

Преобразование функций – это преобразование уже существующих функций в другие формы. Предположим, вы используете логарифмическую функцию для преобразования нормальных признаков в логарифмические.

Выбор функций – это выбор лучших функций из уже существующих. В этой статье мы изучим основные методы, чтобы выбрать лучшие функции для моделирования.

Прежде чем мы поедем дальше. Давайте посмотрим на оглавление.

Оглавление:

  • Почему моделирование — не последний этап
  • Роль корреляции
  • Расчет важности признаков с помощью методов регрессии
  • Использование пакета Caret для расчета важности функции
  • Случайный лес для вычисления важности признаков
  • Вывод

Подробнее об этом сообщении