Создание хорошеймодели машинного обучения — это не просто занесение сотен столбцов данных в блокнот и использование scikit-learn для построения, ведь в Интернете доступно бесчисленное множество пакетов и инструментов. Поэтому нет необходимости говорить, что выбор подходящих функций для этих моделей очень важен, посколькубесполезные данные приводят к предвзятости, которая искажает окончательные результаты нашего машинного обучения. Достичь исключительной модели машинного обучения можно, воспользовавшись набором методов, один из которых я рассмотрю ниже.

Важность функции относится к методам, которые вычисляют оценку для всех входных функций для данной модели — оценки просто представляют «важность» каждой функции. Более высокий балл означает, что конкретная функция будет иметь большее влияние на модель, которая используется для прогнозирования определенной переменной. Проще говоря, важность функции относится к методам, которые присваивают оценку входным функциям в зависимости от того, насколько они полезны для прогнозирования целевой переменной.

Существует много типов и источников оценок важности признаков, среди которых популярны статистические оценки корреляции, коэффициенты, рассчитываемые как часть линейных моделей, деревья решений и оценки важности перестановок.

Функция Важность чрезвычайно полезна в моделях машинного обучения по следующим причинам:

(1) Понимание данных.построение модели — это одно, а понимание данных, входящих в модель, — совсем другое. Подобно матрице корреляции, важность признаков позволяет вам понять взаимосвязь между признаками и целевой переменной. Это также поможет вам понять, какие функции не имеют отношения к модели.

(2) Улучшение модели. при обучении модели вы можете использовать баллы, рассчитанные на основе важности функций, чтобы уменьшить размерность модели. Более высокие оценки обычно сохраняются, а более низкие удаляются, поскольку они не важны для модели. Это не только упрощает модель, но и ускоряет ее работу, что в конечном итоге повышает производительность модели.

(3) Интерпретируемость модели: функция Важность также полезна для интерпретации и передачи вашей модели другим заинтересованным сторонам. Вычисляя оценки для каждой функции, вы можете определить, какие функции больше всего связаны с прогностической силой вашей модели.