Давайте начнем с хорошего определения разработки функций.

«Разработка функций — это процесс преобразования необработанных данных в функции, которые лучше представляют основную проблему для прогностических моделей, что приводит к повышению точности модели на невидимых данных».

👉 Почему проектирование функций имеет решающее значение?

Краткий ответ: Представьте, что вы строите великолепное здание на слабом фундаменте — результатом будет неустойчивость и хрупкость. Точно так же без продуманной разработки функций даже самые продвинутые алгоритмы машинного обучения могут дать сбой.

👉 Искусство и наука проектирования объектов.

Разработка признаков — это и искусство, и наука. Это очень итеративный процесс, который требует постоянной оценки и уточнения. Он включает в себя цикл обратной связи, в котором информация, полученная в результате работы модели, помогает создавать новые функции или корректировать существующие.

Некоторые из наиболее известных методов перечислены ниже.

  1. Горячее кодирование
    2. Кодирование меток
    3. Целевое кодирование
    4. Объединение в бины
    5. Преобразования журнала
    6. Функции взаимодействия
    7. Полиномиальное Функции
    8. Функции, зависящие от времени
    9. Масштабирование функций
    10. Уменьшение размерности

Взгляните на рабочий процесс ниже!