Разработка признаков — важная часть построения модели машинного обучения, но ей не уделяется того внимания, которое обычно уделяется другим аспектам. Создание фич — очень сложный процесс, и вам нужно сделать много вещей, чтобы сделать это правильно. Большая проблема заключается в том, что современные инструменты и методологии не всегда предоставляют все, что вам нужно, чтобы сделать это правильно.

Инженерия признаков включает в себя изучение и понимание параметров, которые необходимо преобразовать в рамках модели машинного обучения. На практике это означает тратить много времени на выяснение того, какие параметры наиболее важны при построении модели. Когда вы начнете понимать это, вы приблизитесь к созданию функций, которые имеют большое значение для ваших конкретных потребностей. Основной инструмент для этого находится в функциональном модуле Sciki-learn. У этого модуля есть некоторые недостатки, но есть вещи, которые помогут вам добиться еще лучших результатов.

Общие способы, которыми мы занимаемся проектированием функций

Как упоминалось выше, проектирование признаков является важным компонентом построения модели машинного обучения. Создание функций само по себе стало наукой и искусством, и это то, чем должен овладеть каждый инженер по машинному обучению. Самое сложное в том, что фича-инжиниринг довольно утомительный и трудоемкий. Если вы не сделаете это хорошо, вы также в конечном итоге полностью уничтожите любые хорошие результаты, на которые вы могли надеяться.

Главное нововведение в разработке признаков — автоматизация значительной части процесса создания признаков. Именно здесь в игру вступает механизм функций, который может автоматически распознавать определенные числовые точки данных, которые можно превратить в функции. Такой удивительный инструмент имеет решающее значение при создании функций для вашей модели машинного обучения.

Почему разработка функций — это сложно

Большая проблема с проектированием признаков заключается в том, что это отнимает много времени и утомительно. Разработка признаков — это процесс выяснения того, какие данные имеют значение при построении модели машинного обучения. Вы должны проанализировать каждую доступную модель и посмотреть, как она соотносится с общей совокупностью, которую вы моделируете. Из-за этого это может быть трудным процессом, если вы интуитивно не понимаете, что происходит. Вы также проходите через множество повторяющихся шагов обработки данных, что делает процесс еще более сложным и затягивающим по мере продвижения.

После всего этого вам все еще нужно понимать функции после преобразования их во что-то еще. Ваша модель все еще должна быть понята внешними сторонами, и это может оказаться невозможным после того, как вы выполнили определенные шаги по проектированию ее функций. Механизм функций минимизирует многие из этих проблем, но не устраняет их полностью.

Упрощение процесса

Главное, что делает механизм функций, — это сокращение времени, которое вы тратите на обработку данных и их преобразование. На практике это означает, что вы тратите больше времени на просмотр общей картины своего проекта машинного обучения, чем на детальное изучение деталей для детального проектирования функций. Это дает вам гораздо лучшее представление о том, что происходит, что может быть важным компонентом успеха при работе с разработкой функций.

Первоначально опубликовано на https://xpresso.ai 30 марта 2022 г.