Публикации по теме 'feature-transformation'


Раскрытие возможностей разработки функций: раскрытие скрытых идей
Добро пожаловать в мир разработки признаков, где ученые данных раскрывают свой творческий потенциал, извлекая значимые закономерности и раскрывая истинный потенциал своих наборов данных. Инжиниринг признаков — это искусство создания новых переменных или преобразования существующих, позволяющее нам глубже погрузиться в тонкости наших данных и раскрыть скрытые идеи. В этом увлекательном путешествии мы изучим множество разнообразных преобразований, которые вдохнут жизнь в наши данные,..

Важность проектирования функций в машинном обучении и глубоком обучении
Реальные данные часто невозможно разделить. Это большая проблема, которую нужно решать. Таким образом, линейные модели, такие как логистическая регрессия, машинные классификаторы опорных векторов и линейная регрессия, не достигают требуемой цели. Иногда даже сложные модели, такие как Random Forest, XGBoost Classifiers, Neural Networks, не дают эффективных результатов, если данные не разделимы. Есть ли способ преобразовать наши данные так, чтобы они были частично или полностью..

Контрольный список для разработки функций
Существует множество веских причин для использования Контрольного списка при разработке функций в проекте машинного обучения. Я перечислил несколько ниже, которые в моем проекте оказались верными. Для устранения ошибок Для обеспечения единообразия Чтобы убедиться, что все необходимое выполнено и ничего не упущено. Чтобы снизить утомляемость от принятия решений, не заставляя нас помнить каждую мелочь Вот контрольный список, который поможет вам в реализации проекта..

Разработка функций - Автоматизация и оценка - Часть 1
Введение Это первая статья из серии, которую я пишу о разработке функций для науки о данных. В этой серии статей я хочу изучить различные методы создания и оценки функций с применением и без применения популярных фреймворков для создания и выбора функций. Конвейер обработки данных Создание непрерывного конвейера обработки данных для конкретной проблемы - это итеративный процесс, который включает в себя комбинацию различных процессов, рисунок [1]. Сначала специалисты по обработке..