Публикации по теме 'feature-selection'


Решите двоичную классификацию с PointBiserialCorrSelector
Большинство проблем машинного обучения в современном мире относятся к классификационным. В основном специалисты по анализу данных и инженеры по машинному обучению используют корреляции как Пирсона или Спирмена, чтобы найти функции, которые больше всего коррелируют с прогнозируемым значением. Однако эти типы корреляций лучше работают с непрерывно-непрерывной парой функций. Вот почему мы в Sigmoid решили добавить в нашу библиотеку разделов функций - Kydavra, метод, который будет..

От ничего ко всему - искусство обработки и обработки данных
В этой статье я кратко расскажу, как правильное преобразование и управление данными в задаче прогнозирования может значительно повысить производительность стандартного алгоритма. Обсуждение вдохновлено и обобщено на основе решения конкурса Обнаружение мошенничества Kaggle. Решение унаследовало достоинства других игроков, занимающих ведущие позиции в таблице лидеров, и сочетает в себе своего рода волшебный трюк для повышения производительности прогнозирования. Подробнее об этом мы..

Выбор функций с использованием алгоритмов Relief на примере Python.
Глубокий анализ того, как работают алгоритмы Relief, где они используются, и пример на Python, как их использовать. Содержание: Важность выбора функции Обзор семейства алгоритмов Relief. Базовый алгоритм разгрузки ReliefF - алгоритм расширения. Пример Python. Использованная литература. 1. Важность выбора функций: Во многих задачах машинного обучения есть сотни или тысячи потенциальных функций, описывающих каждый входной объект. Большинство методов обучения плохо себя..

Выбор функции
В моей предыдущей статье я перечислил методы, используемые для разработки признаков. В этой статье я поделюсь методами выбора функций. Если вы не читали мою предыдущую статью, пожалуйста, используйте ссылку ниже, чтобы понять разработку функций, прежде чем начать с выбора функций — https://pavimca216.medium.com/feature-engineering-b7dcfff2367f . Выбор функций  – это процесс автоматического или ручного выбора наиболее важных переменных из входных данных для прогнозного анализа. Другими..

Важность методов выбора компонентов для моделей в машинном обучении
Следующая терминология используется в статье ниже особенности: их можно рассматривать как столбцы, используемые для прогнозирования целевой переменной. Можно использовать существующие функции в данных или создать или удалить функцию из существующих данных. модель: это математическая формула для вычисления и прогнозирования тенденции данных. Модели могут использоваться для прогнозирования целевой переменной регрессии (непрерывной) или классификации (дискретной). чрезмерная подгонка: это..

Открытый исходный код ShapRFECV - улучшенный выбор функций на основе SHAP
При построении модели машинного обучения выбор подходящего подмножества функций может значительно улучшить производительность окончательного решения. Этот пост представляет ShapRFECV , новый метод выбора признаков в моделях на основе дерева решений, который особенно хорошо подходит для задач двоичной классификации. Этот метод, реализованный на Python и теперь имеющий открытый исходный код, основан на общем алгоритме: рекурсивное исключение признаков (RFE). Однако, используя важность..

Что такое выбор функций и зачем он нам нужен в машинном обучении?
Первоначально опубликовано здесь: https://blog.contactsunny.com/data-science/what-is-feature-selection-and-why-do-we-need-it-in-machine-learning Если вы сталкивались с набором данных в процессе машинного обучения, который имеет более одной функции, вы также слышали о концепции под названием «Выбор функций». Сегодня мы узнаем, что это такое и зачем нам это нужно. Когда в наборе данных слишком много функций, было бы не идеально включить их все в нашу модель машинного обучения...