Публикации по теме 'feature-selection'


ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ И РЕАЛИЗАЦИЯ С ИСПОЛЬЗОВАНИЕМ R
Как линейная регрессия , так и логистическая регрессия являются частью обобщенной линейной модели (GLM), и основное различие между ними заключается в том, что линейная регрессия используется для найти прогнозируемые значения непрерывных зависимых переменных на основе непрерывных независимых переменных, тогда как логистическая регрессия помогает найти и предоставить прогнозируемые вероятности зависимой двоичной переменной, будет ли переменная классифицироваться как 0 и 1 на основе..

Решите двоичную классификацию с помощью PintBiserialCorrSelector
Большинство проблем машинного обучения в современном мире относятся к классификационным. В основном специалисты по анализу данных и инженеры по машинному обучению используют корреляции как Пирсона или Спирмена, чтобы найти функции, которые больше всего коррелируют с прогнозируемым значением. Однако эти типы корреляций лучше работают с непрерывно-непрерывной парой функций. Вот почему мы в Sigmoid решили добавить в нашу библиотеку разделов функций - Kydavra, метод, который будет..

Неортодоксальный, но эффективный способ выбора функций при решении задач машинного обучения в Python:
Одной из фундаментальных проблем машинного обучения является выбор правильных подмножеств доступных функций, которые отображают отношение переменных к целевому понятию. Если модель, обученная на ненужных функциях, не идентифицирована должным образом, она будет плохо работать с точки зрения любой оценки метрик. В этих коротких заметках я хотел бы представить неортодоксальный подход к выбору функций, используемый в различных сценариях многими энтузиастами машинного обучения,..

Подробное руководство по машинному обучению (часть 2 из 3)
Добро пожаловать во вторую часть серии Всеобъемлющее руководство по машинному обучению . В первой части этой серии мы рассмотрели приведенные ниже концепции машинного обучения. Получение данных Очистка данных Исследовательский анализ данных Надеюсь, вам, ребята, было весело играть с этими концепциями в ваших собственных наборах данных. В этом посте давайте углубимся и изучим приведенные ниже концепции, которые значительно помогут в создании надежной модели машинного..

Контрольный список для разработки функций
Существует множество веских причин для использования Контрольного списка при разработке функций в проекте машинного обучения. Я перечислил несколько ниже, которые в моем проекте оказались верными. Для устранения ошибок Для обеспечения единообразия Чтобы убедиться, что все необходимое выполнено и ничего не упущено. Чтобы снизить утомляемость от принятия решений, не заставляя нас помнить каждую мелочь Вот контрольный список, который поможет вам в реализации проекта..

Выбор функций - выбор лучшего, что важно с помощью Python
Исключить отходы и сохранить товар - универсальное правило. В машинном обучении мы хотим, чтобы наша модель была оптимизирована и была быстрой, для этого и для исключения ненужных переменных мы используем различные методы выбора функций. Основные причины использовать выбор функций: Чтобы быстрее обучить модель машинного обучения. Для повышения точности модели, если выбрано оптимизированное подмножество. Чтобы уменьшить сложность модели. Чтобы уменьшить переобучение и облегчить..

Выбор функции - использование генетического алгоритма
Давайте объединим возможности предписывающей и прогнозной аналитики. Все модели машинного обучения используют большой объем данных для обучения прогнозированию закономерностей в будущем. Это означает, что модели машинного обучения зависят от качества данных. Даже с малейшими ошибками модели могут обучаться и давать недопустимые или худшие результаты. Таким образом, качество данных, используемых для обучения, является первоочередной задачей организации. В этом направлении решающую..