Публикации по теме 'feature-engineering'


Разработка функций — Болливудские фильмы
Искусственный интеллект и машинное обучение проникли во все отрасли, принося значительную прибыль тем, кто в них вложился. По мере того, как технологии машинного обучения становятся все более мощными и распространяются, компании считают своим долгом внедрить эти технологии, чтобы получить конкурентное преимущество. В то время как машинное обучение включает в себя обучение компьютеров выполнению задач без явных инструкций, объединение согласованных данных для успешного обучения модели ML..

Выбор функций с учетом распределения с помощью Kydavra MUSESelector
Один из наиболее интуитивно понятных способов выбора функций - это выяснить, насколько распределение классов отличается друг от друга. Однако на некоторых интервалах распределение признака по классам может быть разным, а на других интервалах оно может быть практически таким же. Итак, мы можем сделать вывод, что признаки, которые имеют наибольшее количество интервалов, в которых распределение классов различается, являются лучшими функциями. Эта логика реализована в Минимальной..

Выбор байесовской модели: как метод сокращения признаков
Мягкое введение в применение байесовской модели выбора для определения важных функций для создания моделей машинного обучения. Часто серьезным препятствием, с которым мы сталкиваемся при построении моделей прогнозирующего машинного обучения, является поиск лучшего подмножества функций, которые точно отображают лежащую в основе взаимосвязь между дескрипторами и предикторами. Когда у нас есть избыточные функции в наших моделях машинного обучения, они не только увеличивают время обучения..

Совет по машинному обучению: использование ротационных данных
Может возникнуть время, когда вам нужно будет прогнозировать, используя данные о вращении либо в качестве объекта, либо в качестве цели. Может показаться, что включение градусов прямо в вашу модель сработает, но будьте осторожны, это не то, что вы хотите. Почему алгоритмы машинного обучения ненавидят степени Проще говоря, они не гладкие! Я имею в виду, что шкала градусов телепортируется с 359 обратно на 0 градусов по мере продвижения. Смотреть: В этом формате алгоритм..

Разработка функций для движения цены акций
Недавно я участвовал в конкурсе Kaggle , организованном Two sigma . Речь идет об использовании рыночных и новостных данных для прогнозирования движения цены акций на 10 дней. Подробные объяснения каждого столбца хорошо написаны хостом, и их было бы полезно прочитать, чтобы понять, какую функцию я создаю. Также вы можете прочитать весь исходный код и объяснения из моего ядра Kaggle . Первое, что следует отметить в этом соревновании, это то, что это соревнование только для ядра,..

Feature-engine: новый пакет Python с открытым исходным кодом для разработки функций.
Feature-Engine - это библиотека Python с открытым исходным кодом, содержащая наиболее исчерпывающий набор преобразователей для разработки функций для использования в моделях машинного обучения. Feature-Engine упрощает и оптимизирует реализацию и непрерывный конвейер разработки функций, позволяя выбирать подмножества функций в своих преобразователях и возвращать фреймы данных для облегчения исследования данных. Преобразователи Feature-Engine сохраняют функциональность Scikit-learn с..

Подробное руководство по машинному обучению (часть 2 из 3)
Добро пожаловать во вторую часть серии Всеобъемлющее руководство по машинному обучению . В первой части этой серии мы рассмотрели приведенные ниже концепции машинного обучения. Получение данных Очистка данных Исследовательский анализ данных Надеюсь, вам, ребята, было весело играть с этими концепциями в ваших собственных наборах данных. В этом посте давайте углубимся и изучим приведенные ниже концепции, которые значительно помогут в создании надежной модели машинного..