Публикации по теме 'feature-engineering'
Разработка функций — Болливудские фильмы
Искусственный интеллект и машинное обучение проникли во все отрасли, принося значительную прибыль тем, кто в них вложился. По мере того, как технологии машинного обучения становятся все более мощными и распространяются, компании считают своим долгом внедрить эти технологии, чтобы получить конкурентное преимущество. В то время как машинное обучение включает в себя обучение компьютеров выполнению задач без явных инструкций, объединение согласованных данных для успешного обучения модели ML..
Выбор функций с учетом распределения с помощью Kydavra MUSESelector
Один из наиболее интуитивно понятных способов выбора функций - это выяснить, насколько распределение классов отличается друг от друга. Однако на некоторых интервалах распределение признака по классам может быть разным, а на других интервалах оно может быть практически таким же. Итак, мы можем сделать вывод, что признаки, которые имеют наибольшее количество интервалов, в которых распределение классов различается, являются лучшими функциями. Эта логика реализована в Минимальной..
Выбор байесовской модели: как метод сокращения признаков
Мягкое введение в применение байесовской модели выбора для определения важных функций для создания моделей машинного обучения.
Часто серьезным препятствием, с которым мы сталкиваемся при построении моделей прогнозирующего машинного обучения, является поиск лучшего подмножества функций, которые точно отображают лежащую в основе взаимосвязь между дескрипторами и предикторами. Когда у нас есть избыточные функции в наших моделях машинного обучения, они не только увеличивают время обучения..
Совет по машинному обучению: использование ротационных данных
Может возникнуть время, когда вам нужно будет прогнозировать, используя данные о вращении либо в качестве объекта, либо в качестве цели. Может показаться, что включение градусов прямо в вашу модель сработает, но будьте осторожны, это не то, что вы хотите.
Почему алгоритмы машинного обучения ненавидят степени
Проще говоря, они не гладкие! Я имею в виду, что шкала градусов телепортируется с 359 обратно на 0 градусов по мере продвижения. Смотреть:
В этом формате алгоритм..
Разработка функций для движения цены акций
Недавно я участвовал в конкурсе Kaggle , организованном Two sigma . Речь идет об использовании рыночных и новостных данных для прогнозирования движения цены акций на 10 дней. Подробные объяснения каждого столбца хорошо написаны хостом, и их было бы полезно прочитать, чтобы понять, какую функцию я создаю. Также вы можете прочитать весь исходный код и объяснения из моего ядра Kaggle .
Первое, что следует отметить в этом соревновании, это то, что это соревнование только для ядра,..
Feature-engine: новый пакет Python с открытым исходным кодом для разработки функций.
Feature-Engine - это библиотека Python с открытым исходным кодом, содержащая наиболее исчерпывающий набор преобразователей для разработки функций для использования в моделях машинного обучения. Feature-Engine упрощает и оптимизирует реализацию и непрерывный конвейер разработки функций, позволяя выбирать подмножества функций в своих преобразователях и возвращать фреймы данных для облегчения исследования данных. Преобразователи Feature-Engine сохраняют функциональность Scikit-learn с..
Подробное руководство по машинному обучению (часть 2 из 3)
Добро пожаловать во вторую часть серии Всеобъемлющее руководство по машинному обучению . В первой части этой серии мы рассмотрели приведенные ниже концепции машинного обучения.
Получение данных Очистка данных Исследовательский анализ данных
Надеюсь, вам, ребята, было весело играть с этими концепциями в ваших собственных наборах данных. В этом посте давайте углубимся и изучим приведенные ниже концепции, которые значительно помогут в создании надежной модели машинного..