Публикации по теме 'feature-engineering'


Прогнозирование выживаемости пассажиров Титаника с помощью Sklearn
Вы слышали о Титанике Kaggle-Challenge? Это известная задача машинного обучения, в которой участники должны предсказать вероятность выживания пассажиров «Титаника» на основе различных характеристик. В этой статье мы будем использовать Sklearn для подбора модели, ее оценки и выполнения разработки функций для повышения ее точности. Для начала давайте загрузим набор данных из Kaggle. Вы можете найти его здесь: https://www.kaggle.com/c/titanic/data . Когда у вас есть набор данных, мы..

Математика, лежащая в основе регуляризации хребта и регуляризации лассо
Математика, лежащая в основе регуляризации хребта и регуляризации лассо Эта запись в блоге является частью первой из серии о стратегиях выбора и разработки качественных функций для моделей контролируемого машинного обучения. «Ты то, что делаешь». "Ты то, что ты ешь." Это две из нескольких идиом, в которые я искренне верю. Как новоиспеченный специалист по данным, я верю в следующую фразу: «мусор на входе, мусор на выходе». Если входные данные вашей модели некачественные, выход..

Вектор особенности: кубик машинного обучения LEGO
Я родом из региона, известного своими пляжами и солнечной погодой. Но я родился с одной маленькой проблемой, они мне не нравятся! Для этого есть много причин, и за эти годы я нашел несколько пляжей, на которых я мог бы хоть немного насладиться. Итак, я рассмотрю эту проблему, чтобы проиллюстрировать, что именно Feature Vectors. «В машинном обучении и распознавании образов характеристика - это индивидуальное измеримое свойство или характеристика наблюдаемого явления». [Bishop, 2006], а..

Углубленное руководство по извлечению функций
В сфере анализа данных и машинного обучения извлечение признаков является фундаментальным шагом для преобразования необработанных данных в формат, подходящий для анализа и моделирования. Это важнейший процесс, который повышает производительность алгоритмов, снижает сложность вычислений и помогает лучше понять закономерности, лежащие в основе данных. Эта статья углубляется в мир извлечения признаков, его важность, методы и приложения. Понимание извлечения функций Извлечение признаков —..

Оптимизация производительности: SelectKBest для эффективного выбора функций в машинном обучении
Оптимизация анализа данных с помощью SelectKBest Feature Selection Оглавление: Что такое выбор функций? Что такое SelectKBest? Как правильно выбрать score_func? Регрессия Классификация Сводка Что еще нужно узнать Ссылки Что такое выбор признаков? Выбор признаков  — это метод, используемый в машинном обучении для выявления наиболее релевантных признаков из большого набора признаков в наборе данных. Уменьшая количество функций,..

Feature Engineering, неужели это так просто?
Итак, вы начинающий Data Scientist в начале своего пути. Вы начинаете проходить онлайн-курсы о том, как стать специалистом по данным, и на этих курсах вы сталкиваетесь с разделом под названием «Разработка функций». Вы читаете его и думаете про себя: «Хммм… неужели все так просто?» Да! Это так просто в теории, но на практике все обстоит иначе. Проще говоря, Feature Engineering стремится сделать наши необработанные данные более подходящими для нашей цели машинного обучения. Это..

Художники, машинное обучение и программная инженерия
Недавно я стал любителем искусства и, путешествуя по новым городам, посещал бы художественные музеи, если позволяло время. Интересно, что я все чаще находил тесные связи между искусством, программной инженерией и машинным обучением. Я хотел бы воспользоваться этой возможностью, чтобы поделиться с вами некоторыми своими мыслями. Я вижу, что и машинное обучение, и программная инженерия разделяют то, что они решают реальные проблемы, значительно упрощая их с помощью определенных моделей,..