Публикации по теме 'feature-engineering'
Прогнозирование выживаемости пассажиров Титаника с помощью Sklearn
Вы слышали о Титанике Kaggle-Challenge? Это известная задача машинного обучения, в которой участники должны предсказать вероятность выживания пассажиров «Титаника» на основе различных характеристик. В этой статье мы будем использовать Sklearn для подбора модели, ее оценки и выполнения разработки функций для повышения ее точности.
Для начала давайте загрузим набор данных из Kaggle. Вы можете найти его здесь: https://www.kaggle.com/c/titanic/data . Когда у вас есть набор данных, мы..
Математика, лежащая в основе регуляризации хребта и регуляризации лассо
Математика, лежащая в основе регуляризации хребта и регуляризации лассо
Эта запись в блоге является частью первой из серии о стратегиях выбора и разработки качественных функций для моделей контролируемого машинного обучения.
«Ты то, что делаешь». "Ты то, что ты ешь." Это две из нескольких идиом, в которые я искренне верю. Как новоиспеченный специалист по данным, я верю в следующую фразу: «мусор на входе, мусор на выходе». Если входные данные вашей модели некачественные, выход..
Вектор особенности: кубик машинного обучения LEGO
Я родом из региона, известного своими пляжами и солнечной погодой. Но я родился с одной маленькой проблемой, они мне не нравятся! Для этого есть много причин, и за эти годы я нашел несколько пляжей, на которых я мог бы хоть немного насладиться. Итак, я рассмотрю эту проблему, чтобы проиллюстрировать, что именно Feature Vectors.
«В машинном обучении и распознавании образов характеристика - это индивидуальное измеримое свойство или характеристика наблюдаемого явления». [Bishop, 2006], а..
Углубленное руководство по извлечению функций
В сфере анализа данных и машинного обучения извлечение признаков является фундаментальным шагом для преобразования необработанных данных в формат, подходящий для анализа и моделирования. Это важнейший процесс, который повышает производительность алгоритмов, снижает сложность вычислений и помогает лучше понять закономерности, лежащие в основе данных. Эта статья углубляется в мир извлечения признаков, его важность, методы и приложения.
Понимание извлечения функций
Извлечение признаков —..
Оптимизация производительности: SelectKBest для эффективного выбора функций в машинном обучении
Оптимизация анализа данных с помощью SelectKBest Feature Selection
Оглавление:
Что такое выбор функций? Что такое SelectKBest? Как правильно выбрать score_func? Регрессия Классификация Сводка Что еще нужно узнать Ссылки
Что такое выбор признаков?
Выбор признаков — это метод, используемый в машинном обучении для выявления наиболее релевантных признаков из большого набора признаков в наборе данных. Уменьшая количество функций,..
Feature Engineering, неужели это так просто?
Итак, вы начинающий Data Scientist в начале своего пути. Вы начинаете проходить онлайн-курсы о том, как стать специалистом по данным, и на этих курсах вы сталкиваетесь с разделом под названием «Разработка функций». Вы читаете его и думаете про себя: «Хммм… неужели все так просто?»
Да! Это так просто в теории, но на практике все обстоит иначе.
Проще говоря, Feature Engineering стремится сделать наши необработанные данные более подходящими для нашей цели машинного обучения. Это..
Художники, машинное обучение и программная инженерия
Недавно я стал любителем искусства и, путешествуя по новым городам, посещал бы художественные музеи, если позволяло время. Интересно, что я все чаще находил тесные связи между искусством, программной инженерией и машинным обучением. Я хотел бы воспользоваться этой возможностью, чтобы поделиться с вами некоторыми своими мыслями.
Я вижу, что и машинное обучение, и программная инженерия разделяют то, что они решают реальные проблемы, значительно упрощая их с помощью определенных моделей,..