Публикации по теме 'feature-engineering'


Разработка функций с помощью Snowflake
В этой статье я покажу вам, насколько легко выполнить проектирование функций с помощью Snowflake, используя недавно выпущенный Snowpark : API DataFrame, который позволяет инженерам данных, специалистам по данным и разработчикам использовать предпочитаемый ими язык и знакомые концепции программ, а затем выполнять эти рабочие нагрузки прямо в Snowflake. Snowpark, который в настоящее время находится в стадии предварительной версии, изначально поддерживает Scala / Java и скоро также будет..

Рекомендация категории Elo Merchant — пример машинного обучения
Обзор Введение Бизнес-проблема Сопоставление с проблемой ML Обзор данных Исследовательский анализ данных Подход к первому разрезу Разработка функций Моделирование Представление на Kaggle Развертывание модели Заключение и будущие ссылки Ссылки и ссылки Введение Это конкурс избранных прогнозов, который проводила компания Elo. Один из крупнейших платежных брендов в Бразилии установил партнерские отношения с продавцами, чтобы предлагать акции или скидки держателям карт...

Функциональная инженерия в машинном обучении
Различные аспекты особенности проектирования Модель машинного обучения - это решение бизнес-проблемы в организации. Его можно использовать, чтобы заставить что-то работать лучше или помочь в принятии человеческих решений без участия человека. В большинстве случаев группа специалистов по анализу данных придумывает несколько моделей для решения данной проблемы. Разработка функций полезна для команды специалистов по анализу данных при оценке компромиссов в отношении эффективности их..

Встраивание сущностей с использованием t-SNE
Хорошо известный инструмент уменьшения размерности может быть полезен для встраивания категориальных признаков. Мы обсуждали некоторые из возможных способов внедрения категориальных функций: Kernel PCA и Spectral Encoding . Цель такого внедрения - отобразить категориальные признаки в векторы в низкоразмерном пространстве. Преимущество этого сопоставления в том, что оно значительно снижает переоснащение по сравнению с 1-горячим кодированием. Однако мы можем потерять информацию и..

Категоризация: Маркировка электронных писем
Подробное описание проблемы. Предположим, у вас есть набор электронных писем. В дополнение к корпусу у вас также есть связанные теги для электронных писем. Учитывая новое электронное письмо, как можно связать тег с новым электронным письмом. Хотя существует множество способов и подходов к тегированию электронных писем. От простых до более сложных. В этой статье мы рассмотрим простые функции, которые могут помочь в этом. Предварительная обработка электронной почты :..

ПРИМЕНЯЙТЕ МАШИННОЕ ОБУЧЕНИЕ ДЛЯ ВЫЯВЛЕНИЯ ЗАБОЛЕВАНИЙ СЕРДЦА
Для меня важнее всего моя родина и идеология, которой я придерживаюсь Куанг Кхай Нгуен Хунг I) Введение Сердечно-сосудистые заболевания (ССЗ) вызываются нарушениями работы сердца и сосудов. Сердечно-сосудистые заболевания включают ишемическую болезнь сердца (инфаркт миокарда), нарушение мозгового кровообращения (инсульт), гипертонию (высокое кровяное давление), заболевание периферических артерий, ревматический порок сердца и врожденный порок сердца. сердечная недостаточность...

Вменения отсутствующих значений MICE и KNN Объяснение и реализация с помощью Python
В продолжение моего блога о недостающих значениях и о том, как с ними обращаться. Я здесь, чтобы поговорить о еще двух очень эффективных методах обработки недостающих данных с помощью: MICE или множественное исчисление цепным уравнением Вменение KNN или K-ближайшего соседа Сначала мы поговорим о множественном исчислении цепным уравнением . Множественный расчет по цепочному уравнению предполагает, что данные являются MAR , то есть отсутствуют случайным образом. Иногда данные,..