Публикации по теме 'feature-engineering'


Методы выбора функций
Что такое выбор функции? Вы все видели наборы данных. Иногда они маленькие, но часто очень большие по размеру. Становится очень сложно обрабатывать очень большие наборы данных, по крайней мере, достаточно значительные, чтобы вызвать узкое место обработки. Время обучения и производительность алгоритма машинного обучения сильно зависят от функций в наборе данных. В идеале мы должны сохранять в наборе данных только те функции, которые действительно помогают нашей модели машинного..

Разработка функций переменных DateTime для анализа данных, машинного обучения
ВВЕДЕНИЕ Поля DateTime требуют, чтобы функция Feature Engineering превратила их из данных в информативную информацию, которую можно использовать в наших моделях машинного обучения. Этот пост разделен на 3 части и бонусный раздел ближе к концу, мы будем использовать комбинацию встроенных функций pandas и NumPy, а также наши функции для извлечения полезных функций. Часть 1 - Извлечение компонентов даты / времени Часть 2 - Создание логических флагов Часть 3 - Расчет разницы в дате /..

Разработка функций, часть 1 - Методы вменения.
Понимание различных механизмов отсутствия данных и полный анализ случая. 🪐Отсутствуют данные: Отсутствующие данные или отсутствующие значения возникают, когда данные для определенного наблюдения в переменной не сохраняются. • Отсутствующие данные — обычное явление в большинстве наборов данных. • Отсутствующие данные могут существенно повлиять на выводы, которые можно сделать на их основе. • Во многих организациях информация собирается в форму человеком, разговаривающим с..

Разница между стандартизацией и нормализацией
Цель этого блога - объяснить наиболее запутанные концепции проектирования функций, такие как стандартизация и нормализация. Оба выглядят очень похожими, и большую часть времени большинство людей не понимают разницы между ними и сценария использования каждого из них. Но не беспокойтесь, этот блог будет действовать как рука помощи, чтобы все понимали разницу между ними и их вариантами использования. Совершенно нормально, если вы запутались между темами «Стандартизация» и..

Праздник: настройте собственный магазин функций машинного обучения в Kubernetes
Многообещающее облачное решение для магазина функций машинного обучения с открытым исходным кодом! История : за последний год Feast претерпел несколько изменений. В текущей версии (0.9) можно установить сквозную настройку на кластере barebone k8s. Команда Feast в настоящее время работает над версией 0.10, которая будет выпущена в апреле 2021 года (ожидается, что в дальнейшем упростите архитектуру и настройку). В мире есть компании, которые уже используют Feast или находятся в..

РИСК ПО УМОЛЧАНИЮ НА ГЛАВНУЮ КРЕДИТУ - Практический пример непрерывного машинного обучения - ЧАСТЬ 2: Разработка и моделирование функций
РИСК ПО УМОЛЧАНИЮ ДЛЯ ДОМАШНЕГО КРЕДИТА - Конечный пример использования машинного обучения - ЧАСТЬ 2: Разработка и моделирование функций «Придумать функции сложно, отнимает много времени и требует экспертных знаний. «Прикладное машинное обучение» - это в основном разработка функций ». - Проф. Эндрю Нг. В первой части серии мы рассмотрели постановку задачи и все предостережения к ней. Мы также рассмотрели исследовательский анализ данных, с помощью которого мы смогли сделать..

Уловки кодирования этикеток
Кодирование этикеток - раскройте свои данные, закодировав их В этой статье я расскажу о некоторых приемах работы с этикетками. Я представляю методы, позволяющие выявить внутреннее значение строковых данных. Первая часть напоминает классические методы, а следующие разделы посвящены более конкретным методам. Как работать с: 1. метками 2. цветами 3. местоположениями 4. периодической функцией 1. Как конвертировать этикетки Большинство алгоритмов машинного обучения не..