Обнаружение аномалий с контролируемым обучением

Моя последняя заметка посвящена особому типу обучения без учителя, который называется кластеризацией K-средних. На этой неделе мы рассмотрим, как можно использовать уникальный тип обучения с учителем для обнаружения аномалий.

Для чего можно использовать обнаружение аномалий?

Обнаружение аномалий можно использовать для выявления неисправных деталей в производстве, обнаружения случаев мошенничества в сфере финансовых услуг или обнаружения недостоверного поведения пользователей на веб-сайтах. Другими словами, его можно использовать для определения того, что что-то «не нормально», даже если вы еще не знаете, как выглядит «ненормально».

Как работает обнаружение аномалий?

Чтобы разработать алгоритм обнаружения аномалий, вы настраиваете свои данные немного иначе, чем для обычного контролируемого обучения. Вместо того, чтобы включать положительные и отрицательные примеры в обучающий набор, вы поместите все положительные примеры (т. нормальные примеры) в вашем тренировочном наборе.

При создании набора данных вам нужно выбрать функции, которые могут указывать на аномалию (например, сколько времени пользователь проводит на каждой странице веб-сайта). Это особенно полезно, если вы можете выбрать функции, которые имеют очень большие или очень маленькие значения в случае аномалии.

Затем вы будете обучать свою модель, подгоняя параметры функции плотности вероятности (например, гауссовского распределения) к вашему обучающему набору отрицательных примеров (т. е. неаномальным «обычные» примеры).

Затем для нового примера вы будете использовать модель для расчета вероятности появления этого примера в вашем распределении "нормальных" примеров.

Если вероятность ниже определенного уровня (представленного переменной ε), ваша модель классифицирует ее как аномалию. Вы можете настроить ε в зависимости от того, как ваша модель работает на перекрестной проверке примеров.

Вы также можете просмотреть свои ложноотрицательные результаты, чтобы придумать новые функции, которые помогут вам лучше выявлять аномалии.

В следующей заметке я рассмотрю пример того, как можно использовать машинное обучение для создания рекомендаций на основе контента для людей.

Обнаружение аномалий с контролируемым обучением

Для чего можно использовать обнаружение аномалий?

Как работает обнаружение аномалий?

Следующий

Прошлые заметки в этой серии

Обнаружение аномалий с контролируемым обучением

Для чего можно использовать обнаружение аномалий?

Как работает обнаружение аномалий?

Следующий

Прошлые заметки в этой серии

Вопросы по теме