Киберпреступность и матрица путаницы

Киберпреступность в широком смысле определяется как любая незаконная деятельность, связанная с компьютером, другим цифровым устройством или компьютерной сетью. Киберпреступность включает распространенные угрозы кибербезопасности, такие как социальная инженерия, использование уязвимостей программного обеспечения и сетевые атаки. Но это также включает в себя преступные действия, такие как протесты хактивистов, преследование и вымогательство, отмывание денег и многое другое.

Киберпреступность нацелена как на отдельных лиц, так и на компании. Как правило, злоумышленники нацеливаются на предприятия с целью получения прямой финансовой выгоды, саботажа или прерывания операций. Они нацелены на отдельных лиц в рамках крупномасштабных мошеннических действий или для компрометации их устройств и использования их в качестве платформы для гнусной деятельности.

Матрица путаницы в машинном обучении

Матрица путаницы — это матрица, используемая для определения эффективности моделей классификации для заданного набора тестовых данных. Его можно определить, только если известны истинные значения тестовых данных. Саму матрицу легко понять, но связанные с ней термины могут сбивать с толку. Так как он показывает ошибки в производительности модели в виде матрицы, поэтому также известен как матрица ошибок. Некоторые особенности матрицы путаницы приведены ниже:

Для 2 классов прогнозирования классификаторов матрица представляет собой таблицу 2 * 2, для 3 классов - таблицу 3 * 3 и так далее.
Матрица разделена на два измерения: прогнозируемые значения и фактические значения, а также общее количество прогнозов.
Прогнозируемые значения — это те значения, которые прогнозируются моделью, а фактические значения — это истинные значения для данных наблюдений.
Это выглядит как таблица ниже:

В приведенной выше таблице есть следующие случаи:

Верно отрицательный: модель дала прогноз "Нет", и реальное или фактическое значение также было "Нет".
Истинно положительный: модель предсказала да, и фактическое значение также было верным.
Ложноотрицательный результат: модель предсказывала «нет», но фактическое значение было «да». Это также называется ошибкой типа II.
Ложное срабатывание: модель предсказала Да, но фактическое значение было Нет. Это также называется ошибкой первого рода.

Необходимость матрицы путаницы в машинном обучении

Он оценивает производительность моделей классификации, когда они делают прогнозы на тестовых данных, и сообщает, насколько хороша наша модель классификации.
Он не только сообщает об ошибке, допущенной классификаторами, но и о типе ошибки, например, об ошибке типа I или типа II.
С помощью матрицы путаницы мы можем рассчитать различные параметры модели, такие как точность, точность и т. д.

Мы можем использовать матрицу путаницы для расчета различных показателей:

Точность: значения матрицы путаницы используются для расчета точности модели. Это отношение всех правильных прогнозов к общему количеству прогнозов (общие значения). Точность = (TP + TN)/(TP + TN + FP + FN)

2. Точность:(Tверных положительных результатов / Pпересчитанных положительных результатов) = TP / TP + FP

3. Отзыв: (Tошибочные положительные результаты / все фактические положительные результаты) = TP / TP + FN

4. Специфичность: (Tправильные негативы / все фактические негативы) = TN / TN + FP

5. Неправильная классификация: (все неправильно / все) = FP + FN / TP + TN + FP + FN

Ошибка типа I

Ошибка такого типа может оказаться очень опасной. Наша система не предсказала атаки, но в действительности атака имеет место, в этом случае никакое уведомление не дошло бы до службы безопасности, и ничего нельзя было бы сделать для ее предотвращения. Описанные выше случаи ложного срабатывания попадают в эту категорию, поэтому одной из целей модели является минимизация этого значения.

Ошибка второго рода

Этот тип ошибок не очень опасен, так как наша система на самом деле защищена, но модель предсказала атаку. команда получит уведомление и проверит наличие вредоносной активности. Это не причиняет никакого вреда. Их можно назвать ложной тревогой.

Пример. Мы можем понять матрицу путаницы на примере.

Предположим, мы пытаемся создать модель, которая может предсказать результат болезни: есть ли у человека эта болезнь или нет. Итак, матрица путаницы для этого задается как:

Из вышеприведенного примера мы можем сделать вывод, что:

Таблица дана для двухклассового классификатора, который имеет два предсказания «Да» и «НЕТ». Здесь «Да» означает, что у пациента есть заболевание, а «Нет» означает, что у пациента нет этого заболевания.
Всего классификатор сделал 100 прогнозов. Из 100 прогнозов 89 — верные прогнозы, а 11 — неверные прогнозы.
Модель давала прогноз «да» 32 раза и «нет» 68 раз. При этом фактическое «да» было 27 раз, а фактическое «нет» — 73 раза.

Вывод

С помощью матрицы путаницы мы можем уменьшить кибератаки, отслеживая их, и это очень сильно снижает ошибку типа 1.