Основная проблема возникает из-за того, что алгоритмы машинного обучения изначально не были разработаны для борьбы с красноречивыми и динамичными противниками, и поэтому, по идее, весь уровень безопасности может быть нарушен путем использования соответствующих проблем безопасности, связанных с освоением алгоритмов путем тщательной подделки необработанных данных. данные.

Здесь на помощь приходит состязательное обучение !!

Соревновательное обучение - это новая область исследований, которая в основном заключается в конвергенции машинного обучения и кибербезопасности. Основное внимание уделяется возможности безопасной реализации подходов машинного обучения в неблагоприятных обстоятельствах, таких как фильтрация спама, защита данных и биометрическая идентификация.

Что такое состязательное машинное обучение?

Состязательное машинное обучение - это метод, используемый в машинном обучении, чтобы обмануть или сбить с толку обманчивую модель ввода. Хотя состязательное машинное обучение может использоваться в ряде реализаций, этот метод наиболее широко используется для выполнения вторжения или запуска сбоя в среде машинного обучения. Тот же аспект атаки можно легко настроить для работают с несколькими версиями различных баз данных или фреймворков.

Состязательное машинное обучение следует использовать вместо атаки белого или черного ящика. При атаке белого ящика злоумышленник изучает внутреннюю часть используемой модели, а при атаке черного ящика - хакер распознает только результаты прототипа.

Типы состязательных атак с использованием машинного обучения:

Состязательные атаки машинного обучения можно разделить на неверную интерпретацию или искажение данных. Ошибочно классифицированные входные данные являются наиболее распространенным типом, когда злоумышленники скрывают вредоносный материал в конвейерах алгоритмов машинного обучения. Цель этой стратегии состоит в том, чтобы устройство неправильно идентифицировало конкретный набор данных. Для этого можно использовать троянские эксплойты Backdoor после развертывания устройства.

Заражение данных - это когда злоумышленник пытается изменить процесс машинного обучения, помещая ложную информацию в репозиторий, делая результаты менее надежными. Цель этой формы вторжения - ослабить механизм машинного обучения и минимизировать полезность алгоритма.

Предотвращение состязательного машинного обучения:

Эти стратегии включают обучение сопернику, защитную дистилляцию.

Соревновательное обучение - это механизм, в котором представления о состязательных инцидентах добавляются к парадигме и классифицируются как сложные. Этот метод может быть эффективным в предотвращении большего числа враждебных атак машинного обучения, но требует значительного внимания.

Защитная дистилляция помогает сделать метод машинного обучения более универсальным, позволяя одной модели прогнозировать производительность других моделей, которые были изучены ранее. Этот метод можно использовать для классификации неизвестных угроз. Это аналогично размышлениям о генеративных состязательных сетях (GAN), которые создают две вычислительные модели вместе для ускорения процессов машинного обучения - концепция, согласно которой две нейронные сети используются одновременно.

Реальные случаи состязательного обучения:

В 2019 году исследователи из IBM Research, Amazon и Техасского университета создали злобные иллюстрации, которые могут обмануть модели машинного обучения классификаторов контента, такие как системы обнаружения спама и настроений. Состязательные экземпляры на основе текста, также известные как «перефразирующие атаки», изменяют векторы признаков в части информации, чтобы вызвать ошибку неправильной диагностики в процессе машинного обучения, сохраняя при этом согласованный контекст для конкретного пользователя.

Центр безопасности Tencent продемонстрировал, как им удалось перехитрить Tesla Model S на сменяющуюся полосу движения, чтобы она врезалась прямо в встречные автомобили. Им нужно было разместить три символа на полосе, создавая иллюзию линии. Функция автопилота транспортного средства, которая зависит от распознавания изображений, улавливала символы и воспринимала их, чтобы указать, что путь поворачивает в сторону. Итак, машина поворачивала в том направлении.