Коммуникационные сети быстро расширяются и становятся все более сложными. Следовательно, обычные алгоритмы или протоколы, основанные на правилах, могут больше не работать с максимальной эффективностью в этих сетях. Машинное обучение (ML) в последнее время применяется для решения сложных проблем во многих областях, включая финансы, здравоохранение и бизнес. Алгоритмы ML могут предлагать вычислительные модели, которые могут решать сложные проблемы сети связи и, следовательно, повышать производительность.

Учитывая, что исследования по применению ML в сетях все еще продолжаются и имеют много возможностей для расширения, в нашем отчете представлен обзор последних тенденций в применении ML в сетях и обзор последних достижений в этой области. В этом отчете также указаны пробелы, которые могут быть заполнены в будущих исследованиях по включению ML в сети. Основываясь на нашем исследовании, последнее исследование показывает, что наиболее известные приложения ML в сетях включают эти шесть приложений.

i. Распознавание информации

ii. Прогнозы производительности сети

iii. Классификация трафика

iv. Прогноз трафика

v. Адаптация к сети

vi. Управление ресурсами.

В самом широком смысле классификация сетевого трафика относится к системе, в которой программа распределяет потоки трафика по источникам (например, приложениям и протоколам), которые их производят. Классификация трафика с годами вызывает все больший интерес как важный шаг на пути к процессу управления сетью. Кроме того, классификация трафика охватывает широкий спектр приложений в целях QoS, ценообразования у интернет-провайдеров (ISP), обнаружения аномалий и т. д. В связи с продолжающимся ростом интернет-приложений и количества подключенных устройств применение эффективных методов классификации трафика является критически важным. Методы классификации сетевого трафика можно разделить на три основных класса, перечисленных ниже:

На основе порта: эти методы просто связывают службы/приложения с зарегистрированными номерами портов, например. HTTP-порт и классифицировать трафик в соответствии с используемым номером порта. Методы на основе портов являются одними из первых методов классификации трафика.

Несмотря на преимущества методов на основе портов, таких как простота реализации, развертывание новых методов связи, таких как методы туннелирования и случайного назначения портов, вызывает серьезные трудности и влияет на их производительность и применимость.

На основе полезной нагрузки. Методы на основе полезной нагрузки, также известные как DPI, тщательно изучают содержимое захваченного пакета, особенно информацию, относящуюся к уровню приложения, чтобы связать пакет с конкретной службой/приложением. . Чтобы сделать прогноз, эта методология обычно использует предопределенные подписи или шаблоны для каждого протокола связи, а затем обнаруживает эти шаблоны, чтобы отличать потоки трафика друг от друга. Методы классификации на основе полезной нагрузки страдают от трех основных проблем в традиционных сетевых парадигмах, перечисленных ниже:

1. У них возникают трудности с классификацией зашифрованного трафика.

2. Политики конфиденциальности могут ограничивать доступ к содержимому пакетов.

3. Методы полезной нагрузки накладывают большие вычислительные накладные расходы на системы связи.

В результате этих трудностей были предложены новые методы классификации трафика, устраняющие необходимость проверки содержимого пакетов.

На основе потока. В основе методов на основе потока лежит предположение о том, что трафик, связанный с каждым приложением/службой, имеет почти уникальные статистические/временные характеристики. Следовательно, классификатор на основе потока может обрабатывать как зашифрованный, так и обычный трафик. Методы на основе потоков обычно используют традиционные модели машинного обучения, такие как дерево решений, логистическая регрессия и машина опорных векторов (SVM) для классификации трафика. Несмотря на то, что модели машинного обучения достигают замечательного уровня точности, им требуется огромное количество полностью размеченных данных для целей моделирования.