Во второй части нашей серии статей по обнаружению трендов мы рассмотрим классификатор K-ближайших соседей (KNN) как альтернативный метод обнаружения трендов на финансовых рынках.

Классификатор KNN — это простой и универсальный алгоритм, используемый как для задач классификации, так и для задач регрессии. Мы объясним, как работает классификатор KNN, и продемонстрируем его применение, используя базовые методы, определенные в первой части.

Понимание классификатора K-ближайших соседей (KNN)

Классификатор KNN — это непараметрический алгоритм, использующий принцип подобия для классификации точек данных. Учитывая новую точку данных, алгоритм KNN находит K ближайших точек данных (соседей) из обучающего набора данных на основе метрики расстояния (например, евклидово расстояние) и назначает класс большинства среди K соседей новой точке данных. В задачах бинарной классификации, таких как наша, KNN назначает класс с наибольшим количеством голосов в качестве прогнозируемого класса.

Подводя итог процессу классификатора KNN:

  1. Вычислите расстояние между новой точкой данных и всеми точками в обучающем наборе данных.
  2. Выберите точки данных K с наименьшими расстояниями.
  3. Определите мажоритарный класс среди K соседей.
  4. Назначьте класс большинства в качестве прогнозируемого класса для новой точки данных.

KNN не делает никаких предположений о базовом распределении данных и может адаптироваться к сложным шаблонам. Однако он может быть чувствителен к зашумленным данным и требует значительных вычислительных ресурсов для больших наборов данных.

Внедрение обнаружения тренда с помощью KNN

Чтобы упростить наш код и обеспечить согласованную обработку данных, мы будем использовать те же базовые методы и набор данных, что и в части 1. Этот подход будет применен к нашему классификатору KNN, который анализирует K ближайших соседей для классификации тенденций в течение первых 15 лет. минут каждого торгового дня. Таким образом, мы можем избежать избыточности и поддерживать согласованность данных на протяжении всего анализа.