Машины опорных векторов

SVM — это алгоритм классификации, в котором мы отображаем каждый элемент данных как точку в n-мерном пространстве (где n — количество имеющихся у вас признаков), при этом значение каждого признака является значением конкретной координаты. Затем мы выполняем классификацию, находя гиперплоскость, которая очень хорошо различает два класса.

К-средние

Алгоритм Kmeans — это итеративный алгоритм кластеризации, который пытается разбить набор данных на K предопределенных отдельных непересекающихся подгрупп (кластеров), где каждая точка данных принадлежит только к одной группе. Он пытается сделать точки данных внутри кластера как можно более похожими, в то же время сохраняя кластеры как можно более разными (далекими). Он назначает точки данных кластеру таким образом, чтобы сумма квадрата расстояния между точками данных и центроидом кластера (среднее арифметическое всех точек данных, принадлежащих этому кластеру) была минимальной.

Анализ основных компонентов