Иерархическая кластеризация в машинном обучении

Иерархическая кластеризация — это часть неконтролируемого машинного обучения.

Иерархическая кластеризация, также известная как иерархический кластерный анализ (HCA), представляет собой неконтролируемое машинное обучение. Он группирует немаркированные наборы данных в группы, также известные как кластеры. Они очень похожи на кластеризацию K-средних, но отличаются от нее, поскольку здесь мы не определяем количество кластеров, как мы делаем это в кластеризации K-средних. Поскольку здесь мы не сталкиваемся с проблемами, с которыми мы сталкиваемся при кластеризации K-средних из-за заранее определенных кластеров. Следовательно, использование иерархических кластеров полезно. Следовательно, мы можем сказать, что такие платформы, как AI Startups, используют их для повышения производительности. Здесь сформированный кластер имеет древовидную структуру, благодаря чему называется дендрограммой.

Категории иерархического кластера

Мы две категории иерархических кластерных алгоритмов, они

Агломеративный: здесь наборы данных сгруппированы в разные кластеры в соответствии с восходящим методом. По сути, здесь каждый набор данных рассматривается алгоритмом как один кластер. Затем позже он начинает группироваться или объединяется с ближайшим кластером. И затем этот процесс поиска продолжается до тех пор, пока все кластеры не будут объединены в один кластер, в котором есть все наборы данных.
Разделение: здесь используется нисходящий метод. Что прямо противоположно агломеративному алгоритму.

Представление дендрограммы агломеративного алгоритма

Здесь мы увидим, как на самом деле работает агломеративный алгоритм,

Давайте рассмотрим шесть точек данных как 1, 2, 3, 4, 5, 6.

Шаг 1: Сначала мы будем рассматривать каждую цифру как один кластер, а затем рассчитаем расстояние между ними.
Шаг 2: Теперь мы объединим близкий кластер в один кластер.
Шаг 3: Здесь на этом шаге снова вычисляется расстояние между кластерами, и они объединяются в соответствии с ближайшим кластером.
Шаг 4: Снова выполняется та же процедура, что и раньше, и на этом этапе у нас остается два кластера.
Шаг 5: В конце мы объединяем оставшиеся кластеры, чтобы сформировать один кластер. То есть [1233456].

Разделительные кластеры — полная противоположность агломеративному иерархическому кластеру.

Иерархическая кластеризация в машинном обучении

Вопросы по теме