Функцииcutree и fviz_cluster в программировании на R могут сегментировать вашу дендрограмму в соответствии с потребностями кластерного анализа.

В предыдущем посте я объяснил, как создавать дендрограммы с помощью программирования на R — они полезны для группировки данных наблюдений в статистически идентифицируемые группы, указывая, какие наблюдения находятся близко или далеко друг от друга. Размер дендрограммы может оказаться слишком длинным из-за большого количества отображаемых переменных. Во многих случаях вам придется уменьшить количество отображаемых листьев, чтобы выделить сегмент для визуализации или удалить часть наблюдений, которые не важны для анализа. Здесь в игру вступает функция cutree().

Разделение дендрограммы — функцияcutree()

Функция cuttree() принимает объект дендрограммы и настраивает либо количество отображаемых групп из желаемого количества кластеров, либо количество высот (клад) в дендрограмме. Если вы не знакомы с дендрограммами, вам следует прочитать мой пост о дендрограммах, в котором объясняется ценность дендрограмм и то, как они создаются.

Функция применяется к объекту hclust(). Параметры cuttree() указывают, где следует разрезать древовидную схему объекта hclust. Срез дендрограммы можно выбрать двумя способами — по количеству желаемых кластеров.

В приведенном ниже примере функцияcutree() применяет шесть кластеров (k = 6) к данным поиска, загруженным из консоли поиска Google. Немного о библиотеке в программировании на R, searchconsoleR: библиотека позволяет вам получить доступ к учетной записи Google Search Console через функцию scr_auth(). Библиотека должна запросить у вас доступ через API к вашей учетной записи Google для Search Console, поэтому вам следует убедиться, что выбранный вами веб-сайт сначала настроен в вашей учетной записи Search Console.

Данные, загруженные в объект, содержат поисковые запросы — дендрограмма группирует результаты запроса в соответствии с позицией, которую они занимают в поисковом запросе. Независимо от того, какие данные вы используете, на следующем шаге их следует поместить в объект hclust.