Машинное обучение =>=>Кластеризация =Кластер K-средних

Кластерный анализ K-средних — это один из алгоритмов неконтролируемого обучения, используемый для разделения данных на сегменты или классификации данных на основе их характеристик с использованием сегодняшних или прошлых данных. K-Means используется для разделения точек данных на сегменты на основе их сходства (близости) друг к другу.

На первом этапе (…) центроиды кластера выбираются случайным образом.

(…) =› Это определяемый пользователем параметр, определяющий, сколько кластеров будет создано.

Случайные точки данных присваиваются количеству предоставленных кластеров, и кластеризация продолжается путем группировки соседних точек данных. Однако это не идеальная стратегия для долгосрочных решений. Поскольку начальные центры выбираются случайным образом, метод может давать разные результаты в разных начальных позициях. Он запускается с несколькими стартовыми позициями и выбирается модель, которая дает наилучшие результаты.

#Inertia измеряет, насколько хорошо набор данных был кластеризован с помощью K-Means.
#Рассчитывается путем измерения расстояния между каждой точкой данных и ее центроидом, возведения этого расстояния в квадрат и суммирования этих квадратов по одному кластеру.