Публикации по теме 'cluster-analysis'


ПРОГНОЗИРОВАНИЕ ВИДОВ ЦВЕТКОВ ИРИСА С КЛАСТЕРИЗАЦИИ K-СРЕДНИХ В PYTHON
Кластеризация — это метод обучения без учителя, который позволяет нам группировать набор объектов на основе схожих характеристик. В общем, это может помочь вам найти значимую структуру среди ваших данных, сгруппировать похожие данные вместе и обнаружить лежащие в их основе закономерности. Одним из наиболее распространенных методов кластеризации является алгоритм K-средних. Цель этого алгоритма состоит в том, чтобы разбить данные на множество так, чтобы общая сумма квадратов расстояний..

Сбор метрик/индексов оценки кластера и их реализация в python.
Разделение данных может быть выполнено с помощью различных алгоритмов, но разные алгоритмы или входные параметры вызывают разные кластеры или выявляют разные структуры кластеризации. Таким образом, проблема объективной и количественной оценки полученных кластеров или того, является ли полученная структура кластеризации значимой, называется проверкой кластера. Метрики, используемые для проверки кластера, называются индексами/метриками кластеризации. Индексы кластеризации в основном..

Сравнение моделей обучения без учителя
Неконтролируемое обучение — это одна из двух ветвей машинного обучения, другая — обучение с учителем. Неконтролируемая часть возникает из-за того, что у нас нет доступа к помеченным данным (но мы все равно пытаемся «пометить» их!) Ниже я опишу некоторые сильные и слабые стороны популярных моделей обучения без учителя. ) K-Means — рабочая лошадка кластерного анализа. K-means пытается распределить точки данных по кластерам, которые определяются с помощью итеративной процедуры поиска..

Все, что вам нужно знать об алгоритме DBSCAN
Введение DBSCAN - это разновидность обучения без учителя. Поскольку мы уже знаем о кластеризации K-средних, иерархической кластеризации, и они работают на разных принципах, например, K-среднее - это алгоритм на основе центроида, затем иерархический алгоритм основан на агломерации, и, как DBSCAN, это кластеризация на основе плотности алгоритм, который является очень популярным и мощным алгоритмом. Из большого количества данных DBSCAN может обнаружить кластер различных форм и размеров,..

Сегментация клиентов с использованием кластерного анализа K-средних
Кластеризация вступает в действие каждый раз, а затем и в нашей повседневной жизни, когда Netflix рекомендует фильм на основе истории просмотров членов нашей семьи, наша электронная почта классифицирует некоторые из них как спам, спортивный клуб создает лучшую футбольную команду или какая-либо компания классифицирует своих клиентов по категориям. целевые с правильными маркетинговыми кампаниями. Кластеризация — это наиболее часто используемый неконтролируемый алгоритм для разделения..

Изучите метод кластеризации 101 за 5 минут
Введение В реальной жизни мы можем столкнуться с проблемой, когда хотим сгруппировать наши данные и изучить базовую структуру. Например, поиск подгруппы наших пользователей может помочь нам разработать более конкретные маркетинговые стратегии. Другой пример: у нас есть много данных, и мы хотим сжать их до меньшего количества используемых функций. Методом, решающим такую ​​проблему, является кластеризация. Кластеризация — один из самых популярных неконтролируемых подходов. Он..

Познакомьтесь с кластерным анализом
В этой статье я планирую обсудить теоретические основы метода группировки машинного обучения — кластеризации. Мы используем методы классификации, чтобы представить удобный метод организации большого набора данных. Эти группы помогут руководителям принимать решения. Например, в банковской сфере менеджеры хотят идентифицировать своих клиентов NPA. Поэтому для этого нам нужно сначала сгруппировать их клиентов на основе ключевых показателей/параметров. Затем мы можем определить, какая..