Публикации по теме 'clustering'


Прекратите использовать метод Elbow для вычисления оптимальных кластеров в кластеризации k-средних
Основное руководство по анализу силуэта Кластеризация - это метод машинного обучения, который относится к группировке немаркированного набора данных. k-Means - это популярный алгоритм кластеризации, который группирует или группирует набор данных таким образом, что точки данных в одном кластере похожи друг на друга, тогда как точки данных в разных кластерах сильно различаются. Для обучения надежной модели k-средних необходимо настроить гиперпараметры. n_clusters - гиперпараметр,..

Неконтролируемое обучение: иерархическая кластеризация с использованием агломеративных и разделительных алгоритмов
В этом уроке мы рассмотрим тему иерархической кластеризации в обучении без учителя . Мы обсудим концепцию иерархической кластеризации и ее отличия от других методов кластеризации, включая методы агломерации и разделения. Мы проведем вас через шаги, связанные с агломеративной кластеризацией, такие как инициализация, расчет расстояния, объединение кластеров, создание дендрограммы и определение количества кластеров. Чтобы помочь вам лучше понять процесс, также предоставляются примеры кода..

Обучение науке о данных: День 23 — Обучение без присмотра, кластеризация и алгоритм k-средних
В большинстве наших предыдущих статей мы говорили о контролируемом обучении. Сегодня мы поговорим о том, что противоположно обучению без учителя. Неконтролируемое обучение Обычно при контролируемом обучении у нас есть два набора данных. Первый набор данных представляет собой пул доступной информации. Между тем, второй - это список классов. Вот пример. Допустим, у нас есть несколько новостных статей, они называются информационным набором данных. Для классификации у нас будут..

10 невероятно полезных алгоритмов кластеризации, которые вам нужно знать
В предыдущей статье мы объяснили, чем кластеризация, метод машинного обучения без учителя, отличается от метода машинного обучения с учителем. Мы также описали концепцию кластерного анализа на простом примере и показали, как ее можно использовать во многих компаниях для решения различных задач. В этой статье мы углубимся в алгоритмы кластеризации. Различные типы алгоритмов кластеризации Существует множество алгоритмов кластеризации. Фактически, на данный момент опубликовано..

Нечеткая кластеризация C-средних с Python
ОБУЧЕНИЕ БЕЗ КОНТРОЛЯ Нечеткая кластеризация C-средних с Python В этом посте я кратко расскажу о концепции неконтролируемого метода обучения, кластеризации Fuzzy C-Means и ее реализации в Python. Алгоритм кластеризации нечетких C-средних представляет собой метод обучения без учителя. Прежде чем узнать подробности, позвольте мне сначала расшифровать его причудливое название. Таким образом, «нечеткий» здесь означает «не уверен», что указывает на то, что это метод мягкой..

Введение в иерархическую кластеризацию в машинном обучении
Иерархическая кластеризация — это популярный неконтролируемый алгоритм машинного обучения, используемый для группировки похожих точек данных вместе. Это простой, но мощный алгоритм, который создает иерархию кластеров путем многократного слияния наиболее похожих кластеров. Иерархическая кластеризация может быть выполнена двумя способами: агломеративной кластеризацией и разделительной кластеризацией. Агломеративная кластеризация является наиболее часто используемым типом иерархической..

K-Means — Машинное обучение (обучение без учителя)
K-means — это алгоритм кластеризации, относящийся к неконтролируемому обучению. Возможно, вы слышали о K-ближайших соседях. Оба слова содержат одну и ту же букву «К», так что вы можете подумать, что они представляют собой похожий алгоритм или имеют что-то общее. Однако это разные алгоритмы. Прежде всего, K-ближайших соседей — это алгоритм обучения с учителем. Этот алгоритм в основном используется для непараметрической классификации, но также может использоваться для регрессии. С другой..