Публикации по теме 'clustering'


Что такое кластеризация: введение
Эта статья была написана Малик Джахан , членом группы технического контента Educative. Машинное обучение превратилось в панорамную область и применяется в самых разных дисциплинах. Выбор и применение большинства алгоритмов машинного обучения в первую очередь зависят от характера задачи и набора данных. Если набор данных содержит набор экземпляров или точек данных, которые не имеют заранее определенной метки, ожидается, что алгоритмы кластеризации обработают данные и попытаются..

Обучение и оценка моделей кластеризации (2/2)
Предыдущий ‹‹ Обучение и оценка моделей кластеризации (1/2) Существует несколько алгоритмов, которые можно использовать для кластеризации. Одним из наиболее часто используемых алгоритмов является Кластеризация K-средних , который в своей простейшей форме состоит из следующих шагов: Значения объектов векторизуются для определения n-мерных координат (где n — количество объектов). В примере с цветком у нас есть две характеристики: количество лепестков и количество листьев. Итак,..

Введение в алгоритмы кластеризации в Python
В науке о данных мы часто думаем о том, как использовать данные для прогнозирования новых точек данных. Это называется «обучение с учителем». Иногда, однако, вместо того, чтобы «делать прогнозы», мы вместо этого хотим разбить данные на сегменты. Это называется «обучение без учителя». Чтобы проиллюстрировать разницу, предположим, что мы работаем в крупной сети пиццерий, и нам было поручено создать функцию в программном обеспечении для управления заказами, которая будет прогнозировать..

Кластеризация K-средних — Алгоритм машинного обучения без присмотра
K-Means – это алгоритм кластеризации, который используется при наличии неразмеченных данных. Как описано в названии, это алгоритм машинного обучения без присмотра, а также мощный алгоритм в науке о данных. В этой статье мы кратко обсудим кластеризацию K-средних и ее реализацию. K-Means — это тип кластеризации разделов и, следовательно, один из самых простых, но мощных алгоритмов машинного обучения. Поскольку это неконтролируемый алгоритм, K-Means делает выводы из наборов данных,..

КЛАСТЕРИЗАЦИЯ
Как работает система рекомендаций ? Как компания выбирает место для своего нового магазина, чтобы получить максимальную прибыль ? Это алгоритм обучения без учителя , который группирует заданные данные таким образом, что точки данных с похожим поведением объединяются в одну группу. Основная цель состоит в том, чтобы разделить различные точки данных на разные группы, называемые кластерами , чтобы объекты в определенной группе имели сравнительно больше сходных характеристик, чем..

Обнаружение актуальных тем теории вероятностей с помощью BERTopic
Введение Любой, кто пытался ознакомиться с новой областью исследований, может признать, что это может оказаться сложной задачей. Попытка быстро установить смысл различных тем исследования в области может быть сложной задачей. Даже если вы имеете представление об исследовательском ландшафте, отслеживание эволюции этих тем может оставаться сложной задачей. В этой статье я хочу обсудить, как можно использовать тематическое моделирование и кластеризацию для решения этих проблем. Нашим..

Как обрабатывать категориальные переменные в кластеризации
Кластеризация — это популярный метод обучения без учителя, используемый для группировки похожих точек данных. Однако обработка категориальных переменных при кластеризации может быть сложной задачей, поскольку большинство алгоритмов кластеризации предназначены для работы с числовыми данными. В этом сообщении блога мы рассмотрим различные методы обработки категориальных переменных при кластеризации. Горячее кодирование Один из способов обработки категориальных переменных —..