Публикации по теме clustering

Публикации по теме 'clustering'

Поиск доминирующего цвета на изображении

Когда я начал изучать распознавание изображений, это был первый настоящий проект, над которым я когда-либо работал, и это было весело. Поэтому я решил начать свой первый пост о машинном обучении с этого проекта. Проект направлен на поиск доминирующего цвета изображения. Но вы, должно быть, думаете, зачем нам это? Представьте, что вам нужно обобщить самые важные моменты футбольного матча, и вы компьютерный ученый, как бы вы решили эту проблему? Если вам нравится смотреть футбол, вы..

Кластерный анализ — машинное обучение без присмотра для парной торговли с использованием данных об индийских акциях

В этой статье вы узнаете, как работает неконтролируемое машинное обучение и как находить пары, используя биржевые данные для парной торговли. Здесь мы будем использовать три типа методов кластерного анализа, т. е. i) Кластеризация K-средних. ii) Иерархический кластер iii) Кластеризация распространения сходства Загрузите необходимый набор данных: СКАЧАТЬ НАБОР ДАННЫХ ЗДЕСЬ Этот набор данных содержит список 1000 лучших компаний на основе рыночной капитализации индийских компаний на..

Кластеризация

Как вы все уже знаете, поскольку вы попали на эту страницу, кластеризация — это фундаментальный метод машинного обучения и анализа данных. Это полезно для нескольких целей, таких как классификация, сегментация, уменьшение размерности, обнаружение выбросов и извлечение дополнительных сведений из данных. Алгоритмы неконтролируемой кластеризации, такие как K-means и DBSCAN, не требуют предварительных знаний или обучения и могут идентифицировать кластеры для группировки точек данных, которые..

Сбалансированное итеративное сокращение и кластеризация с использованием алгоритма иерархий (BIRCH) в машинном обучении

BIRCH (Сбалансированное итеративное сокращение и кластеризация с использованием иерархий) — это метод кластеризации, который группирует огромные наборы данных, сначала создавая меньшую и компактную сводку большого набора данных, которая содержит как можно больше информации. Вместо кластеризации всего набора данных эта меньшая сводка кластеризуется. Алгоритмы кластеризации, такие как кластеризация K-средних, неэффективны, а обработка больших наборов данных с ограниченным объемом..

Выбор функций для неконтролируемых задач: случай кластеризации

В связи с огромным ростом данных за последнее десятилетие выбор правильной функции становится серьезной проблемой. Хорошо известный метод обработки данных заключается в уменьшении размерности . Этот процесс пытается удалить избыточные и ненужные функции, которые могут снизить производительность. Эти методы можно разделить на извлечение/построение признаков и выбор признаков . В случае извлечения признаков размерность данных уменьшается за счет получения новых признаков на основе..

Анализ алгоритмов кластеризации

Сравнительное исследование алгоритмов кластеризации клиентских данных В этой статье проекта мы проанализируем три алгоритма кластеризации: K-Means, K-Medoids и иерархическая кластеризация. Мы сравним производительность этих алгоритмов на образце набора данных, используя оценку Силуэта. Мы также обсудим факторы, которые следует учитывать при выборе алгоритма кластеризации. Кластеризация — это неконтролируемый алгоритм машинного обучения, который группирует точки данных на основе их..

Неконтролируемое машинное обучение (кластеризация KMeans) с помощью Scikit-Learn

Машинное обучение можно разделить на две основные категории: машинное обучение с учителем и машинное обучение без учителя. В машинном обучении с учителем мы изначально предоставляем данные с соответствующей меткой для обучения модели, с помощью обученной модели мы можем найти метку для новых данных. Но в неконтролируемом машинном обучении мы бросаем данные в модель без какой-либо маркировки, модель найдет в данных закономерности. В неконтролируемом машинном обучении мы не можем найти..