Публикации по теме 'clustering'


K-средства и квантование изображения [Часть 1]
K-средства и квантование изображения [Часть 1] Я случайно обсудил с моим коллегой университет, который он окончил, и я понял, что есть некоторые университеты, которые на самом деле используют систему выставления оценок, при которой студентам выставляются оценки на основе текущего распределения оценок студентов. не было установленной пороговой отметки для Отличия, Кредитоспособности, Пройдено или Неудачно. Это означает, что для того, чтобы получить отличия по всему университету, вам..

К-среднее Кластеризация…
Википедия определяет кластеризацию K-средних как: Кластеризация k-средних - это метод векторного квантования, исходный из обработки сигналов, который направлен на разделение n наблюдений на k кластеров, в каждом из которых наблюдение принадлежит кластеру с ближайшим средним значением (центры кластера или центроид кластера), служа прототипом кластера. Здесь возьмите n наблюдений и попытайтесь сгруппировать их (сгруппировать) в k кластеров. Это позволяет нам: 1. Узнавать об..

Захватывающий взгляд на кластеризацию из-за кулис
Его концепции и значение в машинном обучении С каждым днем ​​количество людей, занимающихся Data Science, увеличивается. Все можно свести к основному, а именно: знание основ в любой академической / исследовательской среде. Раньше я делился своими знаниями по таким темам, как Типы наборов данных , Предварительная обработка данных , Предварительная обработка данных в Python , Линейная регрессия , Деревья решений и Наивный байесовский классификатор . В этом посте я рассмотрю..

Ограниченная кластеризация - Введение
Как следует из названия, ограниченная кластеризация - это исследование и разработка алгоритмов кластеризации, которые пытаются объединить предыдущие знания данных в процессе кластеризации. Я решил написать эту статью, потому что считаю, что область ограниченной кластеризации не очень известна, она не так популярна, как многие другие области машинного обучения, но может быть полезна в некоторых ситуациях. Поэтому я думаю, что важно хотя бы знать о его существовании. Введение Вообще..

Понимание алгоритмов кластеризации K-средних, K-средних ++ и K-medoids
Обзор алгоритмов кластеризации K-средних, K-средних ++ и K-Medoids и их взаимосвязей. Эта статья также включает его реализацию с нуля и с использованием библиотеки sklearn. Кластеризация - это метод машинного обучения без учителя, который разделяет совокупность или точки данных на несколько групп или кластеров, так что точки данных в тех же группах больше похожи на другие точки данных в той же группе и не похожи на точки данных в других группах. Точки в одном кластере расположены..

Сглаживание временных рядов для лучшей кластеризации
Обработка финансовых серий для машинного обучения При анализе временных рядов наличие грязных и беспорядочных данных может изменить наши рассуждения и выводы. Это верно, особенно в этой области, потому что временная зависимость играет решающую роль при работе с временными последовательностями. С шумом или выбросами следует обращаться осторожно, следуя специальным решениям. В этой ситуации пакет tsmoothie может помочь нам сэкономить много времени при подготовке временных рядов..

NLU: тема открытия
Мы исследуем два разных подхода к автоматическому обнаружению тем без учителя: тематическое моделирование с помощью скрытого анализа направления (LDA ) и текстовая кластеризация . Допустим, мы хотим знать основные темы, затрагивающие вступительные титры к каждому эпизоду «Звездных войн». Есть ли способ у машины прочитать и обобщить нам основные темы и концепции? Предположим, они затрагивают несколько тем. n_topics = 7 LDA Мы можем использовать вероятностные..