Что такое оценка кластера в WEKA?

Что мы имеем в виду, когда говорим, что оцениваем кластеры в структуре WEKA? Кластеризация — это неконтролируемый подход к группировке объектов. Что мы имеем в виду, когда говорим, что хотим оценить результат? Кроме того, в дополнение к этому, когда мы говорим, что оцениваем кластеры поверх самих обучающих данных, что это значит?

Спасибо, Абхишек С.


person London guy    schedule 04.06.2012    source источник
comment
Weka почти не существует, когда дело доходит до кластеризации. Если вас интересует кластеризация (которая немного сложнее классификации), поищите альтернативы. Несколько советов по оценке: f-мера подсчета пар, скорректированный индекс Рэнда (ARI), индекс Фаулкса-Мэллоуза, индекс Жаккара, меры BCubed и т. д. - я не думаю, что у Weka есть какие-либо из них.   -  person Has QUIT--Anony-Mousse    schedule 05.06.2012


Ответы (1)


Как написано на этой странице:

Оценка. То, как Weka оценивает кластеризацию, зависит от выбранного вами режима кластеризации. Доступны четыре различных режима кластера (в виде кнопок на панели режима кластера):

  1. Use training set (по умолчанию). После создания кластеризации Weka классифицирует обучающие экземпляры в кластеры в соответствии с представлением кластера и вычисляет процент экземпляров, попадающих в каждый кластер. Например, приведенная выше кластеризация, созданная с помощью k-средних, показывает 43% (6 экземпляров) в кластере 0 и 57% (8 экземпляров) в кластере 1.
  2. В Supplied test set или Percentage split Weka может оценивать кластеризацию на отдельных тестовых данных, если представление кластера является вероятностным (например, для EM).
  3. Classes to clusters evaluation. В этом режиме Weka сначала игнорирует атрибут класса и создает кластеризацию. Затем на этапе тестирования кластерам назначаются классы на основе большинства значений атрибута класса в каждом кластере. Затем он вычисляет ошибку классификации на основе этого назначения, а также показывает соответствующую матрицу путаницы. Пример этого для k-средних показан ниже.
person Sicco    schedule 04.06.2012
comment
Спасибо за ссылку и развернутый ответ. - person London guy; 04.06.2012
comment
Есть идеи, как оценка классов для кластеров работает для EM? Взвешивает ли экземпляры по вероятности их попадания в кластер при определении значения большинства? - person kylejmcintyre; 26.10.2014
comment
sicco, можете ли вы проверить этот вопрос, если это возможно: stackoverflow.com/questions/32404742/ - person MonsterMMORPG; 04.09.2015