Weka (среда анализа знаний Waikato), разработанная в Университете Вайкато, Новая Зеландия. Это бесплатное программное обеспечение под лицензией GNU General Public License. Проводник является основным интерфейсом Weka. На рисунке ниже показан Weka Explorer.

В верхней части Проводника вы увидите вкладки для каждого из ключевых шагов, которые необходимо выполнить на этапе создания модели:

Предварительная обработка. Слово «фильтр» используется Weka для обозначения набора процедур предварительной обработки данных. Вы применяете фильтры к своим данным, чтобы подготовить их к классификации или кластеризации.

Классификация. На вкладке "Классификация" можно выбрать алгоритм классификации, настроить параметры и обучить классификатор, который впоследствии можно будет использовать для прогнозов.

Кластер. Вкладка «Кластер» позволяет выбрать алгоритм кластеризации, настроить его параметры и выполнить кластеризацию непомеченного набора данных.

Атрибуты. Вкладка «Атрибуты» позволяет выбрать лучшие атрибуты для прогнозирования.

Визуализация. На вкладке Визуализация представлена ​​визуализация набора данных. Матрица визуализаций в виде 2D-графиков представляет каждую пару атрибутов.

Фильтры Weka

В Weka есть дополнительный набор внутренних фильтров, которые можно использовать для подготовки данных к построению модели. Weka, как и все хорошие среды машинного обучения, содержит множество классов Java для предварительной обработки данных. Если вы не найдете нужный фильтр, вы можете изменить существующий Java-код фильтра Weka, чтобы создать свой собственный фильтр.

Параметры ключа Weka Explorer

Explorer — это место, где происходит волшебство. Вы используете Explorer для классификации или кластеризации. Обратите внимание, что вкладки Классификация и Кластер отключены в Weka Explorer до тех пор, пока вы не откроете набор данных с помощью кнопки Предварительная обработкавкладка. На вкладках Классификация и Кластер в верхней части Weka Explorer есть три важных раздела конфигурации, которые вы будете часто использовать. в Веке:

  • Опции алгоритма
  • Варианты тестирования
  • Выбор предиктора атрибута (метка) для классификации

О модуле Explorer можно узнать намного больше, чем то, что я описал в этой статье. Но вы уже знаете достаточно, чтобы иметь возможность анализировать свои данные с помощью предварительной обработки, классификации, кластеризации и ассоциации с модулем WEKA-EXPLORER.

Если вы планируете выполнять какой-либо сложный анализ данных, требующий гибкости программного обеспечения, я рекомендую вам использовать интерфейс WEKA Simple CLI. У вас мало новых инструментов, но практика делает их совершенными.

Удачи в анализе данных :-)

Источник: blog.selcote.com