Weka (среда анализа знаний Waikato), разработанная в Университете Вайкато, Новая Зеландия. Это бесплатное программное обеспечение под лицензией GNU General Public License. Проводник является основным интерфейсом Weka. На рисунке ниже показан Weka Explorer.
В верхней части Проводника вы увидите вкладки для каждого из ключевых шагов, которые необходимо выполнить на этапе создания модели:
Предварительная обработка. Слово «фильтр» используется Weka для обозначения набора процедур предварительной обработки данных. Вы применяете фильтры к своим данным, чтобы подготовить их к классификации или кластеризации.
Классификация. На вкладке "Классификация" можно выбрать алгоритм классификации, настроить параметры и обучить классификатор, который впоследствии можно будет использовать для прогнозов.
Кластер. Вкладка «Кластер» позволяет выбрать алгоритм кластеризации, настроить его параметры и выполнить кластеризацию непомеченного набора данных.
Атрибуты. Вкладка «Атрибуты» позволяет выбрать лучшие атрибуты для прогнозирования.
Визуализация. На вкладке Визуализация представлена визуализация набора данных. Матрица визуализаций в виде 2D-графиков представляет каждую пару атрибутов.
Фильтры Weka
В Weka есть дополнительный набор внутренних фильтров, которые можно использовать для подготовки данных к построению модели. Weka, как и все хорошие среды машинного обучения, содержит множество классов Java для предварительной обработки данных. Если вы не найдете нужный фильтр, вы можете изменить существующий Java-код фильтра Weka, чтобы создать свой собственный фильтр.
Параметры ключа Weka Explorer
Explorer — это место, где происходит волшебство. Вы используете Explorer для классификации или кластеризации. Обратите внимание, что вкладки Классификация и Кластер отключены в Weka Explorer до тех пор, пока вы не откроете набор данных с помощью кнопки Предварительная обработкавкладка. На вкладках Классификация и Кластер в верхней части Weka Explorer есть три важных раздела конфигурации, которые вы будете часто использовать. в Веке:
- Опции алгоритма
- Варианты тестирования
- Выбор предиктора атрибута (метка) для классификации
О модуле Explorer можно узнать намного больше, чем то, что я описал в этой статье. Но вы уже знаете достаточно, чтобы иметь возможность анализировать свои данные с помощью предварительной обработки, классификации, кластеризации и ассоциации с модулем WEKA-EXPLORER.
Если вы планируете выполнять какой-либо сложный анализ данных, требующий гибкости программного обеспечения, я рекомендую вам использовать интерфейс WEKA Simple CLI. У вас мало новых инструментов, но практика делает их совершенными.
Удачи в анализе данных :-)
Источник: blog.selcote.com