Алгоритм Weka Apriori конвертирует набор данных

Как я могу использовать этот набор данных с алгоритмом Weka для априори?

'A, C, D',
'B, C, E',
'A, B, C, E',
'B, E'

person Aymn Alaney    schedule 29.05.2015    source источник
comment
Если вы удалите запятую и кавычки, вы можете использовать его с ELKI Apriori IIRC.   -  person Has QUIT--Anony-Mousse    schedule 29.05.2015


Ответы (1)


Вам нужно преобразовать его в формат .arff.

Формат файла .arff прост, состоит из трех полей:

@relation

@attribute

@data

В таком случае, когда у вас есть только одно поле (буквы в вашем случае), вы должны перечислить все возможные атрибуты (A, B, C,..) в поле атрибута, а затем отформатировать его (в поле данных ) с использованием логических значений, описывающих наличие/отсутствие определенного атрибута в каждой строке.

Пример:

@relation <file_name>

@attribute 'A' { t}
@attribute 'B' { t}
@attribute 'C' { t}
@attribute 'D' { t}
@attribute 'E' { t}

@data
t, ?, t, t, ?
?, t, t, ?, t
t, t, t, ?, t
?, t, ?, ?, t

В качестве другого примера посмотрите на пример «supermarket.arff» в папке данных Weka.

person miccia4    schedule 30.11.2015