Как я могу использовать этот набор данных с алгоритмом Weka для априори?
'A, C, D',
'B, C, E',
'A, B, C, E',
'B, E'
Как я могу использовать этот набор данных с алгоритмом Weka для априори?
'A, C, D',
'B, C, E',
'A, B, C, E',
'B, E'
Вам нужно преобразовать его в формат .arff
.
Формат файла .arff
прост, состоит из трех полей:
@relation
@attribute
@data
В таком случае, когда у вас есть только одно поле (буквы в вашем случае), вы должны перечислить все возможные атрибуты (A, B, C,..) в поле атрибута, а затем отформатировать его (в поле данных ) с использованием логических значений, описывающих наличие/отсутствие определенного атрибута в каждой строке.
Пример:
@relation <file_name>
@attribute 'A' { t}
@attribute 'B' { t}
@attribute 'C' { t}
@attribute 'D' { t}
@attribute 'E' { t}
@data
t, ?, t, t, ?
?, t, t, ?, t
t, t, t, ?, t
?, t, ?, ?, t
В качестве другого примера посмотрите на пример «supermarket.arff» в папке данных Weka.