Частота дискретизации Apache Flume

Можно ли указать частоту дискретизации для Flume до того, как записи будут записаны в HDFS? Есть ли какая-то конфигурация приемника Flume для этого или нам нужно написать собственный перехватчик Flume для выборки? Я не смог найти никакой документации на странице руководства пользователя Apache Flume.


person anonymous123    schedule 12.01.2015    source источник


Ответы (1)


Да, вы можете добиться этого, указав размеры пакетов в приемнике hdfs:

hdfs.batchSize = 100 // 100 is the default.

Вы также должны убедиться, что вы указали достаточно большую пропускную способность канала.

person Erik Schmiegelow    schedule 13.01.2015
comment
Спасибо за это, но предположим, что я хочу случайным образом выбирать данные, batchSize не будет делать это правильно? - person anonymous123; 15.01.2015
comment
Этого можно добиться с помощью перехватчика — например, RgexInterceptor фильтрует события, но подойдет и любая другая реализация. - person Erik Schmiegelow; 15.01.2015