Фликнуть CEP с файлами и без потоков?

Я пытаюсь использовать CEP Flink для файлов журнала (как пакетное задание), но не для потоков (как в реальном времени). Это возможно ? Если да, знаете ли вы примеры кода Scala по этому поводу?


person Eras Rasmuson    schedule 07.02.2018    source источник


Ответы (1)


Flink DataStream API и связанные библиотеки, включая библиотеку CEP, могут использоваться с ограниченными, историческими (пакетными) наборами данных или с неограниченными, живыми потоками - это не имеет значения. Просто настройте файл (или каталог) в качестве источника данных и обычно используйте CEP. Для получения правильных воспроизводимых результатов вы должны работать в время события (при условии, что время играет роль в вашей обработке). Это важно, потому что CEP хочет отсортировать ваши входные потоки в соответствии со временем события - понятия до и после должны относиться к тому моменту, когда события произошли, а не когда они были обработаны.

Небольшой поиск в Google приведет вас к некоторым примерам CEP. В обучении Flink (github).

person David Anderson    schedule 07.02.2018