Я использую источник структурированной потоковой передачи для Kafka (руководство по интеграции ), который, как указано, не фиксирует никакого смещения.
Одна из моих целей - следить за ним (проверить, не отстает ли он и т. д.). Несмотря на то, что он не фиксирует смещения, он обрабатывает их, время от времени запрашивая kafka и проверяя, какое из них будет обрабатываться следующим. Согласно документации смещения записываются в HDFS, поэтому в случае сбоя его можно восстановить, но вопрос:
Где они хранятся? Есть ли способ отслеживать потребление kafka (извне программы, поэтому kafka cli или аналогичный, смещение, приходящее с каждой записью, не подходит для варианта использования) искрового потока (структурированного), если он не фиксирует смещения ?
Ваше здоровье