событие завершения сканирования всех дополнительных URL для определенного базового URL в Storm Crawler

В настоящее время я работаю над проектом на основе Storm Crawler. Мне нужно выполнить некоторую обработку после события завершения сканирования всех дополнительных URL-адресов для этого базового URL. Например, я хочу изменить статус, когда все обнаруженные URL-адреса для этого домена просканированы успешно или с ошибкой. Как я могу найти финальное событие для каждого базового URL?


person aeranginkaman    schedule 31.10.2020    source источник


Ответы (1)


Не из коробки, нет. вам придется реализовать механизм, чтобы проверить, остались ли невыгруженные URL-адреса для данного ключа.

person Julien Nioche    schedule 31.10.2020
comment
Я реализовал задание планировщика в java для подсчета количества обнаруженных URL-адресов для каждого базового URL-адреса. если счетчик равен нулю, я провожу завершающее мероприятие для этого базового URL. Это правильный подход? - person aeranginkaman; 31.10.2020