Обнаружение новых записей RSS-канала

Я использую feedparser для работы с RSS. Я регулярно (например, каждые 15 минут) получаю RSS-канал с элементами и сохраняю его. В каналах не часто появляются новинки. Таким образом, это неэффективно.
Есть ли способ быстро определить, есть ли какие-то новые элементы в канале, и если нет, ничего не делать с этим каналом?

Спасибо


person xralf    schedule 05.06.2011    source источник


Ответы (1)


Для RSS 2.0 элемент канала имеет необязательный элемент lastBuildDate. Для атома есть аналогичный элемент «atom:updated», но в стандарте указано, что это происходит, когда «запись или фид были изменены способом, который издатель считает значительным. Следовательно, не все модификации обязательно приводят к изменению atom:updated». ценность".

В RSS 2.0 также есть элемент PubDate, тоже необязательный, но следует использовать lastBuildDate, при условии, что он есть и издатель использует его правильно.

Вы можете сохранить предыдущее и сравнить вновь полученное значение со старым.

Добавлен материал по парсеру фидов: для парсера фидов см. разделы feed-updated_parsed и feed-updated.

person ViennaMike    schedule 06.06.2011
comment
Спасибо за информацию, но я не могу найти поддержку lastBuildDate в feedparser. Есть ли альтернативное обнаружение? - person xralf; 06.06.2011