Feedparser SAXParseException, бозо: 1

Я использую feedparser в сценарии, который обычно работает с URL-адресами RSS, но есть один URL-адрес, который вызывает у меня головную боль: tabbforum .com/feed.atom

Я получаю SAXParseException('not well-formed (invalid token)',).

import feedparser

def read_from_feed(self, rss_url):
    feed = feedparser.parse(rss_url)
    for entry in feed.entries:
        print('do stuff')


>>>>feed
{'feed': {}, 'entries': [], 'bozo': 1, 'encoding': 'utf-8', 'version': '', 'bozo_exception': SAXParseException('not well-formed (invalid token)',), 'namespaces': {}}

Я думаю, что что-то не так с xml (?). Кто-нибудь имел предыдущий опыт и смог найти обходной путь? Или есть идеи в чем проблема?


person malla    schedule 10.05.2017    source источник


Ответы (1)


Была аналогичная проблема. В моем случае я забыл поставить http:// перед URL-адресом, и фидпарсер обрабатывал его не как URL-адрес, а как RSS XML.

person silentser    schedule 14.11.2017
comment
Оно работает! Я был так уверен, что попробовал это, но, видимо, нет. Спасибо! - person malla; 16.11.2017