Я использую lxml для анализа html-файлов с заданными URL-адресами.
Например:
link = 'https://abc.com/def'
htmltree = lxml.html.parse(link)
Мой код хорошо работает в большинстве случаев, с http://
. Однако я обнаружил, что для каждого URL-адреса https://
lxml просто получает IOError. Кто-нибудь знает причину? И возможно, как исправить эту проблему?
Кстати, я хочу придерживаться lxml, а не переключаться на BeautifulSoup, учитывая, что у меня уже есть готовая программа.