Невероятно простые вопросы lxml: получение HTML/строкового содержимого lxml.etree._Element?

Это настолько простой вопрос, что я не могу найти его в документах :-/

В следующих:

img = house_tree.xpath('//img[@id="mainphoto"]')[0]

Как получить HTML-код тега <img/>?

Я пытался добавить html_content(), но получаю AttributeError: 'lxml.etree._Element' object has no attribute 'html_content'.

Кроме того, это был тег с некоторым содержимым внутри (например, <p>text</p>), как мне получить содержимое (например, text)?

Большое спасибо!


person AP257    schedule 22.03.2011    source источник


Ответы (1)


Я полагаю, это будет так же просто, как:

from lxml.etree import tostring
inner_html = tostring(img)

Что касается получения контента изнутри <p>, скажем, какого-то выбранного элемента el:

content = el.text_content()
person vonPetrushev    schedule 22.03.2011