Я пытаюсь распечатать/сохранить HTML-код определенного элемента с веб-страницы.
Я получил XPath запрошенного элемента из firebug.
Все, что я хочу, это сохранить этот элемент в файл. Кажется, мне это не удалось.
(пробовал XPath с /text()
в конце и без него)
Буду признателен за любую помощь или прошлый опыт.
10x, Дэвид
import urllib2,StringIO
from lxml import etree
url='http://www.tutiempo.net/en/Climate/Londres_Heathrow_Airport/12-2009/37720.htm'
seite = urllib2.urlopen(url)
html = seite.read()
seite.close()
parser = etree.HTMLParser()
tree = etree.parse(StringIO.StringIO(html), parser)
xpath = "/html/body/table/tbody/tr/td[2]/div/table/tbody/tr[6]/td/table/tbody/tr/td[3]/table/tbody/tr[3]/td/table/tbody/tr/td/table/tbody/tr/td/table/tbody/text()"
elem = tree.xpath(xpath)
print elem[0].strip().encode("utf-8")
head
иtbody
). Не доверяйте Firebug. Загляните в исходный документ. - person   schedule 17.03.2011