Python lxml XPath问题

Python lxml XPath问题,第1张

Python lxml XPath问题

您的XPath显然太长了,为什么不试试较短的XPath看看它们是否匹配。一个问题可能是“ tbody”,浏览器会在DOM中自动创建“
tbody”,但HTML标记通常不包含它。

这是有关如何使用XPath结果的示例

>>> from lxml import etree>>> from StringIO import StringIO>>> doc = etree.parse(StringIO("<html><body>a<something/>b</body></root>"), etree.HTMLParser())>>> doc.xpath("/html/body/text()")['a', 'b']

因此

"".join(...)
,如果需要,您可以将所有文本部分放在一起。



欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zaji/5508479.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-12-13
下一篇2022-12-13

发表评论

登录后才能评论

评论列表(0条)

    保存