Python lxml XPath问题

源生法力•2022-12-13•随笔•阅读42

Python lxml XPath问题

您的XPath显然太长了，为什么不试试较短的XPath看看它们是否匹配。一个问题可能是“ tbody”，浏览器会在DOM中自动创建“
tbody”，但HTML标记通常不包含它。

这是有关如何使用XPath结果的示例：

>>> from lxml import etree>>> from StringIO import StringIO>>> doc = etree.parse(StringIO("<html><body>a<something/>b</body></root>"), etree.HTMLParser())>>> doc.xpath("/html/body/text()")['a', 'b']

因此

"".join(...)

，如果需要，您可以将所有文本部分放在一起。

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/zaji/5508479.html

示例匹配标记试试文本

打赏

微信扫一扫

支付宝扫一扫

源生法力一级用户组

0 0

在Python中围绕指定的原点旋转2D图像

上一篇 2022-12-13

如何查找字符串中任何字符集的第一个索引

下一篇2022-12-13

发表评论

登录后才能评论

Python lxml XPath问题

发表评论

评论列表（0条）