XPATH文本内容匹配th内容,获取td的值

XPATH文本内容匹配th内容,获取td的值,第1张

用XPath表达式来定位到对应的<td>元素

//th[span[text()="发布时间"]]/following-sibling::td/span

这个XPath表达式首先选择包含文本“发布时间”的<span>元素的<th>元素,然后使用/following-sibling::td选择这个<th>元素的下一个兄弟元素,即包含发布时间的<td>元素。最后,使用/span选择包含发布时间值的<span>元素。

请注意,这个XPath表达式返回的是一个<span>元素,如果您只需要获取该元素的文本值,可以使用text()函数,例如:

//th[span[text()="发布时间"]]/following-sibling::td/span/text()

这将返回包含发布时间的<span>元素的文本值

我认为是xpath默认提取xpath第一个tr属性了,xpath 表达式改成'//div[@class="row"]//table//tr[@height="38px" or @height=""]'

题主你好,

只用xpath我感觉无法达到题主的目的,因为在我的知识体系中, xpath的最小单位是一个结点或叫一个标签,

也就是说要不你提取value标签,其内容如下:

要不你提取span标签,内容如下:

而上面这两种题主肯定都会, 也不是想要的

-----

所以我能想到的方法有两种:

一种是在提取前使用js将span标签给去掉, 然后就能使用提取value标签的相关xpath得到题主想要的了;

另一种是先将含有span标签的value标签内容提取出来, 然后用正则表达式将span标签给去掉;

-----

如果上面两种方法满足题主的需求,请题主追问说明所用的语言和库,我再补充

=====

希望可以帮到题主, 欢迎追问

以上就是关于XPATH文本内容匹配th内容,获取td的值全部的内容,包括:XPATH文本内容匹配th内容,获取td的值、python3.7爬虫使用xpath解析,获取的表格数据为什么不全面、关于python的使用xpath怎样获取如下内容等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/9327743.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-27
下一篇2023-04-27

发表评论

登录后才能评论

评论列表(0条)

    保存