python使用xpath（超详细）_框架

使用时先安装 lxml 包

开始使用 #

和beautifulsoup类似，首先我们需要得到一个文档树

把文本转换成一个文档树对象

from lxml import etreeif __name__ == '__main__':doc='''

把文件转换成一个文档树对象

fromlxmlimportetree# 读取外部文件 indexhtmlhtml = etreeparse('/indexhtml')result = etreetostring(html, pretty_print=True)#pretty_print=True 会格式化输出print(result)

均会打印出文档内容

节点、元素、属性、内容 #

xpath 的思想是通过路径表达去寻找节点。节点包括元素，属性，和内容

元素举例

html --->div --->

这里我们可以看到，这里的元素和html中的标签一个意思。单独的元素是无法表达一个路径的，所以单独的元素不能独立使用

路径表达式 #

/ 根节点，节点分隔符，// 任意位置当前节点父级节点@ 属性

通配符 #

任意元素@ 任意属性node() 任意子节点（元素，属性，内容)

谓语 #

使用中括号来限定元素，称为谓语

//a[n] n为大于零的整数，代表子元素排在第n个位置的元素//a[last()] last() 代表子元素排在最后个位置的元素//a[last()-] 和上面同理，代表倒数第二个//a[position()<3] 位置序号小于3，也就是前两个，这里我们可以看出xpath中的序列是从1开始//a[@href] 拥有href的元素//a[@href='内置很多函数。更多函数查看 >

之前写过相对父元素及下一个兄弟元素的方法。

这次补充一下xpath相对节点位置查找元素的所有方法。例子就不举了，自己可以去练练。

xpath相对节点查找方法：

1、xpath('/ancestor::')

查找当前节点的所有先辈节点，即父节点或祖父节点

2、xpath('/ancestor-or-self::')

查找当前节点的所有先辈节点以及本身

3、xpath('/attribute::')

获取当前节点的所有属性

4、xpath('/child::')

查找当前节点的所有子节点

5、xpath('/descendant::')

获取当前节点的所有后代节点，即子节点、孙节点

6、xpath('/following::')

获取当前节点结束标签后的所有节点

7、xpath('/following-sibing::')

获取当前节点的下一个兄弟节点

8、xpath('/parent::')

获取当前节点的父节点

9、xpath('/preceding::')

获取当前节点开始标签前的所有节点

10、xpath('/preceding-sibing::')

获取当前节点的上一个兄弟节点

11、xpath('/self::')

选取当前节点

大概也就这么多，这些方法非常实用，特别是有些元素通过自己的属性无法查找到的时候就需要通过相对节点的位置来查找。

XPath的语法我们在前面已经提到过 XPath是用来帮助XSLT在XML源文档中查找定位信息的语言在实际使用过程中 XPath和XSLT总是混在一起使用在上面一章的语法例子中我们已经有使用到XPath的语法只是没有明确点出但W C将它们分成两个标准所以我们也将它们拆成两章来讲解

XPath的语法

当前位置寻址 *** 作运算符功能函数

当前位置

当我们使用XSLT处理XML源文档是我们用Context来表示当前正在被模板处理的节点位置比如xsl:template match= / 语句中表示Context在文档的根(root)节点我不知道如何准确的翻译Context这个词它类似于C语言里的指针表示程序当前运行的位置理解Context对于正确处理XSL模板非常重要当您的XSL模板输出的文档和您想要的不一样最先应该分析的就是Context在哪里 Location Paths是用于设定你想要寻找的Context节点位置就类似DOS的目录命令我们看个例子

<xsl:for each select= child::PEOPLE/descendant::PERSON >

其中child::PEOPLE/descendant::PERSON就是XPath语法这个表达式就是一个Location Paths 代码说明要显示所有PEOPLE元素的子元素和所有PERSON元素的子元素通常我们会采用更简单的写法

<xsl:for each select= PEOPLE//PERSON >

我们来解释path的两种表示方法 / 和 // / 是表示当前文档的节点类似DOS目录分割符例如 /PEOPLE表示选择根节点下的PEOPLE元素 PEOPLE/PERSON表示选择PEOPLE元素下所有的PESON子元素 // 则表示当前文档所有的节点类似查看整个目录例如 //PEOPLE表示选择文档中所有的PEOPLE元素无论它在什么层次 PEOPLE//PERSON表示在PEOPLE元素下所有的PERSON元素无论它的层次多深

寻址 *** 作

Axis和Predicate是XPath语法中对Location Paths进行定位 *** 作的语法具体的用法列表如下

Axis语法表表达式简写说明 self 选择当前的节点例子 : <TD><xsl:value of select= /></TD> 代码表示在当前位置插入当前的节点包含的文本(text)值 parent 选择当前节点的父节点 attribute @ 选择一个元素的所有属性例子: <TD><xsl:value of select= @PERSONID /></TD> 选择PERSON元素的所有属性 child 选择当前节点的所有子元素 ancestor 选择当前节点的所有父元素(包括父元素的父元素类推)

Axis帮助我们选择当前节点周围所有的节点而Predicate则用来定位当前节点内部的元素表示方法为方括号[]中加表达式 [ Expression ] 具体举例如下:

PERSON[position()= ] 这句代码表示寻找第二个 PERSON 元素

PERSON[starts with(name B )] 这句代码表示寻找所有名称以 B 开头的PERSON元素

运算符

这一节介绍XPath的运算符(Expressions) 列表如下运算符说明 and or 就是普通意义的and or = 等于 != 不等于 > >= 大于大于等于 < <= 小于小于等于注意在XSL文件中 <符号要用< 表示 div 加减乘除 mod 取模 | 两个节点一起计算

功能函数(Functions)

在XPath里有很多功能函数可以帮助我们精确寻找需要的节点

count()功能作用统计计数返回符合条件的节点的个数举例 <xsl:value of select= count(PERSON[name=tom]) /> 说明代码的用途是显示PERSON元素中姓名属性值为tom有几个

number()功能作用将属性的值中的文本转换为数值举例 The number is: <xsl:value of select= number(book/price) /> 说明代码的用途是显示书的价格

substring() 功能语法 substring(value start length) 作用截取字符串举例 <xsl:value of select= substring(name ) /> 说明代码的用途是截取name元素的值从第一个字母开始显示到第三个

sum()功能作用求和举例 Total Price = <xsl:value of select= sum(//price) /> 说明代码的用途是计算所有价格的和

上面这些功能只是XPath语法中的一部分还有大量的功能函数没有介绍而且目前XPath的语法仍然在不断发展中通过这些函数我们可以实现更加复杂的查询和 *** 作

lishixinzhi/Article/program/ASP/201311/21862

当页面存在两个文件夹，结构相同，只有文件夹名称不同时，想要点击某一个文件夹上的某个控件。这个时候需要使用xpath定位。

1由父节点定位子节点 driverfindElementByXPath(//XCUIElementTypeCell/XCUIElementTypeStaticText[@name="标签"])

xpath_input_exp_mark = '//label[contains(text(), "文本内容")]//following-sibling::div[1]//input'

browserfind_element_by_xpath(xpath_input_exp_mark)

表示当前节点的父节点

following-sibling::div[1] 表示当前节点的兄弟节点中的第 1 个 div 标签

以上就是关于python使用xpath（超详细）全部的内容，包括:python使用xpath（超详细）、XPATH怎么获取特定文字后面的文本、通过xpath相对节点位置查找元素等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/web/9699307.html

python使用xpath（超详细）

发表评论

评论列表（0条）