使用scrapy做爬虫,xpath选择器为什么无法定位到网页的某些节点

使用scrapy做爬虫,xpath选择器为什么无法定位到网页的某些节点,第1张

如果你是在浏览器 开发工具 提取的xpath,很多情况下是不能用到scrapy中的,

因为浏览器看到的dom树可能是js脚本动态修改过的(这种情况非常常见),你需要直接查看html源码,分析。

我认为是xpath默认提取xpath第一个tr属性了,xpath 表达式改成'//div[@class="row"]//table//tr[@height="38px" or @height=""]'

1、正则提取器          适用于所有返回的格式

2、json提取器            只 适用于返回的是json格式的数据

3、边界值提取器        适用于所有返回的格式

4、xpath提取器            只 适用于返回的是html或者xml格式的数据

首先要搞清楚要提取的内容在哪里?响应头,响应body提取数据

如果是从响应body中提取数据,那么要搞清楚返回的是什么格式的数据,对于不同的格式返回数据,采用不同的提取器来实现数据的提取

定义说明:引用名称: info_status表示变量名,不用多说

正则表达式:这里的一对括号就是一个模板,两对括号就是两个模板

模板:这里Jmeter你要匹配哪个或哪些模板,$1$表示匹配第一个模板(就是正则表达式里的第一对括号)

匹配数字:告诉 JMeter如果匹配到了多个符合要求的,你要哪一个这里我填写0,0表示随机,-1表示全部,1表示第一个,2表示第二个

缺省值:没有匹配到数据时的默认值,不用多说

1 爬取网站 笔趣阁小说

2 网站地址 >

以上就是关于使用scrapy做爬虫,xpath选择器为什么无法定位到网页的某些节点全部的内容,包括:使用scrapy做爬虫,xpath选择器为什么无法定位到网页的某些节点、python3.7爬虫使用xpath解析,获取的表格数据为什么不全面、Jmeter提取器-正则,json,xpath,边界值提取器等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/9481881.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-28
下一篇2023-04-28

发表评论

登录后才能评论

评论列表(0条)

    保存