
上次我们完成一个关于json数据的实战,这次我们来研究一下headers。
我们传入中的headers都是以字典的形式传入的,里面包含一个参数:User-Agent,他说明了发出请求的软件,但是在headers里面还有更多的参数,这些只是我们今天要研究的东西。
一、 Cookie
你也许会在开发者选项中看到cookie,它其实可以根据内容让服务器返回给你。比如去爬取人人网,如果没有它,你就会拿到登录前的页面,而如果是你复制了里面的内容并发送请求,得到的就是登录后的页面,这就是cookie的作用。
二、Referer
referer出现在开发者选项中,值一般都是一个URL,那这个URL又是什么呢?
你仔细观察会发现,这URL就是跳转过来的页面,原来服务器为了反爬(防止被爬虫程序爬取,作的一些措施,以后我的会讲到的),会注意referer,比如请求百度网,你却说是从Python官网跳转的,它就不会给你数据了。
这些东西以后我们会慢慢讲解和使用,现在只需了解一下即可。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)