
什么是代理:即代理服务器,代理网络用户获取服务器信息。
目的:针对反爬机制封IP。单个IP设置访问次数阈值,超过阈值,禁止该IP访问。
代理的作用:1.突破自身IP访问的限制 2.隐藏自身真实IP
获取代理IP的相关途径:1.可以从以下几个途径得到:从免费的网站上获取,质量很低,能用的IP极少。实用性,稳定性,安全性,来考虑不建议大家使用免费IP 2.+V max395952 可以购买代理IP 优点是有大量可用的IP,具有实用性、稳定性、安全性。
代理IP的类型:http:应用到http协议对应的url中
https:应用到https协议对应的url中
代理IP在爬虫中的使用:在进行请求时,加入参数proxies={"协议http或https": '代理IP'},例如,page_text = requests.get(url=url,headers=headers,proxies={"https": '222.110.147.50:3128'}).text
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)