
1 保存cookie到文件中
cookies = selfbrowserget_cookies()
jsonCookies = jsondumps(cookies)
with open('cookiesjson', 'w') as f:
fwrite(jsonCookies)
2从文件中读取cookie
selfbrowserget(selfstart_url)
selfbrowserdelete_all_cookies()
with open('cookiesjson', 'r', encoding='utf-8') as f:
listCookies = jsonloads(fread())
for cookie in listCookies:
selfbrowseradd_cookie({
'domain': cookie['domain'],
'name':cookie['name'],
'value':cookie['value'],
'path':'/',
'expires':None
})
selfbrowserget(selftarget_url)
AJAX(Asynchronouse JavaScript And XML:异步JavaScript和XML)通过在后台与服务器进行少量数据交换,Ajax 可以使网页实现异步更新,这意味着可以在不重新加载整个网页的情况下,对网页的某部分进行局部更新。传统的网页(不使用Ajax)如果需要更新内容,必须重载整个网页页面。
因为传统的网页在传输数据格式方面,使用的是 XML 语法,因此叫做 AJAX ,其实现在数据交互基本上都是使用 JSON 。使用AJAX加载的数据,即使使用了JS将数据渲染到了浏览器中,在 右键->查看网页源代码 还是不能看到通过ajax加载的数据,只能看到使用这个url加载的html代码。
法1:直接分析ajax调用的接口。然后通过代码请求这个接口。
法2:使用Selenium+chromedriver模拟浏览器行为获取数据。
Selenium 相当于是一个机器人。可以模拟人类在浏览器上的一些行为,自动处理浏览器上的一些行为,比如点击,填充数据,删除cookie等。 chromedriver 是一个驱动 Chrome 浏览器的驱动程序,使用他才可以驱动浏览器。当然针对不同的浏览器有不同的driver。以下列出了不同浏览器及其对应的driver:
现在以一个简单的获取百度首页的例子来讲下 Selenium 和 chromedriver 如何快速入门:
参考:Selenium的使用
直接直接分析ajax调用的接口爬取
selenium结合lxml爬取
driverget(url);
Set(Cookie) cookies=drivermanage()getCookies();//获得这个url下的所有cookies
for(Cookie cookie:cookies){
Systemoutprintln(Stringformat("%s->%s->%s->%s->%s"),cookiegetDomain(),cookiegetName,cookiegetValue,cookiegetExpiry(),cookiegetPath());
}
以上就是关于python+seleniu如何记录cookies全部的内容,包括:python+seleniu如何记录cookies、从零开始学Python-使用Selenium抓取动态网页数据、selenium中定位cookie,用什么定位等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)