
有两个问题:
1 frame标签后面加冒号是标准的frame写法吗?不会是自定义的标签吧
<frame:groupmenu >
</frame>
2 我用的switch_to_frame(frameName) 没有问题
print '-------------------------switch to top frame'driverswitch_to_default_content()
driverswitch_to_frame('top')
print driverfind_element_by_id('top-btn')text
print 'switch_to_frame done'
print '-------------------------switch to left frame'
driverswitch_to_default_content()
driverswitch_to_frame('left')
print driverfind_element_by_id('left-btn')text
print 'switch_to_frame done'
print '-------------------------switch to main frame'
driverswitch_to_default_content()
driverswitch_to_frame('main')
无法打印出元素的值(用户名密码错误)
原因是:style="display: none;" 元素不展示
修改 style的值
修改后:style=display: block;
然后就可以打印出值(用户名或密码错误)
总结:
爬虫当中的cookie的作用
1 模拟登录 (有的网站你加上cookie也登录不了)
2 反反爬(检查cookie),可以定期自动更新cookies,躲避反爬机制
先登陆qzoneqqcom, 然后右键检查,找到登陆面板 iframe 并且获取 src属性内的 URL
爬取时间:2021/01/27
系统环境:Windows 10
所用工具:Jupyter Notebook\Python 30
涉及的库:selenium\time\pandas\matplotlib\jieba\stylecloud
蛋肥想法: 借助selenium,实现对“查看更多”的自动点击,目标是获取2020年的文章相关数据。
蛋肥想法: 36氪的数据很满足强迫症,没有空格换行,只需筛选出2020年的数据保存。
蛋肥想法: 此次重点是学习selenium,所以只简单做一下数据可视化。
以上就是关于PYTHON,SELENIUM如何获取HTML内元素,全部的内容,包括:PYTHON,SELENIUM如何获取HTML内元素,、python selenium 无法获取元素的值、爬虫思路——Selenium获取Cookies等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)