PYTHON，SELENIUM如何获取HTML内元素，_框架

有两个问题：

1 frame标签后面加冒号是标准的frame写法吗？不会是自定义的标签吧

<frame:groupmenu >

</frame>

2 我用的switch_to_frame(frameName) 没有问题

print '-------------------------switch to top frame'

driverswitch_to_default_content()

driverswitch_to_frame('top')

print driverfind_element_by_id('top-btn')text

print 'switch_to_frame done'

print '-------------------------switch to left frame'

driverswitch_to_default_content()

driverswitch_to_frame('left')

print driverfind_element_by_id('left-btn')text

print 'switch_to_frame done'

print '-------------------------switch to main frame'

driverswitch_to_default_content()

driverswitch_to_frame('main')

无法打印出元素的值（用户名密码错误）

原因是：style="display: none;" 元素不展示

修改 style的值

修改后：style=display: block;

然后就可以打印出值（用户名或密码错误）

总结：

爬虫当中的cookie的作用

1 模拟登录 (有的网站你加上cookie也登录不了)

2 反反爬(检查cookie)，可以定期自动更新cookies,躲避反爬机制

先登陆qzoneqqcom, 然后右键检查，找到登陆面板 iframe 并且获取 src属性内的 URL

爬取时间：2021/01/27

系统环境：Windows 10

所用工具：Jupyter Notebook\Python 30

涉及的库：selenium\time\pandas\matplotlib\jieba\stylecloud

蛋肥想法： 借助selenium，实现对“查看更多”的自动点击，目标是获取2020年的文章相关数据。

蛋肥想法： 36氪的数据很满足强迫症，没有空格换行，只需筛选出2020年的数据保存。

蛋肥想法： 此次重点是学习selenium，所以只简单做一下数据可视化。

以上就是关于PYTHON，SELENIUM如何获取HTML内元素，全部的内容，包括:PYTHON，SELENIUM如何获取HTML内元素，、python selenium 无法获取元素的值、爬虫思路——Selenium获取Cookies等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/web/9296205.html

PYTHON，SELENIUM如何获取HTML内元素，

发表评论

评论列表（0条）