PYTHON,SELENIUM如何获取HTML内元素,

PYTHON,SELENIUM如何获取HTML内元素,,第1张

有两个问题:

1 frame标签后面加冒号是标准的frame写法吗?不会是自定义的标签吧

<frame:groupmenu >

</frame>

2 我用的switch_to_frame(frameName) 没有问题

        print '-------------------------switch to top frame'

        driverswitch_to_default_content()

        driverswitch_to_frame('top')

        print driverfind_element_by_id('top-btn')text

        print 'switch_to_frame done'

        print '-------------------------switch to left frame'

        driverswitch_to_default_content()

        driverswitch_to_frame('left')

        print driverfind_element_by_id('left-btn')text

        print 'switch_to_frame done'

        print '-------------------------switch to main frame'

        driverswitch_to_default_content()

        driverswitch_to_frame('main')

无法打印出元素的值(用户名密码错误)

原因是:style="display: none;" 元素不展示

修改 style的值

修改后:style=display: block;

然后就可以打印出值(用户名或密码错误)

总结:

爬虫当中的cookie的作用

1 模拟登录 (有的网站你加上cookie也登录不了)

2 反反爬(检查cookie),可以定期自动更新cookies,躲避反爬机制

先登陆qzoneqqcom, 然后右键检查,找到登陆面板 iframe 并且获取 src属性内的 URL

爬取时间:2021/01/27

系统环境:Windows 10

所用工具:Jupyter Notebook\Python 30

涉及的库:selenium\time\pandas\matplotlib\jieba\stylecloud

蛋肥想法: 借助selenium,实现对“查看更多”的自动点击,目标是获取2020年的文章相关数据

蛋肥想法: 36氪的数据很满足强迫症,没有空格换行,只需筛选出2020年的数据保存。

蛋肥想法: 此次重点是学习selenium,所以只简单做一下数据可视化。

以上就是关于PYTHON,SELENIUM如何获取HTML内元素,全部的内容,包括:PYTHON,SELENIUM如何获取HTML内元素,、python selenium 无法获取元素的值、爬虫思路——Selenium获取Cookies等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/9296205.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-26
下一篇2023-04-26

发表评论

登录后才能评论

评论列表(0条)

    保存