
很多网站是用js或Jquery 生成数据的,到后台获取到数据以后,用 documentwrite()或者("#id")html="" 的方式 写到页面中,这个时候用浏览器查看源码是看不到数据的。
>
保存登陆后的cookie
以后每次抓取页面把cookie在头部信息里面发送过去。
系统是根据cookie来判断用户的。
有了cookie就有了登录状态,以后的访问都是基于这个cookie对应的用户的。
补充:Java是一种可以撰写跨平台应用软件的面向对象的程序设计语言。Java 技术具有卓越的通用性、高效性、平台移植性和安全性,广泛应用于PC、数据中心、游戏控制台、科学超级计算机、移动电话和互联网,同时拥有全球最大的开发者专业社群。
以上就是关于java爬虫 怎么动态的获取html全部的内容,包括:java爬虫 怎么动态的获取html、java网络爬虫怎么实现抓取登录后的页面、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)