
我做过爬虫,对这个比较了解,如果网页源码中有些内容是js渲染过来的,那你通过>
function html2Escape(sHtml) {
return sHtmlreplace(/[<>&"']/g, function(c){
return {'<':'<','>':'>','&':'&','"':'"',"'":'''}[c];
});
}
// 其中{}是键值对的对象,c是属性,就是<>&"'这些,根据其中某个找到对应的html的字符
// html字符转义
以上就是关于httpClient怎么获取网页中js执行完后的网页源码全部的内容,包括:httpClient怎么获取网页中js执行完后的网页源码、python怎么抓取渲染后的页面、js 如何渲染从数据库中取到的文本,文本带有html标签,如果直接取到页面的话,标签都会显示等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)