
出现乱码的几种原因和解决办法:
一、出现乱码的原因:
1、网站头部设定的编码和网页本身的编码不一致导致的,html网页头部代码:<meta >
所需工具:
Microsoft Office Excel 2007
电脑
1、新建一个新的Excel,打开进入表格,如图所示:
2、然后选择“数据”选项卡,在选择“自网站”,结果如图所示:
3、在出现上图之后,在“地址”输入相应的网络地址,例如输入的地址如图所示:
4、把地址一栏复制进去“新建web查询”,然后选择“转到”如图所示:
期间需要等级几秒,“转到”后结果如下图:
5、然后选择“导入”稍等几秒,会出来如图所示:
点击确定即可。结果如图所示:
6、此时就把当前地址的页面已经采集过来了,完成。
楼上很多人已经给出解决办法了。其实都很好的。当然,如果你的数据十分规范,可能公式更简单。例如除了数字部分,其他部分都是完全一样的, 而且长度一致,就完全可以用mid函数来解决问题:
=mid(网址位置,数字前的字符数,要提取的数字长度)
如果提取的数字长度不同,但是除了数字之外的部分全部相同,那么可以用substitute函数嵌套;
=substitute(substitute(网址位置,要提取的数字之前的字符串,""),要提取的数字之后的字符串,"")
如果数字之前的/前边都有item这个字符,也可以用mid函数
=substitute(mid(网址位置,find("item/",网址位置)+5,999),"html","")
总之,有非常多的方法来解决这个问题。
powerquery可以,我看到有人用vba也实现了。
就我自己使用powerquery爬网站内容体验而言,数据很少,没啥反爬措施的,可以用用;如果要爬取的数据很多,有反爬措施,那么用powerquery就有点坑爹。
股票网站应该都有提供api?用powerquery调用api应该很好获取数据。
至于您说的选取股票名称,这些用powerquery倒是很好办。
以上就是关于Excel中获取网页数据时,文字出现乱码怎么解决全部的内容,包括:Excel中获取网页数据时,文字出现乱码怎么解决、excel怎么采集网页数据、excel如何提取网址的某一段等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)