
在Windows系统和Linux系统下的文本格式中,有一个很大的区别就是换行符,我们使用IDEA开发shell脚本时,就会遇到这个问题,一旦将文档格式保存为CRLF时,复制到Linux系统中进行脚本运行时,就会报错。这时就需要一些工具进行文件格式的转换。
1)LF(Line Feed),表示为换行。
2)该格式为Linux或者Unix系统环境下的换行方式,即为 \n
1)CRLF,全称为Carriage Return Line Feed,表示为回车换行。
2)该格式为Windows系统环境下的换行方式,即为 \r\n
使用 doc2unix 可以将Windows文本转化为Linux或Unix文本,即将 CRLF 格式换为 LF 格式,也就是将换行符 \r\n 换为 \n 。
dos2unix [options] [-c convmode] [-o file ...] [-n infile outfile ...]
处于linux命令,想在linux系统中处理一些表格信息,但是在linux输入cat solr |head -2中文字符出现乱码,百度之后才知道linux下文件编码必须是utf-8中文字符才不会出现乱码。经过多方求助,才得知解决方法。
linux环境如何查看文件编码:
file filename
file是命令,filename是文件名
可以从上图看出solr.txt的编码是utf-16,所以要转换成utf-8。
linux环境如何实现编码转换:
iconv -f utf-8 -t utf-16 keyword -o keyword1
iconv -f 源文件格式 -t 想要转成的格式 文件名 -o 输出文件名
上图所示,中文字符乱码经过转换之后可以输出正常的中文字符。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)