linux进入字符界面乱码,命令无法识别,求高人指点

linux进入字符界面乱码,命令无法识别,求高人指点,第1张

如果是图形界面下的虚拟终端,设置(根据不同的 shell 修改不同的环境参数配置文件,如 bash 就修改 .bashrc 文件或 .bash_profile 文件)

export LANG=zh_CN.UTF-8

如果是远程登录(比如使用 ssh 登录),则根据你的客户端的环境进行设置,一个可能的方案是:

export LANG=zh_CN.GB18030

locale 看看你的当前是什么语言显示

然后

vi /etc/sysconfig/i18n

一般情况下linux服务器都是配置utf-8,不使用中文的。

互联网上越来越多的网页采用UTF-8编码,UTF-8用1到6个字节编码UNICODE字符,收录了超过10万个字符,BMP部分也有六万多个字符

而在进行编码转换时,我们往往需要转换为GBK编码进行后续处理,很多网页在转换后,会发现出现大量连续的问号:????????

这些恶心的问号是在编码转换阶段引入的,原因是:

GBK字符集只收录了两万多个字符,比UTF-8的字符数量少得多。

转化到GBK编码的时候,就会有编码落到GBK字符集以外,不能转化成GBK编码。这部分字符在转换之后的字符串中都变成了’?’

UTF-8:采用变长字节 (1 ASCII, 2 希腊字母和排版字符, 3 汉字等多字节东亚语言, 4 平面符号和特殊符号等),

其中双字节字符中有一些没有在GBK字符集中,通常来说UTF-8无法识别的字符都是非常生僻的字符,几乎难以遇到,可不用考虑;但有一个字符非常特殊:C2A0

C2A0是UTF8里的排版用空格(区别于ASI =20的空格),这个特殊的字符(unicode序号为0xA0),不在GBK字符集中。却频繁用于xml/html等格式的文件中。大量UTF-编码的网页使用这个字符用作占位的空格。而且不同浏览器对它的处理方式不同:IE浏览器识别出该符号并以空格显示,firefox则替换为xml转义字符   当网页中用C2A0进行文字排版时,我们对网页进行编码转换为GBK时就会出现很多"?"问号

char *bufbuf是指针, 不是一块缓存空间.改为 char buf[100] , buf必须是可写的合法的存储空间. 你的代码里面, #include <unistd.h>你少了那个<unistd.h>头文件, I/O函数需要这个头文件.


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/5913500.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-03-08
下一篇2023-03-08

发表评论

登录后才能评论

评论列表(0条)

    保存