
汉字的机内码是计算机系统内部对汉字进行存储、处理、传输统一使用的代码,又称为汉字内码。
1、内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。比如MS Word中所存储和调用的就是内码而非图形文字。
2、汉字内码:ANSI码是单一字节(8位二进制数)的编码集,最多只能表示256个字符,不能表示众多的汉字字符,各个国家和地区在ANSI码的基础上又设计了各种不同的汉字编码集,以能够处理大数量的汉字字符。
3、GB码:GB码是1980年国家公布的简体汉字编码方案,在大陆、新加坡得到广泛的使用,也称国标码。国标码对6763个汉字集进行了编码,涵盖了大多数正在使用的汉字。
4、由于历史、地区原因,有时一种文字会出现多种编码方案,特别是汉字。由于不同于系统内码的字符不能在该系统中正常显示,必须要进行字符的内码转换,即将非系统内码的字符转换为系统可以识别的内码字符。
一、内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。
二、外码
外码是相对于内码而言的辞汇。在计算机科学及相关领域中,外码指的是“外在的‘经过学习之后,可直接了解的编码形式(例如:文字或语音符号)
中文输入法对汉字的编码即属外码。常见的中文外码有仓颉码、行列码、大易码、呒虾米码、注音码、拼音码。
扩展资料:
内码的分类
1、字符编码:字符编码就是以二进制的数字来对应字符集的字符,用得最普遍的字符集是ANSI,对应ANSI字符集的二进制编码就称为ANSI码,DOS和Windows系统都使用了ANSI码,但在系统中使用的字符编码要经过二进制转换,称为系统内码。
2、汉字内码:ANSI码是单一字节(8位二进制数)的编码集,最多只能表示256个字符,不能表示众多的汉字字符,各个国家和地区在ANSI码的基础上又设计了各种不同的汉字编码集,以能够处理大数量的汉字字符。
这些编码使用单字节来表示ANSI的英文字符(即兼容ANSI码),使用双字节来表示汉字字符。由于一个系统中只能有一种汉字内码,不能识别其它汉字内码的字符,造成了交流的不便。
3、GB码:GB码是1980年国家公布的简体汉字编码方案,在大陆、新加坡得到广泛的使用,也称国标码。国标码对6763个汉字集进行了编码,涵盖了大多数正在使用的汉字。
4、GBK码:GBK码是GB码的扩展字符编码,对多达2万多的简繁汉字进行了编码,简体版的Win95和Win98都是使用GBK作系统内码。
5、BIG5码:BIG5码是针对繁体汉字的汉字编码,在台湾、香港的电脑系统中得到普遍应用。
6、HZ码:HZ码是在Internet上广泛使用的一种汉字编码。
7、ISO-2022CJK码:ISO-2022是国际标准组织(ISO)为各种语言字符制定的编码标准。采用二个字节编码,其中汉语编码称ISO-2022 CN,日语、韩语的编码分别称JP、KR。一般将三者合称CJK码。CJK码主要在Internet网络中使用。
8、Unicode码:Unicode码也是一种国际标准编码,采用二个字节编码,与ANSI码不兼容。在网络、Windows系统和很多大型软件中得到应用。
参考资料:百度百科_内码
百度百科_外码
我说汉字"内码"与"外码"内码汉字计算机内部存储处理传输用信息编码必须与ASCII码兼容能冲突
所标码两字节高位置'1'区别于西文内码汉字输入码称"外码"输入码即指我输入汉字使用编码见外码数字编码(区位码)拼音编码字形编码(五笔)
再说区位码"啊"区位码1601写16进制0x10,0x01计算机广泛使用ASCII编码冲突兼容00-7f ASCII编码我区位码高、低字节别加A0"啊"编码B0A1我加两A0编码称GB2312编码虽 GB2312原文根本没提点
内码指 *** 作系统内部字符编码早期 *** 作系统内码与语言相关.现Windows内部统使用Unicode用代码页适应各种语言,"内码"概念比较模糊我般缺省代码页指定编码说内码内码词汇并没官定义代码页微软种习惯叫作程序员我要知道东西没必要考证些名词
所谓代码页(code page)针种语言文字字符编码例GBKcode pageCP936BIG5code pageCP950GB2312code pageCP20936
Windows缺省代码页概念即缺省用编码解释字符例Windows记事本打文本文件面内容字节流:BA、BA、 D7、D6Windows应该解释呢按照Unicode编码解释、按照GBK解释、按照BIG5解释按照ISO8859-1 解释按GBK解释"汉字"两字按照其编码解释能找应字符能找错误字符所谓"错误"指与文本作者本意符产乱码
答案Windows按照前缺省代码页解释文本文件字节流缺省代码页通控制面板区域选项设置记事本另存项ANSI其实按照缺省代码页编码保存
Windows内码Unicode技术同支持代码页要文件能说明自使用编码用户安装应代码页Windows能确显示例HTML文件指定charset
HTML文件作者特别英文作者认世界所都使用英文文件指定charset使用0x80-0xff间字符文Windows按照缺省GBK解释现乱码要html文件加指定charset语句例:
<meta http-equiv="Content-Type" content="text/htmlcharset=ISO8859-1">
原作者使用代码页ISO8859-1兼容现乱码
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)