
文内容取自“廖雪峰官方网站的python教程”
https://www.liaoxuefeng.com/wiki/1016959663602400/1017075323632896
ASCII编码:只有127个字符被编码到计算机,英文字母大小写、数字、一些符号;
Unicode编码:把所有语言都统一到一套编码中;
ASCII编码是1个字节,Unicode编码是2个字节
问题:文本全部英文,Unicode编码比ASCII编码多一倍空间,在存储上不划算。
解决:出现UTF-8编码
在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输时,转为UTF-8编码。
用记事本编辑时,从文件读取的UTF-8字符被转换为Unicode字符存到内存里,编辑完成后,保存时再把Unicode转换为UTF-8保存到文件。
示意图如下:
浏览网页时,服务器会把动态生成的Unicode内容转换成UTF-8再传输到浏览器。
示意图如下:
单个字符编码,使用ord()函数获取字符的整数表示,chr()函数把编码转换为对应字符
>>>ord('A')65>>>chr(66)'B'python对于bytes类型的数据用带b前缀的单引号或双引号表示
x = b'ABC'注意ABC和b'ABC' 前者是str,后者虽然内容显示和前者一致,但bytes的每个字符只占用一个字节。
已Unicode表示的str通过encode()方法可以编码为指定的bytes
>>>'ABC'.encode('ascii')b 总结 以上是内存溢出为你收集整理的python字符串和编码全部内容,希望文章能够帮你解决python字符串和编码所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)