编码的重要作用
计算机只能解决数字,如果想让计算机解决人类语言,则须要将字符转换为数字,而计算机编码就是将字符转换为数字的过程。
编码还能够用于压缩数据,以便更无效地存储和传输数据。
常见的编码方式
ASCII 码
ASCII 码,能够示意 128 个字符,用一个字节的低 7 位示意,0 ~ 31
是控制字符,比方 换行、回车、删除
等;32~126 是打印字符,能够通过键盘输入并且可能显示进去。
ISO-8859-1
128 个字符显然是不够用的,于是 ISO 组织在 ASCII 码根底上又制订了一些列规范用来扩大 ASCII 编码,它们是 ISO-8859-1 ~ ISO-8859-15,其中 ISO-8859-1 涵盖了大多数西欧语言字符,所以利用的最宽泛。ISO-8859-1 依然是单字节编码,它总共能示意 256 个字符。
GB2312
全称是《信息替换用汉字编码字符集 根本集》,它是双字节编码,总的编码范畴是 A1-F7,其中从 A1-A9 是符号区,总共蕴含 682 个符号,从 B0-F7 是汉字区,蕴含 6763 个汉字。
GBK
全称是《汉字内码扩大标准》,是国家技术监督局为 windows95 所制订的新的汉字内码标准,它的呈现是为了扩大 GB2312,退出更多的汉字,它的编码范畴是 8140~FEFE(去掉 XX7F)总共有 23940 个码位,它能示意 21003 个汉字。
GBK 兼容 GB2312,也就是说用 GB2312 编码的汉字能够用 GBK 来解码,并且不会有乱码。
GB18030
全称是《信息替换用汉字编码字符集》,是我国的强制规范,它可能是单字节、双字节或者四字节编码。
尽管是国家标准,然而理论利用零碎中应用的并不宽泛。
GB18030 兼容 GB2312。
UTF-16
说到 UTF 必须要提到 Unicode(Universal Code 对立码),ISO 试图想创立一个全新的超语言字典,世界上所有的语言都能够通过这本字典来互相翻译。Unicode 能够表白的字符十分多,须要用多个字节来存储。
UTF-16 意味着用两个字节来示意 Unicode 字符,两个字节是 16 个 bit,所以叫 UTF-16。
UTF-8
有很大一部分字符用一个字节就能够示意,UTF-16 对立采纳两个字节示意一个字符,存储空间放大了一倍,造成节约。UTF-8 采纳了一种变长技术,每个编码区域有不同的字码长度,不同类型的字符能够是由 1~6 个字节组成。
交流学习
如果有疑难或想和我交换,欢送扫描下方二维码
更多与编码技术相干的博文:编码与解码 – 侵蚀脚本
转载申明:本文容许转载,原文链接:意识 ASCII 编码 – 侵蚀脚本
参考:
https://www.cnblogs.com/codeXi/p/12243990.html