共计 434 个字符,预计需要花费 2 分钟才能阅读完成。
通用字符集 (Universal Character Set, UCS) 和 Unicode 能够了解就是两个组织干的雷同的事件,他们都想给世界上的所有字符对立编码。当初他们也都互相兼容,就是说对于同一个字符,UCS 和 Unicode 都会把他们映射成同一个 Code Point,反过来也一样。所以能够把他们当成是一回事。
有一些不同的中央,UCS 的编码空间原本是 0
到 0x7F FF FF FF
(32 位,第一位固定为 0)。但因为 UTF-16 代理对的实现形式,只能编码到 0x10 FF FF
范畴。所以 UCS 规范也规定了只应用 0x10 FF FF
范畴内的编码。
UCS-4 与 UCS,相似于 UTF-32 与 Unicode 的关系。因为 UCS 也规定了只应用 0x10 FF FF
范畴内的编码,所以它两理论就是一回事。
UCS-2 与 UCS,相似于 UTF-16 与 Unicode 的关系。但不同的是,UCS-2 是固定两字节的,没有思考辅助立体。能够把 UCS-2 当做是不反对辅助立体的 UTF-16。
相干文章:
- 详解字符编码与 Unicode
正文完