webSocket 二进制传输基础准备-Unicode转UTF16

6次阅读

共计 877 个字符,预计需要花费 3 分钟才能阅读完成。

前言
1.websocket 二进制数据传输基础准备工作 2.webSocket 二进制传输基础准备 -Unicode 转 UTF83.webSocket 二进制传输基础准备 -Unicode 转 UTF16
昨天我们学习了 Unicode 转 UTF8js 中所有的 string 类型都是使用的 UTF-16 编码下面就直接开始吧
完整的 Unicode 字符集
UTF-16 编码方式

Unicode 码范围
UTF-16 编码方式
字节

U+0000 ~ U+FFFF
等于原值
2

U+10000 ~ U+10FFFF
将 Unicode 值减去 0x10000, 得到 20 位长的值。<br/> 再将其分为高 10 位和低 10 位,分别为 2 个字节。<br/> 高 10 位和低 10 位的范围都在 0 ~ 0x3FF<br/> 高 10 位加 0xD800, 低十位加 0xDC00
4

Unicode 转 UTF-16
今天使用 U+22222(大于 U +10000)进行转码 UTF16

先进行减去 0x10000
0x22222 – 0x10000 = 0x12222 = 1 0010 0010 0010 0010
转换二进制并且分割位高低 10 位
二进制 1111111111 = 1023 十进制
利用按位与的特性获取低 10 位
二进制 1111111111 & 1 00100010 00100010 = 10 0010 0010
十进制 1023 & 0x12222 = 546
低 10 位加 0xDC00
546 + 0xDC00 = 56866 = 0xde22

利用带符号右移运算符以及按位与获取高 10 位

0x12222 << 10 = 72 = 1001000
1001000 & 1111111111 = 1001000
72 & 1023 = 72
高 10 位加 0xD800
72 + 0xD800 = 55368 = 0xd848

U+22222 编码转 UTF-16 = [0xd848,0xde22]
var str = “”;
[0xd848,0xde22].forEach(item => {
str +=String.fromCharCode(item)
})
console.log(str);

明天就是假期了,尽可能的做出 UTF-16 与 UTF-8 的互转。大概原理就是先将 字符 逆推转 Unicode 编码 然后再转你想要的编码格式

正文完
 0