webSocket 二进制传输基础准备-Unicode转UTF16

前言

1.websocket 二进制数据传输基础准备工作
2.webSocket 二进制传输基础准备-Unicode转UTF8
3.webSocket 二进制传输基础准备-Unicode转UTF16

昨天我们学习了Unicode转UTF8
js中所有的string类型都是使用的UTF-16编码
下面就直接开始吧

完整的 Unicode 字符集

UTF-16编码方式

webSocket 二进制传输基础准备-Unicode转UTF16

Unicode转UTF-16

今天使用 U+22222(大于U+10000) 进行转码UTF16

先进行减去0x10000
0x22222 - 0x10000 = 0x12222 =  1 0010 0010 0010 0010
转换二进制并且分割位高低10位
二进制1111111111 =  1023十进制
利用按位与的特性获取低10位
二进制1111111111  &  1 00100010 00100010 = 10 0010 0010
十进制1023 & 0x12222 =  546
低10位加0xDC00
546 + 0xDC00 =  56866 = 0xde22

利用带符号右移运算符以及按位与获取高10位

0x12222 << 10 = 72 = 1001000
1001000 & 1111111111 = 1001000
72 & 1023  = 72
高10位加0xD800
72 + 0xD800 = 55368 = 0xd848

U+22222编码转UTF-16 = [0xd848,0xde22]
var  str = "";
[0xd848,0xde22].forEach(item => {
    str +=String.fromCharCode(item)
})
console.log(str);

明天就是假期了,尽可能的做出UTF-16与UTF-8 的互转。
大概原理就是先将 字符 逆推转Unicode编码 然后再转你想要的编码格式

相关推荐