注意:下面这两段是代理区。即第1——16平面的间接表示,四个字节的汉字就在这里表示D800-DBFF:High-half zone of UTF-16 DC00-DFFF:Low-half zone of UTF-16 本篇中包含了所有常用汉字27973个,剩余汉字使用代理区标识欢迎查看字符编码相关博客专栏比如:由iPhone emoji问题牵出的UTF-16编码,UTF-8编码探究从以上链接中查询到汉字 “眀”的码值为 7700
汉字“明” 的7700 的二进制为
0111 0111 0000 0000
转换为十进制是 30464
所以码值范围在第三行。
填充值如下:
1110 0111 1001 1100 1000 0000
填充后对应的十六进制为:
E79C80
接下来我们把这个字符在16进制编辑器中保存在Txt文件中
保存完Txt 文件,再打开
以上就是Unicode 与 UTF-8 转换的方式。