Unicode 与 UTF-8 编码的转换_码表

 

注意:下面这两段是代理区。即第1——16平面的间接表示,四个字节的汉字就在这里表示D800-DBFF:High-half zone of UTF-16 DC00-DFFF:Low-half zone of UTF-16 本篇中包含了所有常用汉字27973个,剩余汉字使用代理区标识欢迎查看字符编码相关博客专栏比如:由iPhone emoji问题牵出的UTF-16编码,UTF-8编码探究从以上链接中查询到汉字 “”的码值为 7700

Unicode 与 UTF-8 编码的转换_码表_02

汉字“明” 的7700 的二进制为

0111 0111 0000 0000

转换为十进制是 30464

Unicode 与 UTF-8 编码的转换_码表_03

所以码值范围在第三行。

填充值如下:

1110 0111 1001 1100 1000 0000

填充后对应的十六进制为:

E79C80

接下来我们把这个字符在16进制编辑器中保存在Txt文件中

Unicode 与 UTF-8 编码的转换_码表_04

 保存完Txt 文件,再打开

Unicode 与 UTF-8 编码的转换_ico_05

 以上就是Unicode 与 UTF-8 转换的方式。