java ascii码转Hex java ascii码转unicode

关注技术极客侠

java ascii码转Hex java ascii码转unicode

转载

技术极客侠 2023-10-18 20:17:50

文章标签 java ascii码转Hex java 二进制转ascii码 ico System 字符串 文章分类 Java 后端开发

内容为个人学习心得，不能对准确性做过多保证，错误之处还望指点。

有时候我们会遇到一些\u开头的字符串，例如\u4f60\u597d，我们知道这些是Unicode码，一段\uxxxx字符串对应了一个Unicode字符。那这些编码字符的实际二进制存储格式是怎样呢？

我们知道Unicode编码可以呈现世界上大部分的文字内容，而在其最通用的一种编码方式UTF-8

)下,单字符的存储长度为1-4字节(可变)，这种设计的由来和优点就不多讲了，这里主要说说看到的u编码串和二进制的换算方式。

在UTF-8编码格式的java代码下，对“测试”两个字打印其字节和字符结果如下：

System.out.println(Charset.defaultCharset());

String s = "测试";

System.out.println(s.chars().mapToObj(Integer::toHexString).collect(Collectors.joining("\t")));

byte[] bs = s.getBytes();

System.out.println(Arrays.toString(bs));

/*Result:

UTF-8

6d4b 8bd5

[-26, -75, -117, -24, -81, -107] */

观察结果可知，“测试”两个字在UTF-8编码下占六个字节，将【-26, -75, -117, -24, -81, -107】 6个数字转为二进制补码格式，即得到“测试”两字的二进制存储内容，为：

11100110 10110101 10001011 11101000 10101111 10010101

而通过char.ToHexString得到的 6d4b 8bd5 是这两个字的Unicode编码

这两者是怎么关联上的呢?

通过UTF-8的百科页面有如下介绍：

UTF-8编码字节含义

对于UTF-8编码中的任意字节B，如果B的第一位为0，则B独立的表示一个字符(ASCII码)；

如果B的第一位为1，第二位为0，则B为一个多字节字符中的一个字节(非ASCII字符)；

如果B的前两位为1，第三位为0，则B为两个字节表示的字符中的第一个字节；

如果B的前三位为1，第四位为0，则B为三个字节表示的字符中的第一个字节；

如果B的前四位为1，第五位为0，则B为四个字节表示的字符中的第一个字节；

因此，对于上面得到的二进制串，每8位中的前面部分都是用来做标记的，1110开头表明需要3个字节来描述当前字符，并且当前字节为3字节中的第一部分，后面的字节使用10开头表明自己是当前字符编码串的后面部分。

把前三字节这些标记为去掉再合并，得到 0110 110101 001011，而“测”字的16进制Unicode编码转为二进制，正是0110 1101 0100 1011。

这样做的优点很明显，扩展方便(看起来能支持到8字节编码呢)，编码结构去掉了二进制的标记位，减小体积更易于数据传输。1字节的UTF-8码还完整兼容了ASCII码，所以UTF-8可以说应该是大部分场景下的最优选择了。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：Python3 版本向下兼容Python2 版本的语法格式 python3.0完全兼容python2.0

下一篇：链表转数组的函数java java 链表数组

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册