在本公众号第一系列图说String时讲到了String里面的value在计算机中都是以byte数组的方式来存储的,但我们再往深处看了,不仅仅是byte,而是各种编码的byte

value的编码


还是用图说String里面的例子:

String s  =new String("java技术大本营");

在jdk1.8及以前,String 中的值是用 char value[]来存储的。在jdk11中,则换成了byte[]来存储,如下图所示:

在debug断点中,我们可以看到 "java技术大本营" 被存储为:

有的小伙伴已经有疑问了,为什么变成了这些数字,其实这些还是char,只是变了个型而己。

如下图所示,我们单独对 '营' 字模拟了存储

通过上面图片可以看到,实际上是把char 拆成了两个部分,我们知道,单个char是按2个字节,16位的unicode进行存储的。对于'营'这个char来说,十进制的unicode是:'33829'. 转成二进制是:'1000010000100101'

我们把这个二进制串拆成两部分第一部分是低8位 '00100101',一部分是高8位'10000100',然后把这个二进制按带符号位转换成十进制,就是我们看到的37和-124啦

总结


本篇内容不多,但是就是这样一个小的知识点,我们可能从来都没有去研究过,java很庞大,但如果我们如这样分解成一个一个小知识点,然后去研究攻破,我们的java功力才会有一个大的提升,一起加油吧!