主要分编译期和运行期。
1.编译期
String data="aaa";
这样定义的字符串在编译期就已经确定了,aaa字符串存放在方法区的常量池。
代码编译成字节码以后,String的数据结构是CONSTANT_Utf8_info表示,
CONSTANT_Utf8_info {
u1 tag;
u2 length;
u1 bytes[length];
}
u1 bytes[length],表示存放字符的byte数组;
u2 length,表示byte数组的长度,u2表示2个字节16位,能表示最大的值是65535(为什么不是65536?)
######那么是不是编译期,一个String字符串可以存放65535个字节长度的字符呢?
实现证明,只能存放65534个字节长度的字符,不能超过65535个。
######为什么不是65535个呢?
看到有的帖子说,是因为虚拟机bug,在判断长度时候,是小于65535而不是小于等于65535。
######英文字符可以存多少个呢?
一个英文字符占一个字节,那么就可以存放65534个字符。
######中文字符可以存多少个呢?
如果是UTF-8编码,一个中文字符占3个字节,那么则是65535/3个。
这里为什么不是65534/3呢,是因为虚拟机在做判断的时候,如果大于65535/3则抛异常。
######中英字符混合可以存多少个呢?
那就是不超过65535个字节。
2.运行期
String data=new String();
这样定义的String是存放在堆中。
从构造函数可以看出,String背后是用char数组实现的,数组的最大长度是Integer.MAX_VALUE,那么可以存放字符理论最大长度就是Integer.MAX_VALUE。
public String(byte[] data, int high, int offset, int byteCount) {
if ((offset | byteCount) < 0 || byteCount > data.length - offset) {
throw failedBoundsCheck(data.length, offset, byteCount);
}
this.offset = 0;
this.value = new char[byteCount];//用char数组实现的
this.count = byteCount;
high <<= 8;
for (int i = 0; i < count; i++) {
value[i] = (char) (high + (data[offset++] & 0xff));
}
}