基本概念

我们一般理解java中

一个字符char占2个字节byte

一个汉字占2个字节byte

一个字母占1个字节byte

 


其他情况

对于汉字来说,采用gbk编码占两字节,采用utf8编码占三个字节。

 


String的length()方法

String s1 = "aa";
String s2 = "a好";
s1.length()
s2.length()

答案都是2,因为该方法是返回字符的个数,并不是内存中的字节数。

 


数据库应用

java的编码不会影响数据库对汉字或者字母所占内存的理解。

数据库中一个字段长度为varchar(50),表明在内存中占50个字节,所以我们一般认为可以输入25个汉字,50个字母。

如果该内容即可以是汉字,也可以是字母,我们在后台验证的时候一般减半处理。

if(name.length()<25){ }

当然也可以判断如果是汉字,长度加1。