导语
char
和 varchar
是两种最主要的字符串类型,这些值在内存和磁盘中的存储和具体的存储引擎的实现有关。下面讨论的是假设存储引擎是 Innodb
或 MyISAM
,来看下两种数据类型的具体差别吧。
1,char
char
类型是定长的,MySQL总是根据定义的字符串长度分配足够的空间,在存储char值时,MySQL会删除所有的末尾空格。另外,char值会根据需要采用空格进行填充以方便比较。char 适合存储很短的字符串,或者所有的值都接近同一个长度。
例如:char非常适合存储密码的MD5值,因为这是一个定长的值。对于经常变动的数据,char也比varchar更好,因为定长的char不易产生碎片。对于非常短的列,char比varchar在存储空间上更有效率。
例如用char(1) 来存储只有Y和N的值,如果采用单字节字符集只需要一个字节,但是varchar(1)却需要两个字节,因为还要一个记录长度的额外字节。
2,varchar
varchar
类型用于存储可变长的字符串,是最常见的字符串数据类型,它比定长类型更节省空间,因为它仅使用必须的空间(例如,字符串越短使用越少的空间),不过有种例外的情况,如果MySQL 表使用row_format=fixed ,这样会导致每一行会使用定长存储,会很浪费空间。
varchar 会使用1或者2个额外的字节存储字符串的长度,如果列的长度小于或等于255个字节,则使用一个字节表示,否则使用2个字节。varchar节省了存储空间,所以对性能也有帮助。但是,由于行是变长的,在update时可以使行变得比原来长,这导致需要做额外的工作。如果一个行的空间增长,并且在页内没有更多的空间可以存储,在这种情况下,不同的存储引擎的处理方式不一样。
例如:MyISAM会将行拆成不同的片段存储,Innodb则需要分裂页来使行可以放进页内,其他一些存储引擎也许不在原数据位置更新数据。
下面情况下使用varchar 是合适的:字符串列的最大长度比平均长度大很多;列的更新很少,所以碎片不是问题。
在5.0或者更高的版本中,MySQL在存储和检索时会保留末尾空格。
其他
数据如何存储取决于存储引擎,并非所有的存储引擎都会按照同样的方式处理定长和变长的字符串。比如:Memory引擎只存储定长的行,即使有变长的字段也会根据最大长度分配最大空间,不过填充和截取空格的行为在不同的存储引擎是一样的,因为这是在MySQL服务层实现的。
总结
对于长度固定的字符串(比如:MD5(密码))或者非常短的一些字符串,可以考虑使用char类型,对于长度不固定且比较长字符串我们一般使用varchar,因为这个时候相对char更节省空间。另外,文章中提到对于经常需要更新的字符串使用char这点的话,在实际应用中我们应该还要结合字符串长度来选择最合适的存储类型。