先说结论,mysql 中的 varchar 是有最大长度限制的,这个值是 65535 个字节。
varchar(100),这个 100 的单位是啥,这个单位其实在不同版本中是不一样的。
在早期低版本中代表的是字节,具体哪个版本我也没去验证了,后来被改成了字符,不过可以肯定的是在 5.1 版本后, varchar(100) 就是指 100 个字符。
说到 varchar ,一般都会拿 char 来做比较说明。
char 是固定长度,其单位也是字符,比如 char(10),就表示不管你给的什么值,都会被 mysql 固定保存成 10 个字符。
如果给的字符长度小于 10,那么在尾部就会自动用空格补齐。
如果大于 10,在严格模式(strict sql mode)下就会报错,在非严格模式下就会对内容做自动截取操作。
另外 char 也是有最大长度限制的,最大长度为 255, 即 char 类型最多只能保存 255 个字符,char(256) 这都是错误的写法,可以看下面的例子。
##创建一个表,同时声明address字段长度为256会报错,最大为255
mysql> create table test2 ( address char(256) );
ERROR 1074 (42000): Column length too big for column 'address' (max = 255); use BLOB or TEXT instead
下面是 char 和 varchar 对于同一个字符所需要的不同的存储空间,这里假设使用的是 latin1 单字节字符集。
值 |
| 存储空间大小(字节) |
| 存储空间大小(字节) |
|
| 4 bytes |
| 1 byte |
|
| 4 bytes |
| 3 bytes |
|
| 4 bytes |
| 5 bytes |
|
| 4 bytes |
| 5 bytes |
细心的你可能会发现 varchar 的存储空间会比字符的实际长度多 1 个字节,这是因为 varchar 需要额外增加 1 到 2 个字节来存储字符的长度,这个值被称作前缀。
也就是说在 varchar 类型中,除了字符本身实际占用的空间外,还需要 1 个或 2 个字节来声明这个字符的长度。
如果存储的值小于 255 个字节,则使用 1 个字节来存储前缀,如果大于 255 个字节则使用 2 个字节来存储前缀。
关于字符集和字节的关系,以及字节 (byte) 与位 (bit) 的关系。
1 byte (字节) = 8 bit (位)
2^8 = 256
所以计算机里常见的 255、256 临界值绝大多数与这个有关
1 个字节具体占多大的空间,这与所使用的字符集有关系
比如 latin1 单字节字符集,1 个字符即占 1 个字节
我们常见的 GBK、UTF8、UTF8-MB4 这些都是多字节字符集
GBK :一个字符最多占 2 个字节
UTF8:一个字符最多占 3 个字节
UTF8MB4:一个字符最多占 4 个字节
好了,再坚持一会,回到文章开头的问题,为啥 varchar 最大长度是 65535 个字节呢,其实这个是受 mysql 另一个规则限制导致的,mysql 规定了每行数据大小不能超过 65535 个字节。
另外还有一个小问题,一个字段如果允许为 null ,在 mysql 中也是需要增加额外空间来单独标识的,反之则不需要这个额外空间,至于这个空间大小具体是怎么计算的,我目前也还没有研究过。
结合上面说的几点,下面来通过几个实例来验证下。
##字符集设置为latin1,1个字符=1个字节,字段允许为null
mysql> create table test ( address varchar(65536) default null ) charset=latin1;
ERROR 1074 (42000): Column length too big for column 'address' (max = 65535); use BLOB or TEXT instead
##减去varchar前缀长度标识2个字节,还是报错,说明null标识也占用了空间
mysql> create table test ( address varchar(65533) default null ) charset=latin1;
ERROR 1118 (42000): Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. This includes storage overhead, check the manual. You have to change some columns to TEXT or BLOBs
##把字段设置为非空即可建表成功
mysql> create table test ( address varchar(65533) not null ) charset=latin1;
Query OK, 0 rows affected (0.01 sec)
##如果字符集设置为UTF8,那么 max=65535/3=21845,一个字符最多占3个字节
mysql> create table test2 ( address varchar(65533) not null ) charset=UTF8;
ERROR 1074 (42000): Column length too big for column 'address' (max = 21845); use BLOB or TEXT instead
基于上面几个实例,基本上可以得出计算 varchar 最大长度限制的公式。
varchar 最大长度限制 = (行最大字节数(65535) - null 标识字节数 - 长度前缀字节数(1或2)) / 字符集单字符占用最多字节数
看到这里,不知道你有没有一个疑问,为什么长度前缀 1 或 2 个字节就够用了呢,因为 2 个字节的话,2^16 = 65536,这已经超过 mysql 行最大字节数 65535 的限制了,所以 1 到 2 个字节就够用了。
最后再看一个综合例子,我们创建一个表,采用 UTF8 字符集,添加两个非空字段,分别为 char 和 varchar 类型,char 类型长度给定为 255。
那么 varchar 类型字段的最大字节数应该就是,
65535 (行最大字节数) - 255*3 (一个字符最多占 3 个字节) = 64770,
然后再减去 2 个长度前缀字节,
64770 - 2 = 64768,
最后再算出 varchar 最大字符数为 64768 / 3 = 21589.33,
##字符数21590超过最大字符数会报错
mysql> create table test4 (name char(255) not null, address varchar(21590) not null ) charset=utf8;
ERROR 1118 (42000): Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. This includes storage overhead, check the manual. You have to change some columns to TEXT or BLOBs
##字符数21589则刚好能创建成功
mysql> create table test4 (name char(255) not null, address varchar(21589) not null ) charset=utf8;
Query OK, 0 rows affected, 1 warning (0.02 sec)
好了,关于 varchar 的最大长度问题就聊到这了,文中如有错误,欢迎大家批评指出,更欢迎大家交流讨论,如果文章对你有帮助,点个在看表示对我的支持哈,感谢。