本文阅读时间大约6分钟。

其实写这篇文章,也是来自一个知识星球读者的提问,他在二面的过程中被问到了,由于他简历中写道有 MySQL 调优经验,但这个问题没有回答好,二面被刷了。


其实我们刚学习 C 语言的时候,就接触过 NULL,比如下面这句代码。


int *p = NULL;


它实际上表示将指针指向一块不被使用的内存地址,一般会在宏中定义好。


那么我们常用的 Java 语言,同样也用到 null,表示一个空引用,如果你不小心引用了,那么就会抛出 NullPointerException,就像昨天 Reddit 上面很火的一张图。


mysql 8 sql_mode非严格模式 mysql 非null_mysql


关于空指针异常,我之前写过一篇文章来介绍怎么防御《java.lang.NullPointerException》。但是这篇文章没有写全,今天在这里补充一下。


其实很早之前 guava 就提供了 Optional 容器类来处理 null,其目的便是避免猝不及防的空指针。后来 java8 直接引入了 Optional,功能一样,用法上稍稍有点变化。其实还有很多开源框架,比如 Spring,common lang3等,也提供了处理空的工具类,如。


StringUtils.isBlank();   

CollectionUtils.isEmpty();


那么在 MySQL 中,NULL 表示不知道的数据。


我们在设计表的时候,经常会有老司机这么告诉我们。


字段尽可能用NOT NULL,而不是NULL,除非特殊情况。


这句话到底有没有错?


可以负责任的告诉你这句话没有错,也不是以讹传讹。


这句话首次出现在 MySQL 官网。


mysql 8 sql_mode非严格模式 mysql 非null_MySQL_02

如果你读过《高性能 MySQL》这本书,你应该会看到这么一段,在 4.1 节提到。

mysql 8 sql_mode非严格模式 mysql 非null_MySQL_03


由此看来,把 NULL 改成 NOT NULL 对索引的性能并没有明显的提升。避免使用 NULL 的目的,是便于代码的可读性和可维护性。同时也便于避免下文即将出现的一些稀奇古怪的错误。


好了,下面咱们通过实验来看看,使用 NULL 会出现那些稀奇古怪的错误呢?


跟我一样在本地建两个表 t1,t2;其中一个表 name 字段允许为空,另一个表 name 字段不允许为空,分别对 name 字段建立索引,SQL 语句如下。


mysql 8 sql_mode非严格模式 mysql 非null_MySQL_04

mysql 8 sql_mode非严格模式 mysql 非null_mysql_05

mysql 8 sql_mode非严格模式 mysql 非null_MySQL_06

mysql 8 sql_mode非严格模式 mysql 非null_mysql_07

1、NOT IN、!= 等负向条件查询在有 NULL 值的情况下返回非空行的结果集。


比如上例中的 t2,我执行如下 SQL 语句。


SELECT * from t2 where name != '张三'

你本打算返回 id 为 2 的那行数据,然而什么都没有。


mysql 8 sql_mode非严格模式 mysql 非null_字段_08


又比如这条 SQL 语句。


select * from t2 where name not in (select name from t2 where id!=1)

也返回了空结果集。


2、使用 concat 函数拼接时,首先要对各个字段进行非 NULL 判断,否则只要任何一个字段为空都会造成拼接的结果为 NULL。


比如下面这条 SQL 语句。


SELECT CONCAT("1",NULL)


mysql 8 sql_mode非严格模式 mysql 非null_mysql_09


3、当用count函数进行统计时,NULL 列不会计入统计。


SELECT count(name) from t2


mysql 8 sql_mode非严格模式 mysql 非null_MySQL_10


4、查询空行数据,用 is NULL。


SELECT * FROM t2 where name is NULL


mysql 8 sql_mode非严格模式 mysql 非null_mysql_11


5、NULL 列需要更多的存储空间,一般需要一个额外的字节作为判断是否为 NULL 的标志位。


如果你仔细观察 t1 和 t2 表的 key_len,会发现 t2 比 t1 多了一个字节。


explain SELECT * from t2 where name = '张三'


mysql 8 sql_mode非严格模式 mysql 非null_字段_12

explain SELECT * from t1 where name = '张三'


mysql 8 sql_mode非严格模式 mysql 非null_MySQL_13


key_len 的长度一般跟这三个因素有关,分别是数据类型字符编码是否为 NULL


因此,t2 比 t1 多出的这一个字节,用于作为判断是否为 NULL 的标志位了。


马蛋,原来一切都在书中。如果面试的哪位同学多读几篇《高性能 MySQL》这本书,那个岗位就是他的了,但没有那么多如果。。。


在此,建议大家多看官方文档,多读点好书,多关注一些良心的原创技术自媒体,不要看那些无凭无据的文章,反而会以讹传讹,贻害无穷。


如果这篇文章对你有帮助,麻烦分享到你的朋友圈,来帮助更多的朋友。


参考

https://dev.mysql.com/doc/refman/5.7/en/dynamic-format.html

https://dev.mysql.com/doc/refman/5.5/en/problems-with-null.html

https://dev.mysql.com/doc/refman/5.5/en/multiple-column-indexes.html

https://dev.mysql.com/doc/internals/en/myisam-introduction.html

https://dev.mysql.com/doc/internals/en/innodb-field-contents.html