NULL值作为数据库中的一个特殊操作值,在日常的操作中要尤其留意。如果使用不当,会在某些特定条件下,导致SQL执行的结果集有错误。但是这种错误并非数据库本身造成的,而是在设计中对NULL处理不当的造成的。
      一次在检查数据库运行报告时看到了一句SQL,和相关的研发人员沟通后知道,其需要的功能是显示最新时间配置的某些数据。那么我通过一个小小的模型来再现这个问题。
      首先建立一个张名为larrytest的表,有两个字段C1和C2。建表SQL如下。
     
SQL> create table larrytest(c1 number not null,c2 date);

Table created

     然后向该表插入必要的数据:

SQL> insert into larrytest values(100,to_date('20100402','yyyymmdd'));

1 row inserted

SQL> insert into larrytest values(101,to_date('20100403','yyyymmdd'));

1 row inserted

SQL> insert into larrytest values(102,null);

1 row inserted

SQL> insert into larrytest values(103,to_date('20100404','yyyymmdd'));

1 row inserted

SQL> commit;

Commit complete

      这时根据需要,执行显示C2字段时间最新(后)的C1字段数据。原本是想得到2010年4月4日对应的数据103数据。但是看执行的结果。
 
SQL> select c1 from (select row_number() over    (order by c2 desc) r,c1 from larrytest) where r=1
    2    ;

                C1
         ----------
             102

      事实上却是102,即在排序中,NULL被倒序排在了第一个,而且无论在有什么新日期的数据被插入,这个NULL值对应的行都会永远排在最前面。就是说执行的SQL检索的结果集都会是错的,只要表中排序的字段有空(NULL)数据进入。多么灾难呀。
      对与数据库中表的设计还是遵循尽可能少的使用NULL字段,相对严谨的NOT NULL要求会避免不必要的错误出现。当然使用默认值有时是一个不错的选择。另外非空(NOT NULL)会带来较好的性能。
      空与非空是在数据库设计中是非常小的一个问题,但是如果不加注意,却会带来较大的问题。