性能变化的关键:



#1 执行的先后顺序



谁是驱动表,谁先执行查询,谁后执行查询



#2 执行过程



exists的优点是:只要存在就返回了,这样的话很有 可能不需要扫描整个表。  



in需要扫描完整个表,并返回结果。



所以,在字表比较小的情况下,扫描全表和部分表基本没有差别;但在大表情况下,exists就会有优势。


看这两个语句:

--子查询会执行完全关联,并返回所有符合条件的city_id 
 
 
 
select * from areas where id in   (select city_id from deals where deals.city_id = areas.id);

--子查询的关联其实是一样的,但子查询只要查到一个结果,就返回了,所以效率还是比较高些的

 

select * from areas where exists (select null     from deals where deals.city_id = areas.id);
 
 

   #3 字表查询的结果


exists判断子查询的结果是不是存在,但查到什么结果,什么字段,并不关心;


in      需要子查询查得的结果给主查询使用

对于 inexists的性能区别:
   如果子查询得出的结果集记录较少,主查询中的表较大且又有索引时应该用 in,反之如果外层的主查询记录较少,子查询中的表大,又有索引时使用 exists
   其实我们区分 inexists主要是造成了驱动顺序的改变(这是 性能变化的关键),如果是 exists,那么以外层表为驱动表,先被访问,


如果是 IN,那么先执行子查询,所以我们会以驱动表的快速返回为目标,那么就会考虑到索引及结果集的关系了



另外 IN时不对NULL进行处理。



注意:NOT  EXISTS与 NOT  IN不能完全互相替换,看具体的需求。如果选择的列可以为空,则不能被替换。




对于not  in和 not  exists的性能区别:
    not  in只有当子查询中,select 关键字后的字段有not null约束或者有这种暗示时用not  in,另外如果主查询中表大,子查询中的表小但是记录多,则应当使用not  in,并使用anti hash join.
   如果主查询表中记录少,子查询表中记录多,并有索引,可以使用not  exists,另外not  in最好也可以用/*+ HASH_AJ */或者外连接+is null
NOT  IN在基于成本的应用中较好