性能变化的关键:
#1 执行的先后顺序
谁是驱动表,谁先执行查询,谁后执行查询
#2 执行过程
exists的优点是:只要存在就返回了,这样的话很有 可能不需要扫描整个表。
in需要扫描完整个表,并返回结果。
所以,在字表比较小的情况下,扫描全表和部分表基本没有差别;但在大表情况下,exists就会有优势。
看这两个语句:
--子查询会执行完全关联,并返回所有符合条件的city_id
select * from areas where id in (select city_id from deals where deals.city_id = areas.id);--子查询的关联其实是一样的,但子查询只要查到一个结果,就返回了,所以效率还是比较高些的
select * from areas where exists (select null from deals where deals.city_id = areas.id);
#3 字表查询的结果
exists判断子查询的结果是不是存在,但查到什么结果,什么字段,并不关心;
in 需要子查询查得的结果给主查询使用
对于
in和
exists的性能区别:
如果子查询得出的结果集记录较少,主查询中的表较大且又有索引时应该用
in,反之如果外层的主查询记录较少,子查询中的表大,又有索引时使用
exists。
其实我们区分
in和
exists主要是造成了驱动顺序的改变(这是
性能变化的关键),如果是
exists,那么以外层表为驱动表,先被访问,
如果是 IN,那么先执行子查询,所以我们会以驱动表的快速返回为目标,那么就会考虑到索引及结果集的关系了
另外 IN时不对NULL进行处理。
注意:NOT EXISTS与 NOT IN不能完全互相替换,看具体的需求。如果选择的列可以为空,则不能被替换。
对于not
in和 not
exists的性能区别:
not
in只有当子查询中,select 关键字后的字段有not null约束或者有这种暗示时用not
in,另外如果主查询中表大,子查询中的表小但是记录多,则应当使用not
in,并使用anti hash join.
如果主查询表中记录少,子查询表中记录多,并有索引,可以使用not
exists,另外not
in最好也可以用/*+ HASH_AJ */或者外连接+is null
NOT
IN在基于成本的应用中较好
















