ES数据库缺点 es数据库和sql数据库的区别

转载

ghpsyn 2024-08-11 09:22:39

文章标签 ES数据库缺点数据库子查询 ci 字段 文章分类 架构后端开发

性能变化的关键：

#1 执行的先后顺序

谁是驱动表，谁先执行查询，谁后执行查询

#2 执行过程

exists的优点是：只要存在就返回了，这样的话很有 可能不需要扫描整个表。

in需要扫描完整个表，并返回结果。

所以，在字表比较小的情况下，扫描全表和部分表基本没有差别；但在大表情况下，exists就会有优势。

看这两个语句：

--子查询会执行完全关联，并返回所有符合条件的city_id 
 
 
 
select * from areas where id in   (select city_id from deals where deals.city_id = areas.id);

--子查询的关联其实是一样的，但子查询只要查到一个结果，就返回了，所以效率还是比较高些的

select * from areas where exists (select null     from deals where deals.city_id = areas.id);
 
 

   #3 字表查询的结果

exists判断子查询的结果是不是存在，但查到什么结果，什么字段，并不关心；

in 需要子查询查得的结果给主查询使用

对于 in和 exists的性能区别:
如果子查询得出的结果集记录较少，主查询中的表较大且又有索引时应该用 in,反之如果外层的主查询记录较少，子查询中的表大，又有索引时使用 exists。
其实我们区分 in和 exists主要是造成了驱动顺序的改变（这是 性能变化的关键），如果是 exists，那么以外层表为驱动表，先被访问，

如果是 IN，那么先执行子查询，所以我们会以驱动表的快速返回为目标，那么就会考虑到索引及结果集的关系了

另外 IN时不对NULL进行处理。

注意:NOT EXISTS与 NOT IN不能完全互相替换，看具体的需求。如果选择的列可以为空，则不能被替换。

对于not in和 not exists的性能区别：
not in只有当子查询中，select 关键字后的字段有not null约束或者有这种暗示时用not in,另外如果主查询中表大，子查询中的表小但是记录多，则应当使用not in,并使用anti hash join.
如果主查询表中记录少，子查询表中记录多，并有索引，可以使用not exists,另外not in最好也可以用/*+ HASH_AJ */或者外连接+is null
NOT IN在基于成本的应用中较好