hive and和or 同时使用 hive on和where

转载

云端筑梦工匠 2023-11-13 22:41:34

文章标签 hive and和or 同时使用 SQL 字段数据 文章分类 Hive 大数据

on、where、having的区别

1、on、where、having这三个都可以加条件的子句中，on是最先执行，where次之，having最后。有时候如果这先后顺序不影响中间结果的话，那最终结果是相同的。但因为on是先把不符合条件的记录过滤后才进行统计，它就可以减少中间运算要处理的数据，按理说应该速度是最快的。

2、where应该比having快点的，因为它过滤数据后才进行sum，所以having是最慢的。但也不是说having没用，因为有时在步骤3还没出来都不知道那个记录才符合要求时，就要用having了。

3、在两个表联接时才用on的，所以在一个表的时候，就剩下where跟having比较了。在这单表查询统计的情况下，如果要过滤的条件没有涉及到要计算字段，那它们的结果是一样的，只是where可以使用rushmore技术，而having就不能，在速度上后者要慢。

4、如果要涉及到计算的字段，就表示在没计算之前，这个字段的值是不确定的，根据上篇写的工作流程，where的作用时间是在计算之前就完成的，而having就是在计算后才起作用的，所以在这种情况下，两者的结果会不同。

5、在多表联接查询时，on比where更早起作用。系统首先根据各个表之间的联接条件，把多个表合成一个临时表后，再由where进行过滤，然后再计算，计算完后再由having进行过滤。由此可见，要想过滤条件起到正确的作用，首先要明白这个条件应该在什幺时候起作用，然后再决定放在那里

实例说明

1、假设有两张表：

表1：tab1

id size
1 10
2 20
3 30

表2：tab2

size name
10    AAA
20    BBB
20    CCC

两条SQL:

1、select * form tab1 left join tab2 on (tab1.size = tab2.size) where tab2.name=’AAA’
2、select * form tab1 left join tab2 on (tab1.size = tab2.size and tab2.name=’AAA’)

第一条SQL的过程：

1、中间表on条件: tab1.size = tab2.size

tab1.id tab1.size tab2.size tab2.name

1 10 10 AAA

2 20 20 BBB

2 20 20 CCC

3 30 (null) (null)

2、再对中间表过滤where 条件：tab2.name=’AAA’

tab1.id tab1.size tab2.size tab2.name
1 10 10 AAA

第二条SQL的过程

中间表on条件: tab1.size = tab2.size and tab2.name=’AAA’(条件不为真也会返回左表中的记录)

tab1.id tab1.size tab2.size tab2.name
1 10 10 AAA
2 20 (null) (null)
3 30 (null) (null)

2、实例2详细说明

SQL语句如下：

SELECT *
FROM 表1
LEFT JOIN 表2 ON 表1.id = 表2.id AND 表2.Name != 'ff'
WHERE 表1.NAME != 'aa'

步骤1：返回笛卡尔积（SELECT * FROM 表1 CROSS JOIN 表2）

步骤2：应用ON筛选器（当前的条件为表1.id = 表2.id AND 表2.Name != 'ff'）

步骤3：添加外部行

这一步只对OUTER JOIN起作用，如果是LEFT JOIN会以左边的表为保留表，如果是RIGHT JOIN会以右边的表为保留表。所谓外部行是指，保留表中的行。即使第二步的ON过滤掉了一些行，在这一步，会根据保留表添加第二步过滤掉的行。当前的例子，不存在这种情况。

步骤4.应用WHERE筛选器(当前是Name != ‘aa’)过滤前三步所生成虚拟表的数据。

总结：

1、如果SQL用的是Left Join ，On后面的条件对Left的表没有作用，只对Right的表有过滤作用，Where语句可以对Left的表有过滤作用

2、如果SQL用的是Right Join ，On后面的条件对Right的表没有作用，只对Left的表有过滤作用，Where语句可以对Right的表有过滤作用

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：甲鱼游戏Python 甲鱼软件

下一篇：微处理器常见的指令架构有哪些微处理器的指令集架构

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

hive and和or 同时使用 hive on和where

hive and和or 同时使用 hive on和where

51CTO博客