CASE WHEN的用法及总结

  • 一、已知数据按照另外一种方式进行分组,分析
  • 二、用一个SQL语句完成不同条件的分组
  • 三、在Check中使用Case函数
  • 四、根据条件有选择的UPDATE
  • 五、两个表数据是否一致的检查
  • 六、在Case函数中使用合计函数
  • 七、小结

Case具有两种格式。简单Case函数和Case搜索函数。

简单Case函数



1 CASE sex
2 WHEN '1' THEN '男'
3 WHEN '2' THEN '女'
4 ELSE '其他' END



Case搜索函数



1 CASE WHEN sex = '1' THEN '男' 
2 WHEN sex = '2' THEN '女' 
3 ELSE '其他' END



 

两种方式,可以实现相同的功能。简单Case函数的写法相对比较简洁,但是和Case搜索函数相比,功能方面会有些限制,比如写判断式。还有一个需要注意的问题,Case函数只返回第一个符合条件的值,剩下的Case部分将会被自动忽略。

比如说,下面这段SQL,你永远无法得到“第二类”这个结果



1 CASE WHEN col_1 IN ( 'a', 'b') THEN '第一类' 
2 WHEN col_1 IN ('a')  THEN '第二类' 
3 ELSE'其他' END



 



一、已知数据按照另外一种方式进行分组,分析

判断是不是在一个类中,然后聚合求出总数

1.求出每个省学生的个数

hive join 和 where谁先执行 hive where case when_搜索



1 SELECT
 2     CASE c.city
 3 WHEN '哈尔滨' THEN
 4     '黑龙江'
 5 WHEN '沈阳' THEN
 6     '辽宁'
 7 WHEN '长春' THEN
 8     '吉林'
 9 WHEN '齐齐哈尔' THEN
10     '黑龙江'
11 ELSE
12     '其他地区'
13 END AS province,
14  sum(c.city_count) as stu_nums
15 FROM
16     (
17         SELECT
18             city,
19             count(city) city_count
20         FROM
21             stu_info
22         GROUP BY
23             city
24     ) c
25 GROUP BY
26     CASE c.city
27 WHEN '哈尔滨' THEN
28     '黑龙江'
29 WHEN '沈阳' THEN
30     '辽宁'
31 WHEN '长春' THEN
32     '吉林'
33 WHEN '齐齐哈尔' THEN
34     '黑龙江'
35 ELSE
36     '其他地区'
37 END ORDER BY stu_nums desc;



结果显示

hive join 和 where谁先执行 hive where case when_搜索_02

哈哈,基本可以判断出是 哈佛(哈尔滨佛学院)

2.判断学生成绩等级

hive join 和 where谁先执行 hive where case when_ci_03



1 select case 
 2 when grade >=60 and grade < 70 then 'D'
 3 when grade >=70 and grade <80 then 'C'
 4 when grade >=80 and grade <90 then 'B'
 5 when grade >=90 and grade <=100 then 'A'
 6 else 'E' end as level ,count(*) as stu_nums
 7 from stu_grade 
 8 GROUP BY
 9 case 
10 when grade >=60 and grade < 70 then 'D'
11 when grade >=70 and grade <80 then 'C'
12 when grade >=80 and grade <90 then 'B'
13 when grade >=90 and grade <=100 then 'A' 
14 else 'E' end ;



结果显示

hive join 和 where谁先执行 hive where case when_SQL_04

60分万岁!!!



 



二、用一个SQL语句完成不同条件的分组

一行显示出每个省份的男女人数

普通情况下,用UNION也可以实现用一条语句进行查询。但是那样增加消耗(两个Select部分),而且SQL语句会比较长。下面是一个是用Case函数来完成这个功能的例子

hive join 和 where谁先执行 hive where case when_搜索_05



1 select 
2 province,
3 sum(case when sex= 'F' then  nums else 0 end ) AS F,
4 sum(case when sex = 'M' then nums else 0 end ) AS M
5 from 
6 stu_province 
7 GROUP BY province 
8 ORDER BY F desc;



结果显示

hive join 和 where谁先执行 hive where case when_ci_06

这样我们使用Select,完成对二维表的输出形式,充分显示了Case函数的强大。



 



三、在Check中使用Case函数

在Check中使用Case函数在很多情况下都是非常不错的解决方法。可能有很多人根本就不用Check,那么我建议你在看过下面的例子之后也尝试一下在SQL中使用Check。 下面我们来举个例子 公司A,这个公司有个规定,女职员的工资必须高于1000块。如果用Check和Case来表现的话,如下所示

THEN 1 ELSE 0 END ELSE 1 END = 1

如果单纯使用

Check: CONSTRAINT check_salary CHECK  ( sex = '2' AND salary > 1000 )

女职员的条件倒是符合了,男职员就无法输入了。



 



四、根据条件有选择的UPDATE

例,有如下更新条件

1.工资5000以上的职员,工资减少10%

2.工资在2000到4600之间的职员,工资增加15%

hive join 和 where谁先执行 hive where case when_ci_07

很容易考虑的是选择执行两次UPDATE语句,如下所示

--条件1



1 UPDATE emp
2 SET salary = salary * 0.9
3 WHERE
4     salary >= 5000;



执行后

hive join 和 where谁先执行 hive where case when_ci_08

--条件2



1 UPDATE Personnel  SET salary = salary * 1.15 
2 WHERE salary >= 2000 AND salary < 4600;



结果显示

hive join 和 where谁先执行 hive where case when_搜索_09

发现之前5000的员工编程5175,反而涨薪了,反之如果先执行涨薪在降薪,4600的会比之前少,如果想一个sql执行



1 UPDATE emp
 2 SET salary = CASE
 3 WHEN salary >= 2000
 4 AND salary <= 4600 THEN
 5     salary * 1.15
 6 WHEN salary >= 5000 THEN
 7     salary * 0.9
 8 ELSE
 9     salary
10 END;



结果显示

hive join 和 where谁先执行 hive where case when_搜索_10

这里要注意一点,最后一行的ELSE salary是必需的,要是没有这行,不符合这两个条件的人的工资将会被写成NUll,那可就大事不妙了。在Case函数中Else部分的默认值是NULL,这点是需要注意的地方。

2.互换信息

需求,将Tom和Lily互换部门



1 UPDATE emp
2 SET dept_id = CASE
3 WHEN dept_id = 1 THEN
4     2
5 WHEN dept_id = 2 THEN
6     1
7 ELSE
8     dept_id
9 END;



结果显示

hive join 和 where谁先执行 hive where case when_SQL_11



 



五、两个表数据是否一致的检查

Case函数不同于DECODE函数。在Case函数中,可以使用BETWEEN,LIKE,IS NULL,IN,EXISTS等等。比如说使用IN,EXISTS,可以进行子查询,从而 实现更多的功能。 下面具个例子来说明,检测员工是否在部门中,返回结果'Matched',如果没有找到,返回结果'Unmatched'。 要实现下面这个功能,可以使用下面两条语句

原始表还是之前的emp,新增dept表

emp

hive join 和 where谁先执行 hive where case when_SQL_11

dept

hive join 和 where谁先执行 hive where case when_搜索_13



1 SELECT
 2     ename,
 3     dept_id,
 4     CASE
 5 WHEN dept_id IN (SELECT id FROM dept) THEN
 6     'Matched'
 7 ELSE
 8     'UnMatched'
 9 END as isMatch
10 FROM
11     emp



结果显示

hive join 和 where谁先执行 hive where case when_SQL_14



 



六、在Case函数中使用合计函数

hive join 和 where谁先执行 hive where case when_搜索_15

在当前的学生成绩表中进行操作, 有的学生选择了同时修几门课程(100,200)也有的学生只选择了一门课程(300,400,500)。选修多门课程的学生,要选择一门课程作为主修,主修flag里面写入 Y。只选择一门课程的学生,主修flag为N

1.只选修一门课程的人,返回那门课程的ID

2.选修多门课程的人,返回所选的主课程ID

使用两条语句分别查询

--条件1:只选择了一门课程的学生



1 SELECT
2     stu_id,
3     MAX(course_id) AS main_class
4 FROM
5     courses
6 GROUP BY
7     stu_id
8 HAVING
9     count(*) = 1



--条件2:选择多门课程的学生



1 SELECT
2     stu_id,
3     course_id
4 FROM
5     courses
6 WHERE
7     isMain = 'Y'



3.Union下即可得出最终结果



1 SELECT
 2     stu_id,
 3     MAX(course_id) AS main_class
 4 FROM
 5     courses
 6 GROUP BY
 7     stu_id
 8 HAVING
 9     count(*) = 1
10 UNION
11     SELECT
12         stu_id,
13         course_id
14     FROM
15         courses
16     WHERE
17         isMain = 'Y'
18 order by stu_id



结果显示

hive join 和 where谁先执行 hive where case when_SQL_16

接下来使用case when then



1 SELECT
 2     stu_id,
 3     CASE
 4 WHEN COUNT(*) = 1 THEN
 5     Max(course_id)
 6 ELSE
 7     Max(
 8         CASE
 9         WHEN isMain = 'Y' THEN
10             course_id
11         ELSE
12             NULL
13         END
14     )
15 END
16 FROM
17     courses
18 GROUP BY
19     stu_id;
20



 

效果同上

七、小结

select 与 case结合使用最大的好处有两点

一是、可以把一列的数据,区分出其他列,例如一个班的列表,求出班级男女人数

二是、交换数据,例如学生学号反了

三是、一起更新数据,避免出现错误更新

四是、一个表的多个情况的union,可以考虑