目录



可用 ​​UNION​​ 操作符来组合数条 SQL 查询。利用 ​​UNION​​,可给出多条 SELECT 语句,将它们的结果组合成一个结果集。

一、使用 ​​UNION​

使用 ​​UNION​​ 很简单,所要做的只是给出每条 ​​SELECT​​ 语句,在各条语句之间放上关键字 ​​UNION​​。

举个例子,假如需要 Illinois、Indiana 和 Michigan 等美国几个州的所有顾客的报表,还想包括不管位于哪个州的所有的 Fun4All。当然可以利用 WHERE 子句 来完成此工作,不过这次我们使用 ​​UNION​​。

如上所述,创建 ​​UNION​​ 涉及编写多条 ​​SELECT​​ 语句。首先来看单条语句:

输入▼

SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI');


输出▼

cust_name       cust_contact      cust_email
----------- ------------- ------------
Village Toys John Smith sales@villagetoys.com
Fun4All Jim Jones jjones@fun4all.com
The Toy Store Kim Howard NULL


输入▼

SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_name = 'Fun4All';


输出▼

cust_name       cust_contact         cust_email
----------- ------------- ------------
Fun4All Jim Jones jjones@fun4all.com
Fun4All Denise L. Stephens dstephens@fun4all.com


分析▼

第一条 ​​SELECT​​ 把 Illinois、Indiana、Michigan 等州的缩写传递给 IN 子句,检索出这些州的所有行。第二条 SELECT 利用简单的相等测试找出所有 Fun4All。你会发现有一条记录出现在两次结果里,因为它满足两次的条件。

组合这两条语句,可以如下进行:

输入▼

SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI')
UNION
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_name = 'Fun4All';


输出▼

cust_name       cust_contact        cust_email
----------- ----------- ----------------
Fun4All Denise L. Stephens dstephens@fun4all.com
Fun4All Jim Jones jjones@fun4all.com
Village Toys John Smith sales@villagetoys.com
The Toy Store Kim Howard NULL


分析▼

这条语句由前面的两条 ​​SELECT​​ 语句组成,之间用 ​​UNION​​ 关键字分隔。​​UNION​​ 指示 DBMS 执行这两条 ​​SELECT​​ 语句,并把输出组合成一个查询结果集。

为了便于参考,这里给出使用多条 ​​WHERE​​ 子句而不是 ​​UNION​​ 的相同查询:

输入▼

SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI') OR cust_name='Fun4All';


在这个简单的例子中,使用 ​​UNION​​ 可能比使用 ​​WHERE​​ 子句更为复杂。但对于较复杂的过滤条件,或者从多个表(而不是一个表)中检索数据的情形,使用 ​​UNION​​ 可能会使处理更简单。

提示:UNION 的限制

使用 ​​UNION​​ 组合 ​​SELECT​​ 语句的数目,SQL 没有标准限制。但是,最好是参考一下具体的 DBMS 文档,了解它是否对 ​​UNION​​ 能组合的最大语句数目有限制。

注意:性能问题

多数好的 DBMS 使用内部查询优化程序,在处理各条 ​​SELECT​​ 语句前组合它们。理论上讲,这意味着从性能上看使用多条 ​​WHERE​​ 子句条件还是 ​​UNION​​ 应该没有实际的差别。不过我说的是理论上,实践中多数查询优化程序并不能达到理想状态,所以最好测试一下这两种方法,看哪种工作得更好。

二、​​UNION​​ 规则

可以看到,​​UNION​​ 非常容易使用,但在进行组合时需要注意几条规则。

  • ​UNION​​ 必须由两条或两条以上的 ​​SELECT​​ 语句组成,语句之间用关键字 ​​UNION​​ 分隔(因此,如果组合四条 ​​SELECT​​ 语句,将要使用三个 ​​UNION​​ 关键字)。
  • ​UNION​​ 中的每个查询必须包含相同的列、表达式或聚集函数(不过,各个列不需要以相同的次序列出)。
  • 列数据类型必须兼容:类型不必完全相同,但必须是 DBMS 可以隐含转换的类型(例如,不同的数值类型或不同的日期类型)。

说明:UNION 的列名

如果结合 ​​UNION​​ 使用的 ​​SELECT​​ 语句遇到不同的列名,那么会返回什么名字呢?比如说,如果一条语句是 ​​SELECT prod_name​​,而另一条语句是 ​​SELECT productname​​,那么查询结果返回的是什么名字呢?

答案是它会返回第一个名字,举的这个例子就会返回 prod_name,而不管第二个不同的名字。这也意味着你可以对第一个名字使用别名,因而返回一个你想要的名字。

这种行为带来一个有意思的副作用。由于只使用第一个名字,那么想要排序也只能用这个名字。拿我们的例子来说,可以用 ​​ORDER BY prod_name​​ 对结果排序,如果写成 ​​ORDER BY productname​​ 就会出错,因为查询结果里没有叫作 productname 的列。

如果遵守了这些基本规则或限制,则可以将 ​​UNION​​ 用于任何数据检索操作。

三、包含或取消重复的行

回到一节,我们看看所用的 ​​SELECT​​ 语句。注意到在分别执行语句时,第一条 ​​SELECT​​ 语句返回 3 行,第二条 ​​SELECT​​ 语句返回 2 行。而在用 ​​UNION​​ 组合两条 ​​SELECT​​ 语句后,只返回 4 行而不是 5 行。

​UNION​​ 从查询结果集中自动去除了重复的行;换句话说,它的行为与一条 ​​SELECT​​ 语句中使用多个 ​​WHERE​​ 子句条件一样。因为 Indiana 州有一个 Fun4All 单位,所以两条 ​​SELECT​​ 语句都返回该行。使用 ​​UNION​​ 时,重复的行会被自动取消。

这是 ​​UNION​​ 的默认行为,如果愿意也可以改变它。事实上,如果想返回所有的匹配行,可使用 ​​UNION ALL​​ 而不是 ​​UNION​​。

请看下面的例子:

输入▼

SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI')
UNION ALL
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_name = 'Fun4All';


输出▼

cust_name       cust_contact         cust_email
----------- ------------- ------------
Village Toys John Smith sales@villagetoys.com
Fun4All Jim Jones jjones@fun4all.com
The Toy Store Kim Howard NULL
Fun4All Jim Jones jjones@fun4all.com
Fun4All Denise L. Stephens dstephens@fun4all.com


分析▼

使用 ​​UNION ALL​​,DBMS 不取消重复的行。因此,这里返回 5 行,其中有一行出现两次。

提示:UNION​WHERE​

这一部分一开始我们说过,​​UNION​​ 几乎总是完成与多个 ​​WHERE​​ 条件相同的工作。​​UNION ALL​​ 为 ​​UNION​​ 的一种形式,它完成 ​​WHERE​​ 子句完成不了的工作。如果确实需要每个条件的匹配行全部出现(包括重复行),就必须使用 ​​UNION ALL​​,而不是 ​​WHERE​​。

四、对组合查询结果排序

​SELECT​​ 语句的输出用 ​​ORDER BY​​ 子句排序。在用 ​​UNION​​ 组合查询时,只能使用一条 ORDER BY 子句,它必须位于最后一条 ​​SELECT​​ 语句之后。对于结果集,不存在用一种方式排序一部分,而又用另一种方式排序另一部分的情况,因此不允许使用多条 ​​ORDER BY​​ 子句。

下面的例子对前面 ​​UNION​​ 返回的结果进行排序:

输入▼

SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI')
UNION
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_name = 'Fun4All'
ORDER BY cust_name, cust_contact;


输出▼

cust_name       cust_contact         cust_email
----------- ------------- -------------
Fun4All Denise L. Stephens dstephens@fun4all.com
Fun4All Jim Jones jjones@fun4all.com
The Toy Store Kim Howard NULL
Village Toys John Smith sales@villagetoys.com


分析▼

这条 ​​UNION​​ 在最后一条 ​​SELECT​​ 语句后使用了 ​​ORDER BY​​ 子句。虽然 ​​ORDER BY​​ 子句似乎只是最后一条 ​​SELECT​​ 语句的组成部分,但实际上 DBMS 将用它来排序所有 ​​SELECT​​ 语句返回的所有结果。

说明:其他类型的 UNION

某些 DBMS 还支持另外两种 ​​UNION​​:EXCEPT(有时称为 MINUS)可用来检索只在第一个表中存在而在第二个表中不存在的行;而 INTERSECT 可用来检索两个表中都存在的行。实际上,这些 UNION 很少使用,因为相同的结果可利用联结得到。

 

提示:操作多个表

为了简单,本部分中的例子都是使用 ​​UNION​​ 来组合针对同一表的多个查询。实际上,​​UNION​​ 在需要组合多个表的数据时也很有用,即使是有不匹配列名的表,在这种情况下,可以将 ​​UNION​​ 与别名组合,检索一个结果集。