五、行子查询(ROW Subqueries)

  标量子查询返回单个值,列子查询返回一个列的多个值。而行子查询是子查询变体,它返回单个行,因此可以返回多个列值。

  可用于行子查询比较的操作符如下:

=  >  <  >=  <=  <>  !=  <=>

  以下是两个示例:

SELECT * FROM t1
  WHERE (col1,col2) = (SELECT col3, col4 FROM t2 WHERE id = 10);

SELECT * FROM t1
  WHERE ROW(col1,col2) = (SELECT col3, col4 FROM t2 WHERE id = 10);

  对于这两个查询,如果t2表中有一个id=10的行(仅有一个),则子查询返回这单个行。如果这行数据中的col3、col4两个列的列值与t1表中的任何行的col1、col2相等,则WHERE表达式返回TRUE。两个查询都t1表中的这些行。

  如果t2行col3和col4值不等于任何t1行的col1和col2值,则WHERE表达式为FALSE且查询返回空结果集。

因为一个行子查询最多只能返回一行

  有关每个运算符如何进行行比较的信息,see Section 12.3.2, “Comparison Functions and Operators”.

  

  表达式(1,2)和ROW(1,2)有时被称为行构造器。两者是等价的。行构造函数和行子查询返回的行必须包含相同数量的值。

行构造函数用于与返回两列或更多列的子查询进行比较(只返回一行数据)。当子查询返回单个列时,这被视为标量值而不是行,因此行构造函数不能与不返回至少两列的子查询一起使用。

  因此以下查询会失败并出现语法错误:

SELECT * FROM t1 WHERE ROW(1) = (SELECT column1 FROM t2)

  行构造函数在其他上下文中是合法的。例如,以下两个语句在语义上是等效的(并且由优化器以相同的方式处理):

SELECT * FROM t1 WHERE (column1,column2) = (1,1);
SELECT * FROM t1 WHERE column1 = 1 AND column2 = 1;

  以下查询回答请求,“查找表t1中也存在于表t2中的所有行”

SELECT column1,column2,column3
  FROM t1
  WHERE (column1,column2,column3) IN
         (SELECT column1,column2,column3 FROM t2);

  关于优化器和行构造器的更多信息,see Section 8.2.1.19, “Row Constructor Expression Optimization”。

 

六、具有EXISTS或NOT EXISTS的子查询

  If a subquery returns any rows at all, EXISTS subquery is TRUE, and NOT EXISTS subquery is FALSE.(如果一个子查询返回任何行,那么“EXISTS subquery 会返回TRUE,NOT EXISTS subquery返回FALSE”)

  如下:

SELECT column1 FROM t1 WHERE EXISTS (SELECT * FROM t2);

  传统上,EXISTS子查询以SELECT *开头,但它可以从SELECT 5或SELECT column1开始,或者任何东西。因为MySQL忽略了这样一个子查询中的SELECT列表,所以没有区别。

  之前的例子中,如果t2表中有任何数据行,哪怕是全为NULL值的一行数据,那么EXISTS条件判断也会为TRUE。这实际上是一个不太可能出现的例子,因为[NOT] EXISTS子查询几乎总是包含相关性。下面列出了更现实的例子:

  1、一个或多个城市有哪种类型的商店(找出在stores表和cities_stores都存在的
store_type)

SELECT DISTINCT store_type FROM stores
  WHERE EXISTS (SELECT * FROM cities_stores
                WHERE cities_stores.store_type = stores.store_type);

  2、所有的城市都没有的商店类型是哪种?(找出在stores表和cities_stores都不存在的
store_type)

SELECT DISTINCT store_type FROM stores
  WHERE NOT EXISTS (SELECT * FROM cities_stores
                    WHERE cities_stores.store_type = stores.store_type);

  3、所有城市都有的商店类型是哪种?

SELECT DISTINCT store_type FROM stores s1
  WHERE NOT EXISTS (
    SELECT * FROM cities WHERE NOT EXISTS (
      SELECT * FROM cities_stores
       WHERE cities_stores.city = cities.city
       AND cities_stores.store_type = stores.store_type));

  最后一个示例是双嵌套的NOT EXISTS查询。也就是说,它在NOT EXISTS子句中还有一个NOT EXISTS子句。在形式上,它回答了这样一个问题——一个城市是否存在在Stores表中不存在的商店?更简单的说法是:嵌套的NOT EXISTS回答了这样的问题——“is x TRUE for all y?”

 

七、相关子查询(Correlated Subqueries)

  相关子查询是这样一个子查询——在子查询中引用外接查询中的表。

  如下所示:

SELECT * FROM t1
  WHERE column1 = ANY (SELECT column1 FROM t2
                       WHERE t2.column2 = t1.column2);

  请注意,子查询包含对t1表中列的引用,即使子查询的FROM子句未提及表t1。MySQL会在子查询外部查找t1。

  假设t1表有这样一个行:column1=5,column2=6;

  同时,t2表包含这样一个行:column1=5,column2=7;

  此时,WHERE表达式“WHERE column1 = ANY(SELECT column1 FROM t2)”会返回TRUE。但在上面的例子中,子查询中的WHERE子句为FALSE,所以整个子句返回空集,而外部的WHERE表达式总为FALSE。

 

  范围规则:MySQL会从内到外对语句进行评估。

SELECT column1 FROM t1 AS x
  WHERE x.column1 = (SELECT column1 FROM t2 AS x
    WHERE x.column1 = (SELECT column1 FROM t3
      WHERE x.column2 = t3.column1));

  在这个语句中,x.column2必须是表t2中的一列,因为SELECT column1 FROM t2 AS x ...重命名t2。它不是表t1中的列,因为SELECT column1 FROM t1 ...是一个更远的外部查询。

  对于HAVING或ORDER BY子句中的子查询,MySQL还会在外部的SELECT列表中查找列名。

  

  在某些情况下,相关子查询会被优化掉。例如:

val IN (SELECT key_val FROM tbl_name WHERE correlated_condition)

  否则,它们效率低下并且可能很慢。将查询重写为连接可能会提高性能。

  

  相关子查询中的聚合函数可能包含外部引用,前提是该函数只包含外部引用,并且该函数不包含在另一个函数或表达式中。