目录
join的执行顺序
经典例子
INNER/LEFT/RIGHT/FULL JOIN的区别
FULL JOIN
ON和WHERE的区别
join的执行顺序
以下是JOIN查询的通用结构:
SELECT <row_list>
FROM <left_table>
<inner|left|right> JOIN <right_table>
ON <join condition>
WHERE <where_condition>
它的执行顺序如下(SQL语句里第一个被执行的总是FROM子句):
FROM:对左右两张表执行笛卡尔积,产生第一张表vt1。行数为n*m(n为左表的行数,m为右表的行数)
ON:根据ON的条件逐行筛选vt1,将结果插入vt2中
JOIN:添加外部行,如果指定了LEFT JOIN(LEFT OUTER JOIN),则先遍历一遍左表的每一行,其中不在vt2的行会被插入到vt2,该行的剩余字段将被填充为NULL,形成vt3(既保证left的每一行都出现在vt3中);如果指定了RIGHT JOIN也是同理。但如果指定的是INNER JOIN,则不会添加外部行,上述插入过程被忽略,vt2=vt3(所以INNER JOIN的过滤条件放在ON或WHERE里 执行结果是没有区别的,下文会细说)
WHERE:对vt3进行条件过滤,满足条件的行被输出到vt4
SELECT:取出vt4的指定字段到vt5
经典例子
下面用一个例子介绍一下上述联表的过程
创建一个用户信息表:
CREATE TABLE `user_info` (
`userid` int(11) NOT NULL,
`name` varchar(255) NOT NULL,
UNIQUE `userid` (`userid`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4
再创建一个用户余额表:
CREATE TABLE `user_account` (
`userid` int(11) NOT NULL,
`money` bigint(20) NOT NULL,
UNIQUE `userid` (`userid`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4
随便导入一些数据:
select * from user_info;
+--------+------+
| userid | name |
+--------+------+
| 1001 | x |
| 1002 | y |
| 1003 | z |
| 1004 | a |
| 1005 | b |
| 1006 | c |
| 1007 | d |
| 1008 | e |
+--------+------+
8 rows in set (0.00 sec)
select * from user_account;
+--------+-------+
| userid | money |
+--------+-------+
| 1001 | 22 |
| 1002 | 30 |
| 1003 | 8 |
| 1009 | 11 |
+--------+-------+
4 rows in set (0.00 sec)
一共8个用户有用户名,4个用户的账户有余额。
取出userid为1003的用户姓名和余额,SQL如下:
SELECT i.name, a.money
FROM user_info as i
LEFT JOIN user_account as a
ON i.userid = a.userid
WHERE a.userid = 1003;
第一步:执行FROM子句对两张表进行笛卡尔积操作
笛卡尔积操作后会返回两张表中所有行的组合,左表userinfo有8行,右表useraccount有4行,生成的虚拟表vt1就是8*4=32行:
SELECT * FROM user_info as i LEFT JOIN user_account as a ON 1;
+--------+------+--------+-------+
| userid | name | userid | money |
+--------+------+--------+-------+
| 1001 | x | 1001 | 22 |
| 1002 | y | 1001 | 22 |
| 1003 | z | 1001 | 22 |
| 1004 | a | 1001 | 22 |
| 1005 | b | 1001 | 22 |
| 1006 | c | 1001 | 22 |
| 1007 | d | 1001 | 22 |
| 1008 | e | 1001 | 22 |
| 1001 | x | 1002 | 30 |
| 1002 | y | 1002 | 30 |
| 1003 | z | 1002 | 30 |
| 1004 | a | 1002 | 30 |
| 1005 | b | 1002 | 30 |
| 1006 | c | 1002 | 30 |
| 1007 | d | 1002 | 30 |
| 1008 | e | 1002 | 30 |
| 1001 | x | 1003 | 8 |
| 1002 | y | 1003 | 8 |
| 1003 | z | 1003 | 8 |
| 1004 | a | 1003 | 8 |
| 1005 | b | 1003 | 8 |
| 1006 | c | 1003 | 8 |
| 1007 | d | 1003 | 8 |
| 1008 | e | 1003 | 8 |
| 1001 | x | 1009 | 11 |
| 1002 | y | 1009 | 11 |
| 1003 | z | 1009 | 11 |
| 1004 | a | 1009 | 11 |
| 1005 | b | 1009 | 11 |
| 1006 | c | 1009 | 11 |
| 1007 | d | 1009 | 11 |
| 1008 | e | 1009 | 11 |
+--------+------+--------+-------+
32 rows in set (0.00 sec)
第二步:执行ON子句过滤掉不满足条件的行
ON i.userid = a.userid 过滤之后vt2如下:
+--------+------+--------+-------+
| userid | name | userid | money |
+--------+------+--------+-------+
| 1001 | x | 1001 | 22 |
| 1002 | y | 1002 | 30 |
| 1003 | z | 1003 | 8 |
+--------+------+--------+-------+
第三步:JOIN 添加外部行
LEFT JOIN会将左表未出现在vt2的行插入进vt2,每一行的剩余字段将被填充为NULL,RIGHT JOIN同理。
本例中用的是LEFT JOIN,所以会将左表user_info剩下的行都添上 生成表vt3:
+--------+------+--------+-------+
| userid | name | userid | money |
+--------+------+--------+-------+
| 1001 | x | 1001 | 22 |
| 1002 | y | 1002 | 30 |
| 1003 | z | 1003 | 8 |
| 1004 | a | NULL | NULL |
| 1005 | b | NULL | NULL |
| 1006 | c | NULL | NULL |
| 1007 | d | NULL | NULL |
| 1008 | e | NULL | NULL |
+--------+------+--------+-------+
第四步:WHERE条件过滤
WHERE a.userid = 1003 生成表vt4:
+--------+------+--------+-------+
| userid | name | userid | money |
+--------+------+--------+-------+
| 1003 | z | 1003 | 8 |
+--------+------+--------+-------+
第五步:SELECT
SELECT i.name, a.money 生成vt5:
+------+-------+
| name | money |
+------+-------+
| z | 8 |
+------+-------+
虚拟表vt5作为最终结果返回给客户端。
INNER/LEFT/RIGHT/FULL JOIN的区别
INNER JOIN...ON...: 返回 左右表互相匹配的所有行(因为只执行上文的第二步ON过滤,不执行第三步 添加外部行)
LEFT JOIN...ON...: 返回左表的所有行,若某些行在右表里没有相对应的匹配行,则将右表的列在新表中置为NULL
RIGHT JOIN...ON...: 返回右表的所有行,若某些行在左表里没有相对应的匹配行,则将左表的列在新表中置为NULL
INNER JOIN
拿上文的第三步添加外部行来举例,若LEFT JOIN替换成INNER JOIN,则会跳过这一步,生成的表vt3与vt2一模一样:
+--------+------+--------+-------+
| userid | name | userid | money |
+--------+------+--------+-------+
| 1001 | x | 1001 | 22 |
| 1002 | y | 1002 | 30 |
| 1003 | z | 1003 | 8 |
+--------+------+--------+-------+
RIGHT JOIN
若LEFT JOIN替换成RIGHT JOIN,则生成的表vt3如下:
+--------+------+--------+-------+
| userid | name | userid | money |
+--------+------+--------+-------+
| 1001 | x | 1001 | 22 |
| 1002 | y | 1002 | 30 |
| 1003 | z | 1003 | 8 |
| NULL | NULL | 1009 | 11 |
+--------+------+--------+-------+
因为useraccount(右表)里存在userid=1009这一行,而userinfo(左表)里却找不到这一行的记录,所以会在第三步插入以下一行:
| NULL | NULL | 1009 | 11 |
FULL JOIN
FULL JOIN,这在mysql里是不支持的,不过我们可以通过LEFT JOIN + UNION + RIGHT JOIN 来实现FULL JOIN:
SELECT *
FROM user_info as i
RIGHT JOIN user_account as a
ON a.userid=i.userid
union
SELECT *
FROM user_info as i
LEFT JOIN user_account as a
ON a.userid=i.userid;
他会返回如下结果:
+--------+------+--------+-------+
| userid | name | userid | money |
+--------+------+--------+-------+
| 1001 | x | 1001 | 22 |
| 1002 | y | 1002 | 30 |
| 1003 | z | 1003 | 8 |
| NULL | NULL | 1009 | 11 |
| 1004 | a | NULL | NULL |
| 1005 | b | NULL | NULL |
| 1006 | c | NULL | NULL |
| 1007 | d | NULL | NULL |
| 1008 | e | NULL | NULL |
+--------+------+--------+-------+
ps:其实我们从语义上就能看出LEFT JOIN和RIGHT JOIN没什么差别,两者的结果差异取决于左右表的放置顺序
ON和WHERE的区别
on是在过滤笛卡尔积时,进行的操作。
where是在on过滤完笛卡尔积,join对表进行补充后,对表进行过滤