多表查询概念
多表查询
常用连接方式
连接查询
二者的区别在于 内连接 ( INNER JOIN )所产生的数据集,需要保证连接的字段在连接的两张表中都存在。即所产生的结果是 两张表的子集
SELECT
外连接以「左外链接」( LEFT JOIN )为例。左外连接会显示所有在左表中存在的字段以及 右边连接字段在左表中有参照
SELECT
如何拆解查询
涉及到多张表的连接查询,问题的复杂度会直接上升,这时我们需要理清问题,进行逐步拆解。
以我本周学习的一个多表查询为例:「查询兴趣为英语口语的用户的 user_id、年龄、城市、上次跟进人和创建时间,只要最新数据」。
数据库中存放了四张表:
user -- 存放用户的基本信息
user_ city -- 存放客户的城市信息
user_agent -- 存放代理信息
user_record -- 存放用户的记录
根据题目我们需要做两个筛选:
1、兴趣:「英语口语」。通过 where 语句过滤。
2、只要每个用户的最新数据,需要在 user_record 中找出最新数据。对用户跟踪记录表先做一个筛选,可以通过 GROUP BY + MAX() 实现。
根据这两条我们可以开始写我们的 SQL 语句
SELECT
在代码中所有的连接都采用的「左连接」(LEFT JOIN),是为了在实际应用中保证主数据完整性,用户信息为主数据,用户跟踪信息、渠道信息都是附属数据(未在右连接表中匹配到的字段会自动填充为 NULL)。
总结
对于多表查询等复杂性的问题,我们需要先理清思路,将大问题或者综合问题拆解成小问题,逐一攻破。
1、对于多表查询我们需要先判断所需要连接的表有哪些。
2、写出多表查询的过滤条件,以外键链接主键(通常:左表链接字段为「外键」,右表链接字段为「主键」)。
3、对于必要的条件,先做子集筛选。例如给出的 SQL 查询中,对用户记录信息先筛选出最新记录子集。
4、保持良好的 SQL 语句格式,可以参照以下格式。
SELECT
注意:where 筛选要在 GROUP BY 前,分组后的筛选只能通过 HAVING 来实现。(这是新手时期常犯的错误,也是我现在常犯的错误)
欢迎在留言或者评论区指出错误或不足,希望和你一起进步。