数据表结构

id    name  parent_id
1        A        0
2        B        1
3        C        1
4        D        2
5        E        4
6        F        1
7        G        1

注:parent_id 为0表示顶级父节点,即A是顶级父辈,没有父节点

转储SQL表结构及数据

SET FOREIGN_KEY_CHECKS=0;
-- ----------------------------
-- Table structure for demo
-- ----------------------------
DROP TABLE IF EXISTS `demo`;
CREATE TABLE `demo` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(255) NOT NULL,
`parent_id` int(11) NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=8 DEFAULT CHARSET=utf8;
-- ----------------------------
-- Records of demo
-- ----------------------------
INSERT INTO `demo` VALUES ('1', 'A', '0');
INSERT INTO `demo` VALUES ('2', 'B', '1');
INSERT INTO `demo` VALUES ('3', 'C', '1');
INSERT INTO `demo` VALUES ('4', 'D', '2');
INSERT INTO `demo` VALUES ('5', 'E', '4');
INSERT INTO `demo` VALUES ('6', 'F', '1');
INSERT INTO `demo` VALUES ('7', 'G', '1');

需求:根据一个子ID,查询所有父类

SQL如下:
SELECT T2.id, T2.name
FROM (
SELECT
@r AS _id,
(SELECT @r := parent_id FROM demo WHERE id = _id) AS parent_id,
@l := @l + 1 AS lvl
FROM
(SELECT @r := 5, @l := 0) vars,
demo h
WHERE @r <> 0) T1
JOIN demo T2
ON T1._id = T2.id
ORDER BY T1.lvl DESC结果如下
id      name
1         A
2         B
4         D
5         E

分析过程(答疑过程)

我使用将SQL语句拆分的方式,并展示每句SQL运行结果,让各位可以看的更明白,以便于根据你自己的业务需求进行更改

1、先不管T2,先把T1的SQL抽出来看
SELECT
@r AS _id,
(SELECT @r := parent_id FROM demo WHERE id = _id) AS parent_id,
@l := @l + 1 AS lvl
FROM
(SELECT @r := 5, @l := 0) vars,
demo h
WHERE @r <> 0
运行结果


从这里可以看出,其实T1已经找出ID为5节点的所有父节点了,和T2(即demo表)进行左连接,只不过是为了根据Id获取Name而已。而且还可以看出@l其实在整个SQL中并没有什么作用,只是用来标识节点的等级,底级子节点的lvl为1,父节点lvl值越大表示越靠近顶级父节点,想象一下树结构,你就明白了

2、

这里看出,其实@r,@l 就是一个变量而已,

搞明白@r := 5
SELECT @r := 5, @l := 0
运行结果

作为变量自然你可以随便起名,当然也可以随便赋值,改成@a,@b也都是可以的

那这句SQL的意思就出来了,它表示给变量@r赋值,值为5,给@l赋值,值为0

因此,其实整个SQL的意思也明了了就是根据子ID5,查询所有父类

3、搞懂变量@r 值如何变化

@r AS _id,
(SELECT @r := parent_id FROM demo WHERE id = _id) AS parent_id
根据MYSQL执行顺序(在文章末尾处),SQL语句在执行时会先执行From,即会先执行上一步的赋值操作,因此这里的_id值为5,所以上面的SQL等同于如下SQLSELECT @r := parent_id FROM demo WHERE id = 5

运行结果


这句SQL肯定没人不会,但是有一个点很重要,它是整个执行过程的核心,就是@r := parent_id,它在查询Id为5的节点的父Id时,把这个父Id同时赋给了变量@r。因此@r值改变了,它从5变为了4。

这个时候思路就很清晰了,只要我们设置限制条件,让SQL在@r为0的时候结束循环就OK了

4、<>符号的含义

WHERE @r <> 0

这个就没什么好说的了,<>符号在MYSQL中表示不等于,这就是我们在第四步中所说的限制条件,它限制了@r这个变量不能等于0。所以当@r不等于0时,SQL语句会根据子ID向上查询父ID,又把父ID当做子ID赋值给@r,再次向上查询,直至@r变量的值为0为止。

补充:如果业务不需要,可以完全可以去掉@l变量
SELECT ,
@a AS _id,
(SELECT @a := parent_id FROM demo WHERE id = _id) AS parent_id
FROM
(SELECT @a := 5) vars,
demo h
WHERE @a <> 0

运行结果


可以看出@l其实在整个SQL中并没有什么作用,只是用来标识节点的等级,这也证实了我们上述第一步的关于@l的解释

因为这个过程很类似于JAVA通过构造树结构向上递归查询的方式,所以这个SQL形式被很多人叫做MYSQL递归查询

文章结尾关于MYSQL的查询顺序
FROM
ON
JOIN
WHERE
GROUP By
CUBE|ROllUP
HAVING
SELECT
DISTINCT
ORDER BY
LIMIT

最先执行的是FROM操作,最后执行的是LIMIT操作。每个操作都会产生一个虚拟表,该虚拟表作为一个处理的输入