一、拓扑排序(Topological Sorting)
1.定义
拓扑排序是一种图论算法,该算法在《数据结构与算法》一书中有涉猎。引用维基百科的定义:在图论中,由一个有向无环图的顶点组成的序列,当且仅当满足下列条件时,称为该图的一个拓扑排序(英语:Topological sorting)。
- 每个顶点出现且只出现一次;
- 若A在序列中排在B的前面,则在图中不存在从B到A的路径。
2.AOV网
一个较大的工程往往被划分成许多子工程,我们把这些子工程称作活动(activity)。在整个工程中,有些子工程(活动)必须在其它有关子工程完成之后才能开始,也就是说,一个子工程的开始是以它的所有前序子工程的结束为先决条件的,但有些子工程没有先决条件,可以安排在任何时间开始。为了形象地反映出整个工程中各个子工程(活动)之间的先后关系,可用一个有向图来表示,图中的顶点代表活动(子工程),图中的有向边代表活动的先后关系,即有向边的起点的活动是终点活动的前序活动,只有当起点活动完成之后,其终点活动才能进行。通常,我们把这种顶点表示活动、边表示活动间先后关系的有向图称做顶点活动网(Activity On Vertex network),简称AOV网。
3.举例说明
假定一个计算机专业的学生必须完成图3-4所列出的全部课程。在这里,课程代表活动,学习一门课程就表示进行一项活动,学习每门课程的先决条件是学完它的全部先修课程。如学习《数据结构》课程就必须安排在学完它的两门先修课程《离散数学》和《算法语言》之后。学习《高等数学》课程则可以随时安排,因为它是基础课程,没有先修课。若用AOV网来表示这种课程安排的先后关系,则如图3-5所示。图中的每个顶点代表一门课程,每条有向边代表起点对应的课程是终点对应课程的先修课。从图中可以清楚地看出各课程之间的先修和后续的关系。如课程C5的先修课为C2,后续课程为C4和C6。
4.AOV网的特点
AOV网是一个有向无环图,即不应该带有回路,因为若带有回路,会形成死循环。
在AOV网中,因为不存在回路,则所有活动可排列成一个线性序列,使得每个活动的所有前驱活动都排在该活动的前面,我们把此序列叫做拓扑序列(Topological order),由AOV网构造拓扑序列的过程叫做拓扑排序(Topological sort)。
AOV网的拓扑序列不是唯一的,满足上述定义的任一线性序列都称作它的拓扑序列。
二、如何进行拓扑排序
步骤如下:
- 从有向图中选择一个出度为0(即不依赖任何其它节点)的顶点并且输出它。
- 从图中删去该顶点,并且删去该顶点的所有边。
- 重复上述两步,直到剩余的图中没有出度为0的顶点。
三、拓扑排序的Java代码实现
实现方案比较多,主要是使用哪一类数据结构来记录图的信息,通常使用邻接表或者链式前向性,可以做到只遍历与该顶点相连的顶点,性能较好。
以Java为例,使用HashMap和Queue来实现:
1.将图中的所有节点全部记录到HashMap,入度为零的节点添加到zeroInQueue。
2.建立一个集合用来存放结果。
3.从zeroInQueue中弹出一个,遍历她的子节点。
4.将其子节点入度减一。
5.如果这个子节点的入度为零了,就将其放入到zeroInQueue中。
四、拓扑排序的实际应用
生活中的:选课、工程、流程。
编程中:接口和类的继承关系、Maven的依赖、项目源文件的顺序编译、方法的调用关系等。
我的微信公众号:架构真经(关注领取免费资源)