一、图的存储结构
1.1 邻接矩阵
图的邻接矩阵存储方式是用两个数组来表示图。一个一维数组存储图中顶点信息,一个二维数组(邻接矩阵)存储图中的边或弧的信息。
设图G有n个顶点,则邻接矩阵是一个n*n的方阵,定义为:
看一个实例,下图左就是一个无向图。
从上面可以看出,无向图的边数组是一个对称矩阵。所谓对称矩阵就是n阶矩阵的元满足aij = aji。即从矩阵的左上角到右下角的主对角线为轴,右上角的元和左下角相对应的元全都是相等的。
从这个矩阵中,很容易知道图中的信息。
(1)要判断任意两顶点是否有边无边就很容易了;
(2)要知道某个顶点的度,其实就是这个顶点vi在邻接矩阵中第i行或(第i列)的元素之和;
(3)求顶点vi的所有邻接点就是将矩阵中第i行元素扫描一遍,arc[i][j]为1就是邻接点;
而有向图讲究入度和出度,顶点vi的入度为1,正好是第i列各数之和。顶点vi的出度为2,即第i行的各数之和。
若图G是网图,有n个顶点,则邻接矩阵是一个n*n的方阵,定义为:
这里的wij表示(vi,vj)上的权值。无穷大表示一个计算机允许的、大于所有边上权值的值,也就是一个不可能的极限值。下面左图就是一个有向网图,右图就是它的邻接矩阵。
那么邻接矩阵是如何实现图的创建的呢?代码如下。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 | #include <stdio.h> #include <stdlib.h> #include <curses.h> typedef char VertexType; typedef int EdgeType; #define MAXVEX 100 //最大顶点数,应由用户定义 #define INFINITY 65535 //用65535来代表无穷大 #define DEBUG typedef struct { VertexType vexs[MAXVEX]; EdgeType arc[MAXVEX][MAXVEX]; int numVertexes, numEdges; }Graph; int locates(Graph *g, char ch) { int i = 0; for (i = 0; i < g->numVertexes; i++) { if (g->vexs[i] == ch) { break ; } } if (i >= g->numVertexes) { return -1; } return i; } void CreateGraph(Graph *g) { int i, j, k, w; printf ( "输入顶点数和边数:\n" ); scanf ( "%d,%d" , &(g->numVertexes), &(g->numEdges)); #ifdef DEBUG printf ( "%d %d\n" , g->numVertexes, g->numEdges); #endif for (i = 0; i < g->numVertexes; i++) { g->vexs[i] = getchar (); while (g->vexs[i] == '\n' ) { g->vexs[i] = getchar (); } } #ifdef DEBUG for (i = 0; i < g->numVertexes; i++) { printf ( "%c " , g->vexs[i]); } printf ( "\n" ); #endif for (i = 0; i < g->numEdges; i++) { for (j = 0; j < g->numEdges; j++) { g->arc[i][j] = INFINITY; } } for (k = 0; k < g->numEdges; k++) { char p, q; printf ( "输入边(vi,vj)上的下标i,下标j和权值:\n" ); p = getchar (); while (p == '\n' ) { p = getchar (); } q = getchar (); while (q == '\n' ) { q = getchar (); } scanf ( "%d" , &w); int m = -1; int n = -1; m = locates(g, p); n = locates(g, q); if (n == -1 || m == -1) { fprintf (stderr, "there is no this vertex.\n" ); return ; } g->arc[m][n] = w; g->arc[n][m] = g->arc[m][n]; } } void printGraph(Graph g) { int i, j; for (i = 0; i < g.numVertexes; i++) { for (j = 0; j < g.numVertexes; j++) { printf ( "%d " , g.arc[i][j]); } printf ( "\n" ); } } int main( int argc, char **argv) { Graph g; CreateGraph(&g); printGraph(g); return 0; } </curses.h></stdlib.h></stdio.h> |
从代码中可以得到,n个顶点和e条边的无向网图的创建,时间复杂度为O(n + n2 + e),其中对邻接矩阵Grc的初始化耗费了O(n2)的时间。
1.2 邻接表
邻接矩阵是不错的一种图存储结构,但是,对于边数相对顶点较少的图,这种结构存在对存储空间的极大浪费。因此,找到一种数组与链表相结合的存储方法称为邻接表。
邻接表的处理方法是这样的:
(1)图中顶点用一个一维数组存储,当然,顶点也可以用单链表来存储,不过,数组可以较容易的读取顶点的信息,更加方便。
(2)图中每个顶点vi的所有邻接点构成一个线性表,由于邻接点的个数不定,所以,用单链表存储,无向图称为顶点vi的边表,有向图则称为顶点vi作为弧尾的出边表。
例如,下图就是一个无向图的邻接表的结构。
从图中可以看出,顶点表的各个结点由data和firstedge两个域表示,data是数据域,存储顶点的信息,firstedge是指针域,指向边表的第一个结点,即此顶点的第一个邻接点。边表结点由adjvex和next两个域组成。adjvex是邻接点域,存储某顶点的邻接点在顶点表中的下标,next则存储指向边表中下一个结点的指针。
对于带权值的网图,可以在边表结点定义中再增加一个weight的数据域,存储权值信息即可。如下图所示。
对于邻接表结构,图的建立代码如下。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 | #include <stdio.h> #include<stdlib.h> #define DEBUG #define MAXVEX 1000 //最大顶点数 typedef char VertexType; typedef int EdgeType; typedef struct EdgeNode { int adjvex; EdgeType weigth; struct EdgeNode *next; }EdgeNode; typedef struct VertexNode { VertexType data; EdgeNode *firstedge; }VertexNode, AdjList[MAXVEX]; typedef struct { AdjList adjList; int numVertexes, numEdges; }GraphList; int Locate(GraphList *g, char ch) { int i; for (i = 0; i < MAXVEX; i++) { if (ch == g->adjList[i].data) { break ; } } if (i >= MAXVEX) { fprintf (stderr, "there is no vertex.\n" ); return -1; } return i; } void CreateGraph(GraphList *g) { int i, j, k; EdgeNode *e; EdgeNode *f; printf ( "输入顶点数和边数:\n" ); scanf ( "%d,%d" , &g->numVertexes, &g->numEdges); #ifdef DEBUG printf ( "%d,%d\n" , g->numVertexes, g->numEdges); #endif for (i = 0; i < g->numVertexes; i++) { printf ( "请输入顶点%d:\n" , i); g->adjList[i].data = getchar (); g->adjList[i].firstedge = NULL; while (g->adjList[i].data == '\n' ) { g->adjList[i].data = getchar (); } } for (k = 0; k < g->numEdges; k++) { printf ( "输入边(vi,vj)上的顶点序号:\n" ); char p, q; p = getchar (); while (p == '\n' ) { p = getchar (); } q = getchar (); while (q == '\n' ) { q = getchar (); } int m, n; m = Locate(g, p); n = Locate(g, q); if (m == -1 || n == -1) { return ; } #ifdef DEBUG printf ( "p = %c\n" , p); printf ( "q = %c\n" , q); printf ( "m = %d\n" , m); printf ( "n = %d\n" , n); #endif e = (EdgeNode *) malloc ( sizeof (EdgeNode)); if (e == NULL) { fprintf (stderr, "malloc() error.\n" ); return ; } e->adjvex = n; e->next = g->adjList[m].firstedge; g->adjList[m].firstedge = e; f = (EdgeNode *) malloc ( sizeof (EdgeNode)); if (f == NULL) { fprintf (stderr, "malloc() error.\n" ); return ; } f->adjvex = m; f->next = g->adjList[n].firstedge; g->adjList[n].firstedge = f; } } void printGraph(GraphList *g) { int i = 0; #ifdef DEBUG printf ( "printGraph() start.\n" ); #endif while (g->adjList[i].firstedge != NULL && i < MAXVEX) { printf ( "顶点:%c " , g->adjList[i].data); EdgeNode *e = NULL; e = g->adjList[i].firstedge; while (e != NULL) { printf ( "%d " , e->adjvex); e = e->next; } i++; printf ( "\n" ); } } int main( int argc, char **argv) { GraphList g; CreateGraph(&g); printGraph(&g); return 0; } </stdlib.h></stdio.h> |
对于无向图,一条边对应都是两个顶点,所以,在循环中,一次就针对i和j分布进行插入。
本算法的时间复杂度,对于n个顶点e条边来说,很容易得出是O(n+e)。
1.3 十字链表
对于有向图来说,邻接表是有缺陷的。关心了出度问题,想了解入度就必须要遍历整个图才知道,反之,逆邻接表解决了入度却不了解出度情况。下面介绍的这种有向图的存储方法:十字链表,就是把邻接表和逆邻接表结合起来的。
重新定义顶点表结点结构,如下所示。
其中firstin表示入边表头指针,指向该顶点的入边表中第一个结点,firstout表示出边表头指针,指向该顶点的出边表中的第一个结点。
重新定义边表结构,如下所示。
其中,tailvex是指弧起点在顶点表的下表,headvex是指弧终点在顶点表的下标,headlink是指入边表指针域,指向终点相同的下一条边,taillink是指边表指针域,指向起点相同的下一条边。如果是网,还可以增加一个weight域来存储权值。
比如下图,顶点依然是存入一个一维数组,实线箭头指针的图示完全与邻接表相同。就以顶点v0来说,firstout指向的是出边表中的第一个结点v3。所以,v0边表结点hearvex = 3,而tailvex其实就是当前顶点v0的下标0,由于v0只有一个出边顶点,所有headlink和taillink都是空的。
重点需要解释虚线箭头的含义。它其实就是此图的逆邻接表的表示。对于v0来说,它有两个顶点v1和v2的入边。因此的firstin指向顶点v1的边表结点中headvex为0的结点,如上图圆圈1。接着由入边结点的headlink指向下一个入边顶点v2,如上图圆圈2。对于顶点v1,它有一个入边顶点v2,所以它的firstin指向顶点v2的边表结点中headvex为1的结点,如上图圆圈3。
十字链表的好处就是因为把邻接表和逆邻接表整合在一起,这样既容易找到以v为尾的弧,也容易找到以v为头的弧,因而比较容易求得顶点的出度和入度。
而且除了结构复杂一点外,其实创建图算法的时间复杂度是和邻接表相同的,因此,在有向图应用中,十字链表是非常好的数据结构模型。
这里就介绍以上三种存储结构,除了第三种存储结构外,其他的两种存储结构比较简单。
二、图的遍历
图的遍历和树的遍历类似,希望从图中某一顶点出发访遍图中其余顶点,且使每一个顶点仅被访问一次,这一过程就叫图的遍历。
对于图的遍历来说,如何避免因回路陷入死循环,就需要科学地设计遍历方案,通过有两种遍历次序方案:深度优先遍历和广度优先遍历。
2.1 深度优先遍历
深度优先遍历,也有称为深度优先搜索,简称DFS。其实,就像是一棵树的前序遍历。
它从图中某个结点v出发,访问此顶点,然后从v的未被访问的邻接点出发深度优先遍历图,直至图中所有和v有路径相通的顶点都被访问到。若图中尚有顶点未被访问,则另选图中一个未曾被访问的顶点作起始点,重复上述过程,直至图中的所有顶点都被访问到为止。
我们用邻接矩阵的方式,则代码如下所示。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 | #define MAXVEX 100 //最大顶点数 typedef int Boolean; Boolean visited[MAXVEX]; #define TRUE 1 #define FALSE 0 void DFS(Graph g, int i) { int j; visited[i] = TRUE; printf ( "%c " , g.vexs[i]); for (j = 0; j < g.numVertexes; j++) { if (g.arc[i][j] == 1 && !visited[j]) { DFS(g, j); } } } void DFSTraverse(Graph g) { int i; for (i = 0; i < g.numVertexes; i++) { visited[i] = FALSE; } for (i = 0; i < g.numVertexes; i++) { if (!visited[i]) { DFS(g,i); } } } |
如果使用的是邻接表存储结构,其DFSTraverse函数的代码几乎是相同的,只是在递归函数中因为将数组换成了链表而有不同,代码如下。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 | void DFS(GraphList g, int i) { EdgeNode *p; visited[i] = TRUE; printf ( "%c " , g->adjList[i].data); p = g->adjList[i].firstedge; while (p) { if (!visited[p->adjvex]) { DFS(g, p->adjvex); } p = p->next; } } void DFSTraverse(GraphList g) { int i; for (i = 0; i < g.numVertexes; i++) { visited[i] = FALSE; } for (i = 0; i < g.numVertexes; i++) { if (!visited[i]) { DFS(g, i); } } } |
对比两个不同的存储结构的深度优先遍历算法,对于n个顶点e条边的图来说,邻接矩阵由于是二维数组,要查找某个顶点的邻接点需要访问矩阵中的所有元素,因为需要O(n2)的时间。而邻接表做存储结构时,找邻接点所需的时间取决于顶点和边的数量,所以是O(n+e)。显然对于点多边少的稀疏图来说,邻接表结构使得算法在时间效率上大大提高。
2.2 广度优先遍历
广度优先遍历,又称为广度优先搜索,简称BFS。图的广度优先遍历就类似于树的层序遍历了。
邻接矩阵做存储结构时,广度优先搜索的代码如下。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 | void BFSTraverse(Graph g) { int i, j; Queue q; for (i = 0; i < g.numVertexes; i++) { visited[i] = FALSE; } InitQueue(&q); for (i = 0; i < g.numVertexes; i++) { if (!visited[i]) { visited[i] = TRUE; printf ( "%c " , g.vexs[i]); EnQueue(&q, i); while (!QueueEmpty(q)) { int m; DeQueue(&q, &m); for (j = 0; j < g.numVertexes; j++) { if (g.arc[m][j] == 1 && !visited[j]) { visited[j] = TRUE; printf ( "%c " , g.vexs[j]); EnQueue(&q, j); } } } } } } <span style= 'line-height: 2; font-family: "sans serif", tahoma, verdana, helvetica;' > </span> |
对于邻接表的广度优先遍历,代码与邻接矩阵差异不大, 代码如下。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 | void BFSTraverse(GraphList g) { int i; EdgeNode *p; Queue q; for (i = 0; i < g.numVertexes; i++) { visited[i] = FALSE; } InitQueue(&q); for (i = 0; i < g.numVertexes; i++) { if (!visited[i]) { visited[i] = TRUE; printf ( "%c " , g.adjList[i].data); EnQueue(&q, i); while (!QueueEmpty(q)) { int m; DeQueue(&q, &m); p = g.adjList[m].firstedge; 找到当前顶点边表链表头指针 while (p) { if (!visited[p->adjvex]) { visited[p->adjvex] = TRUE; printf ( "%c " , g.adjList[p->adjvex].data); EnQueue(&q, p->adjvex); } p = p->next; } } } } }<span style= 'line-height: 1.5; font-family: "sans serif", tahoma, verdana, helvetica;' > </span> |
对比图的深度优先遍历与广度优先遍历算法,会发现,它们在时间复杂度上是一样的,不同之处仅仅在于对顶点的访问顺序不同。可见两者在全图遍历上是没有优劣之分的,只是不同的情况选择不同的算法。