纸上谈兵: 图 (graph)

  • 时间:
  • 浏览:0
  • 来源:幸运快3_快3充值_幸运快3充值

作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢!

图(graph)是有一种比较松散的数据价值形式。它有太少节点(vertice),在太少节点之间,由(edge)相连。节点的概念在树中也突然再次出现过,你们都歌词 歌词 歌词 通常在节点中储存数据。边表示一个多 多节点之间的存在关系。在树中,你们都歌词 歌词 歌词 用边来表示子节点和父节点的归属关系。树是有一种特殊的图,但限制性更强太少。

就是的有一种数据价值形式是很常见的。比如计算机网络,就是由太少节点(计算机不可能 路由器)以及节点之间的边(网线)构成的。城市的道路系统,也是由节点(路口)和边(道路)构成的图。地铁系统不都可不上里能 了理解为图,地铁站都可不上里能 了认为是节点。基于图有太少经典的算法,比如求图中一个多 多节点的最短路径,求最小伸展树等。

图的经典研究是柯尼斯堡七桥现象(Seven Bridges of Königsberg)。柯尼斯堡是现今的加里宁格勒,城市蕴藏三根河流过,河中一个多 多多小岛。有七座桥桥连接河的两岸和一个多 多小岛。送信员总想知道,有没一个多 多多妙招,能不重复的走过7个桥呢?

(太少现象在太少奥数教材中称为"一笔画"现象)

欧拉时代的柯尼斯堡地图

柯尼斯堡的都可不上里能 了看作由7个边和一个多 多节点构成的一个多 多图:

太少现象最终被欧拉巧妙的外理。七桥现象也启发了一门新的数学得科——图论(graph theory)的诞生。欧拉的基本思路是,不可能 某个节点都在起点不可能 终点,如此 连接它的边的数目都要为偶数个(从一个多 多桥进入,再从就是桥失去)。对于柯尼斯堡的七桥,不可能 一个多 多节点都为奇数个桥,而最多都可不里能 了一个多 多多节点为起点和终点,太少不不可能 一次走完。

图的定义

严格的说,图[$G = (V, E)$]是由节点的集合V和边的集合E构成的。一个多 多图的所有节点构成一个多 多集合[$V$]。一个多 多边都可不上里能 了表示为[$(v_1, v_2)$],其中[$v_1, v_2 \in V$],即一个多 多节点。不可能 [$(v_1, v_2)$]有序,即[$(v_1, v_2)$]与[$(v_2, v_1)$]不同,如此 图是有向的(directed)。有序的边都可不上里能 了理解为单行道,都可不里能 了沿一个多 多方向行进。不可能 [$(v_1, v_2)$]无序,如此 图是无向的(undirected)。无序的边都可不上里能 了理解成双向都都可不上里能 了行进的道路。一个多 多无序的边都可不上里能 了看作连接相同节点的一个多 多反向的有序边,太少无向图都可不上里能 了理解为有向图的有一种特殊情况报告。

(七桥现象中的图是无向的。城市中的公交线路都可不上里能 了是无向的,比如存在单向环线)

图的一个多 多路径(path)是图的一系列节点[$w_1, w_2, ..., w_n$],且对于[$1 \le i < n $],有[$ (w_i, w_{i+1}) \in E$]。也就是说,路径是一系列的边连接而成,路径的两端为一个多 多节点。路径上边的总数称为路径的长度。乘坐地铁时,你们都歌词 歌词 歌词 会在确定某个路径,来从A站到达B站。就是的路径不可能 有不止三根,你们都歌词 歌词 歌词 往往会根据路径的长度以及沿线的拥挤情况报告,来确定三根最佳的路线。不可能 存在三根长度大于0的路径,该路径的两端为同一节点,如此 认为该图中存在环路(cycle)。很明显,上海的地铁系统中存在环路。

 

找到三根环路

不可能 从每个节点,到任意一个多 多其它的节点,都在三根路径一段话,如此 图是连通的(connected)。对于一个多 多有向图来说,就是的连通称为强连通(strongly connected)。不可能 一个多 多有向图不满足强连通的条件,但将它的所有边都改为双向的,此时的无向图是连通的,如此 认为该有向图是弱连通(weakly connected)。

不可能 将有火车站的城市认为是节点,铁路是连接城市的边,就是的图不可能 是不连通的。比如北京和费城,北京有铁路通往上海,费城有铁路通往纽约,但北京和费城之间如此 路径相连。

图的实现

有一种简单的实现图的妙招是使用二维数组。让数组a的每一行为一个多 多节点,该行的不同元素表示该节点与太少节点的连接关系。不可能 [$(u, v) \in E$],如此 a[u][v]记为1,并且 为0。比如下面的一个多 多蕴藏一个多 多节点的图:

 

都可不上里能 了简单表示为

a 1 2 3
1 0 1 1
2 0 0 0
3 0 1 0

太少实现妙招所存在的空间为[$O(|V|^2)$],[$|V|$]为节点总数。所需内存随着节点增加而飞快增多。不可能 边都在很密集,如此 太少数组元素记为0,都可不里能 了稀疏的太少数组元素记为1,太少并都在很经济。

更经济的实现妙招是使用,即记录每个节点所有的相邻节点。对于节点m,你们都歌词 歌词 歌词 建立一个多 多链表。对于任意节点k,不可能 有[$(m, k) \in E$],就将该节点上上放对应节点m的链表中。邻接表是实现图的标准妙招。比如下面的图,

 

都可不上里能 了用如下的数据价值形式实现:

 

左侧为一个多 多数组,每个数组元素代表一个多 多节点,且指向一个多 多链表。该链表蕴藏高该数组元素所有的相邻元素。

总体上看,邻接表都可不上里能 了分为两次责。邻接表所存在的总空间为[$O(|V| + |E|)$]。数组次责储存节点信息,存在[$|V|$])的空间,即节点的总数。链表存储边的信息,存在[$|E|$]的空间,即边的总数。在太少冗杂的现象中,定点和边还不可能 有太少的附加信息,你们都歌词 歌词 歌词 都可不上里能 了将哪些附加信息储存在相应的节点不可能 边的位置。

下面为具体的C代码:

/* By Vamei */
#include <stdio.h>
#include <stdlib.h>

#define NUM_V 5

typedef struct node *position;

/* node */
struct node {
    int element;
    position next;
};

/* 
 * operations (stereotype)
 */
void insert_edge(position, int, int);
void print_graph(position graph, int nv);

/* for testing purpose */
void main()
{
    struct node graph[NUM_V];
    int i;

    // initialize the vertices
    for(i=1; i<NUM_V; i++) {
        (graph+i)->element = i;
        (graph+i)->next    = NULL;
    }

    // insert edges
    insert_edge(graph,1,2);
    insert_edge(graph,1,4);
    insert_edge(graph,3,2);
    insert_edge(graph,4,2);
    insert_edge(graph,4,3);

    print_graph(graph,NUM_V);
}

/* print the graph */
void print_graph(position graph, int nv) {
    int i;
    position p;
    for(i=1; i<nv; i++) {
        p = (graph + i)->next;
        printf("From %3d: ", i);
        while(p != NULL) {
            printf("%d->%d; ", i, p->element);
            p = p->next;
        }
        printf("\n");
    }
}

/*
 * insert an edge
 */
void insert_edge(position graph,int from, int to)
{
    position np;
    position nodeAddr;

    np = graph + from;

    nodeAddr = (position) malloc(sizeof(struct node));
    nodeAddr->element = to;
    nodeAddr->next    = np->next;
    np->next = nodeAddr;
}

运行结果:

From   1: 1->4; 1->2;

From   2:

From   3: 3->2;

From   4: 4->3; 4->2;

上边的实现主要基于链表,可参考纸上谈兵: 表 (list) 。

总结

图是有一种很简单的数据价值形式。图的组织妙招比较松散,自由度比较大,但也造成比较高的算法冗杂度。我将在事先介绍太少图的经典算法。

欢迎继续阅读“纸上谈兵: 算法与数据价值形式”系列