如今,由于信息化的不断发展,无论政府还是企业都面临着一个新的需求:如何保证应用对用户持续可用和关键数据的安全。对于IT部门来说,系统可靠性不足、数据发生不可恢复地损坏和丢失、计划性和非计划性停机都已成为共同面临的重大问题。

随着计算机应用的不断深入,企业对计算机系统的依赖程度也日渐增加。尤其在一些关键行业的关键应用上,应用的后台核心系统是否具有保护业务关键数据的完整和维持应用程序的高可用性的能力,已经成为影响一个公司业务成败的关键因素。在这些企业处理系统中所保存的关键业务数据一旦信息发生丢失或破坏,将带来灾难性的影响和损失。在资源有限的情况下,如何保证业务系统的高可用性和数据的安全,己成为众多用户关注的焦点问题。

随着企业越来越依赖于信息技术,由于系统停机而带来的损失也越拉越大。以往,企业用户在构建信息应用系统时只能在两种计算体系中进行选择,一是基于主机的计算体系,大体上采用的就是我们上面描述的分区方式;另一就是基于客户机/服务器的群集型计算体系。基于主机的计算体系具有良好的系统可伸缩性、可靠性和高性能,但它昂贵的价格迫使用户在系统建设之初就在硬件系统上投入巨大资源,而用户花费巨额资金购买的主机系统也许包含了不少并不需要的功能,造成资源浪费。基于客户机/服务器的群集型计算体系允许用户根据实际需要逐步增加硬件系统,但这种体系的系统毕竟不是真正意义上的集群,缺乏必要的可用性和可管理性,在应用升级和管理方面都需要用户付出巨大的代价,每增加一个服务器/客户端的连接就要同时增加两端的管理负担。因此,未来对计算速度、系统可靠性和成本实效性的要求必将促使发展另外的计算机模型来替代上述的计算模型。随着计算机网络的出现,一个新的具有更高性能/价格比的体系逐渐成为应用主流一分布式集群计算体系。当用户需要完成任何任务时,分布式集群计算提供了尽可能多的计算机处理能力和数据的透明访问能力,同时实现高性能与高可靠性的目标。

现在较为关注的高可用系统采用通用的计算机,通过对关键的软硬件部件进行冗余,结合有效的失效探测和恢复技术实现可靠的计算环境。在现有的应用中通常都是有几台主服务器他们用来处理用户的服务要求同时,还有几台备份服务器他们处于等待状态,如果某一台主服务器中出现故障,或者网络业务量突然增大需要更多的主服务器时备份服务器都可以在很短的时间内加入主服务器的组分担整个系统的负载。高可用技术可以分为故障诊断、故障屏蔽、功能转移等内容。故障诊断是指系统中能够正常工作的部分通过一定方法测试其他部分能否正常工作。故障隔离是指诊断出系统中一些部分己不能正常工作后将这些部分从系统中剔除出去。通常,如果系统的某些部分发生故障,并不总是能够通过剔除故障部分达到容错。只有在剔除了这些部分后系统剩余部分仍能正常工作,才可以使用这种方法实现容错。功能转移则是指诊断出系统中一些部分已不能正常工作后,将原本应由这些部分完成的工作自动转移到其他正常的部分上去。实际上,一些商用容错计算机是通过为系统的关键部件设置冗余备份、并在发生故障时通过自动功能隔离和自动功能转移使系统不间断地工作。

案例:

高可用性网络
   

1. 服务器   群集  【LB  HA  HP】 

 待续
2.路由设备   HSRP   VRRP

http://zhangzhenzz.blog.51cto.com/5117763/965212 

3.网络接口   bond

http://zhangzhenzz.blog.51cto.com/5117763/962767

4.链路  LAN  stp  rstp  mstp   聚合

http://zhangzhenzz.blog.51cto.com/5117763/965212

WAN

拓扑图

image

1.浮动静态路由

配置一条主链路,一条辅助链路!正常情况使用主链路,主链路出现故障,切换到辅助链路!

H3C

主线路s0-s0 采用ospf 默认度量值是10,辅助线路s1-s1 配置静态路由,默认度量值是60,无需调整,数据包默认值走s0-s0链路

R1 配置如下:

ospf enable

int s0 area 0

ospf enable

int e1 area 0

ospf enable

ip route 192.168.20.0 24 192.168.2.2

R2 配置如下:

ospf enable

int s0

ospf enable area 0

int e1

ospf enable area 0

ip route 192.168.10.0 24 192.168.2.1

CISCO

主线路s0-s0 采用ospf 默认度量值是110,辅助线路s1-s1 配置静态路由,默认度量值是1, 因此需要调整静态路由的度量值,使得数据包默认值走s0-s0链路.

R1 配置如下:

router ospf 10

network 192.168.1.0 0.0.0.255 area 0

network 192.168.10.0 0.0.0.255 area 0

exit

ip route 192.168.20.0 255.255.255.0 192.168.2.2 130

R2 配置如下:

router ospf 10

network 192.168.1.0 0.0.0.255 area 0

network 192.168.20.0 0.0.0.255 area 0

exit

ip route 192.168.10.0 255.255.255.0 192.168.2.1 130

测试

image

当链路S0-S0坏掉时。

image

image

2.备份链路

备份链路使用即两条链路性能差别不大,配置一条链路为active链路,另一条为standby链路!active链路出现故障,切换到standy链路!

H3C:

R1 配置如下:

ip route 192.168.20.0 24 192.168.1.2

ip route 192.168.20.0 24 192.168.2.2

int s0

standby int s1

standby time enable-delay 10 \\设置standby链路生效延时10s

standby time disable-delay 10 \\设置acitve链路失效延时10s

R2配置如下:

ip route 192.168.10.0 24 192.168.1.1

ip route 192.168.10.0 24 192.168.2.1

int s0

standby int s1

standby time enable-delay 10 \\设置standby链路生效延时10s

standby time disable-delay 10 \\设置acitve链路失效延时10s

image

因为链路延时10秒,当active链路失效时,会看到短暂的链路不通。

3. 链路捆绑

将性能较差的链路聚合为一条链路,即提高链路性能,有确保了相互备份!较前两中方法具有较大的优势! 需要聚合端口无需配置IP地址,聚合端口配置一IP地址!

H3C

R1 配置如下:

int virtual-template 1

ip add 192.168.3.1 24

int s0

ppp mp

ppp mp int virtual-template 1

int s1

ppp mp int virtual-template 1

ppp mp

R2 配置如下:

Int virtual-template 1

ip add 192.168.3.2 24

int s0

ppp mp int virtual-template 1

ppp mp

int s1

ppp mp int virtual-template 1

ppp mp


 

 

 

 

 

 

 

测试:

C:\Users\zhangzhen>ping 192.168.10.100 -t

正在 Ping 192.168.10.100 具有 32 字节的数据:
来自 192.168.10.100 的回复: 字节=32 时间=4ms TTL=62
来自 192.168.10.100 的回复: 字节=32 时间=3ms TTL=62
来自 192.168.10.100 的回复: 字节=32 时间=6ms TTL=62
来自 192.168.10.100 的回复: 字节=32 时间=2ms TTL=62
请求超时。
来自 192.168.10.100 的回复: 字节=32 时间=18ms TTL=62
来自 192.168.10.100 的回复: 字节=32 时间=5ms TTL=62
来自 192.168.10.100 的回复: 字节=32 时间=4ms TTL=62
来自 192.168.10.100 的回复: 字节=32 时间=2ms TTL=62
来自 192.168.10.100 的回复: 字节=32 时间=4ms TTL=62