容错技术是保证系统在某些组成部分出现故障或差错时仍能正常工作的技术。
容错技术:单机容错技术、双机热备份技术和服务器集群技术。
系统的故障可分为两类:
一类是“致命的”,不可能自行修复.
另一类是局部的,可能被修复.
单机容错技术中,提高系统工作可靠性的方法主要有自检技术和冗余技术。 硬件容错、软件容错、整机容错
自检技术:自检指系统在发生非致命性故障时能自动发现故障和确定故障的性质、部位,并自动采
取措施更换和隔离产生故障的部件。
冗余技术:
冗余可分为硬件冗余(增加硬件)、软件冗余(增加程序,如同时采用不同算法或不同
人编制的程序)、时间冗余(如指令重复执行、程序重复执行)、信息冗余(如增加数据位)
等。冗余技术中最常用的两种方法是重复线路和备份线路。
双机热备份技术
双机热备份技术是一种软硬件结合的较高容错应用方案。该方案是由两台服务器系统和一个外接共享磁盘阵列柜和相应的双机热备份软件组成。
所谓“心跳”,指的是主、从系统之间相互按照一定的时间间隔发送通信信号,表明各自系统当前的运行状态。
双机热备份方案中,根据两台服务器的工作方式可以有三种不同的工作模式,即:双机热备模式、双机互备模式和双机双工模式。
双机热备模式即目前通常所说的 active/standby 方式, active 服务器处于工作状态;而
standby 服务器处于监控准备状态,服务器数据包括数据库数据同时往两台或多台服务器写
入(通常各服务器采用 RAID 磁盘阵列卡),保证数据的即时同步。
服务器集群技术集群技术指一组相互独立的服务器在网络中组合成为单一的系统工作,并以单一系统的
模式加以管理。