灾备系统是指在相隔较远的异地,建立两套或多套功能相同的 IT 系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界坏境对系统的影响,特别是灾难性事件对整个 IT 节点的影响,提供节点级别的系统恢复功能。

        搭建灾备系统步骤如下:

1、对生产系统进行分析,确定需要灾备的内容。下面是个灾备示例图:

灾备体系架构图 灾备系统建设_运维

 该图中:Web服务器、应用服务器、数据库都是需要同步的对象。由于系统文件存在七牛云,因此不需要同步,否则有文件服务器也需要同步。

2、搭建两边的初始环境:

2.1 两边的初始环境最好完全一致,包括:硬件一样、机器内部ip、系统版本及调整参数、中间件版本及调整参数(如nginx、tomcat、mysql等)、应用安装目录、使用目录及相关参数。通常从成本来说,灾备硬件参数会低于生产环境,此时按各自实际调整系统参数和中间件参数,机器内部ip、应用安装目录、使用目录及相关参数还是要保持一致。

2.2 数据库用自身的实时同步工具。

2.3 两边环境互通的带宽通常由同步的数据量来确定。

3、搭建web服务器、应用服务器自动同步功能,这样当应用服务器升级时,自动同步到灾备相关服务器上。 

4、检查灾备启用事项,主要考虑环境不一致可能导致问题,并确定对策。如内部ip不一致,web服务器连应用服务器、应用服务器连数据库就要把相关配置独立出来,预先配置好,在同步的时候避开这些配置文件。无论如何最好做两次次实战演练,一次是验证初始灾备系统能否正常使用;一次是模拟一次升级后灾备系统是否能正常使用。

5、编写灾备环境启用步骤,正常情况下只需重新配置DNS解析服务器指向灾备地址即可。