1.方案综述

Oracle Fail Safe 是架构在 Microsoft Cluster ServerMSCS)上的一个 Oracle 产品,为Oracle 的一些产品(数据库、Oracle Application Server 等)提供高可用性。提供数据、应用程序在出现故障的情况下,将Oracle数据库自动转换到另一个激活的系统上,保证系统的高可用性。

2.群集服务器安装核对清单

2.1硬件配置

· 两台联想万全T350服务器,每台机器具体配置如下:
CPU
两颗CPU: Xeon 1.8G/512K
内存
1G
硬盘
3块硬盘,每块18G
RAID
单通道
网卡
每台服务器都有两块Intel 82550网卡
单模组,不需要冗余电源
· 一台SCSI Ultra 160磁盘柜

2.2软件配置

·  Windows2000中文版(集群中所有机器上进行安装)
· MSCS群集软件(集群中所有机器上进行安装)
·  Oracle8.1.6 或者 Oracle9.0.1.0.1 (集群中所有机器上进行安装)
· Oracle FailSafe (集群中所有机器上进行安装)
· GAM5.0

2.3 硬件环境

硬件环境配置如下:
 
这是一个两节点群集,每台服务器有两块网卡,一块作为内部连接,用于服务器之间的心跳线和数据镜像传输;一块连接到外部网上。

3.安装使用指南

3.1 安装 Windows2000(两台及其均安装)

1 相关参数配置参见下表: 1 群集安装实验参数表
 
节点1
节点2
服务器名
NS1
NS2
公用网络IP1
192.168.34.1
192.168.34.2
公用网络子网掩码
255.255.255.0
255.255.255.0
专用网络IP
192.168.33.1
192.168.33.2
专用网络子网掩码
255.255.255.0
255.255.255.0
集群虚拟IP
192.168.34.3
集群虚拟名
Fscluster
FailSafe数据库虚拟IP
192.168.34.3
集群虚拟IP子网掩码
255.255.255.0
 
2ping所有IP地址以确保连接正确。

3.2 安装GAM5.0磁盘管理软件

1.  Windows中添加一个具有administrator权限的用户gamroot
2.  在其中在其中一台机器上安装磁盘管理软件GAM5.0
3.  利用GAM管理工具对磁盘进行划分,此处划分为E: F:G:。
关于GAM的使用方法详细参见相应文档。

3.3 安装MSCS

打开主服务器,关闭从服务器。在主服务器上安装MSCS。安装成功后,保证在主服务器开启的情况下,在从服务器上安装MSCS
详细安装参见相关文档。
安装成功后测试,保证MSCS安装成功。

3.4 安装Oracle

在主服务器上安装Oracle,选择自定义安装,安装过程不创建数据库,安装结束重新启动主服务器;
在从服务器上安装Oracle,选择自定义安装,安装过程不创建数据库,安装结束重新启动从服务器。

3.5创建数据库

在主服务器上创建要添加到集群中的数据库。注意 Control 文件、redo log files data files 必须创建在磁盘柜的共享分区上;初始化参数文件也要放在磁盘柜上,如果是Oracle9.0.1.0.1, 选择不生成永久初始化文件,安装结束后,将初始化文件放入共享磁盘柜中,然后在注册表中修改,将HKEY_LOCAL_MACHINE | SOFTWARE | Oracle| HOME0| ORA_HA1TEST_PFILE,修改为在磁盘柜上的目录,例如I:\initha1test.ora

3.6 安装FailSafe

在主服务器上安装FailSafe3.2,安装完重新启动主服务器;
再在从服务器上安装FailSafe3.2,安装完重新启动从服务器。
注:在安装完 fail safe 后,Windows 2000 中的群集管理器中 群集配置 –〉 资源类型 –〉 下会出现两个资源类型:Oracle Database Oracle TNS Listener,两者使用的资源 DLL 都是 FsResOdbs.dll

3.7修改hosts文件

在两台机器上修改文件c:\winnt\system32\drivers\etc\hosts 如下:
192.168.34.1     ns1  (节点1的外部连接)
192.168.34.2    ns2  (节点2的外部连接)
192.168.33.1    san1   (节点1的内部连接)
192.168.33.2    san2   (节点2的内部连接)
192.168.34.3     fsclusterMSCS Cluster 的别名,也就是虚拟 IP的别名)
192.168.34.4    ha1test     Oracle 集群使用的 IP 和网络名称)

3.8 集群配置

1、  打开 Oracle Fail Safe Manager
Start -> Programs -> OraHome91> -> Oracle Fail Safe Manager
打开后出现 Add Cluster to Tree 对话框,在该对话框里输入 CLUSTER 名称,会
提示输入在域里有管理权限的用户名和密码;输入后会出现 Verify Cluster 对话
框,对该集群各项资源进行有效性验证;
2、  在每台节点机上检查是否有服务 OracleMSCSServices并启动该服务;
3、  在每台节点机上启动集群管理器(启动 -> 程序 -> 管理工具 -> 集群管理器),在 Cluster Group 检查是否有 Oracle Services for MSCS 这一项;并检查 Resource Types 中是否有 Oracle Database Oracle TNS Listener
4、  Oracle Fail Safe Manager 中的Groups 菜单里选择 Create;打开 Create Group Wizard 后可以设置 failover failback 策略,并自动打开 Add Resource to Group Wizard 可以向组添加virtual address(选择Resources,然后Add to Group)。
首先选择菜单:
出现界面,输入组名:
点击下一步,选择是否failback
点击下一步,选择优先级别:
按完成结束组的创建。
5、  Troubleshooting 菜单上选择 Verify Standalone Database 验证 Oracle数据库以及 Oracle Net 配置,该命令确认 Oracle Fail Safe 可以访问数据库,并且 standlone 数据库位于共享分区上;
6、  Resources 菜单上选择 Add to Group,然后选择 Oracle Database打开 Add Resource to Group Wizard,该向导用来将 single-instance Oracle database server 配置为基于 MSCS 的高可用性数据库服务器;
选择菜单:
出现界面,选择OracleDatabase:
出现配置集群界面:
安装成功后,出现如下图提示,则安装成功完成。
安装成功后,关于数据库在注册表中的配置,从服务器上的注册表将会自动和主服务器同步。
注:在 FailSafe 里添加组 grptest 并将数据库群集添加后,在群集管理器里也增加了该组,组包含的内容有:IP Address 192.168.34.4Network Name fsclusterDisk E:FOracleOraHome81TNSListenerFslfscluster HA1TEST.mjlab.com(数据库实例名)

3.10测试

1)        手工切换主从机
从主机切换到从机,切换时间为50秒,应用程序略有停滞感,切换成功后应用恢复正常。
2)        非正常关机
非正常关掉主服务器,可以正常切换,切换时间为57秒,应用程序略有停滞,切换成功后应用恢复正常。
3)        拔掉主机应用网线
拔掉主机应用网线之后,可以正常切换,切换时间为50秒,应用程序略有停滞感,切换成功后应用恢复正常。