oracle集群包含2个重要的组成部分:voting disk和ocr。voting disk是一个文件管理各节点的成员的信息,ocr是管理集群和rac数据库配置信息的文件。下面描述怎么管理这2个文件。
在rac中管理voting disks
oracle建议你在安装的时候配置多个voting disks,在安装完后,使用下面的步骤来备份和恢复他们。
备份voting disks
dd if=voting_disk_name of=backup_file_name
voting_disk_name是活动的voting disk名字,backup_file_name是备份文件的名字
恢复voting disks
dd if=bakcup_file_name of=voting_disk_name
如果有多个voting disks,那么你可以移除他们,然后在添加回来使用crsctl delete css votedisk path 和crsctl add css votediskpath命令。path是voting disk存放的完全路径。以root身份执行
管理rac中的ocr
ocr包含了集群节点列表,实例与节点的映射关系,还有集群资源概要。
添加,替换,修复和移除ocr
在安装的过程中,oracle给了个选项,可以镜像ocr,这个功能创建了第二个ocr,可以放置镜像ocr到oracle的共享裸设备的集群文件系统盘,或是共享裸逻辑卷。
可以再下面的情况手工镜像ocr:
1升级到了10.2但是在升级的过程中没有选择镜像ocr
2在安装的过程中只是创建了1个ocr
添加ocr
如果你已经镜像了ocr,那么不需要在添加ocr,oracle自动管理2个ocr,rac环境不建议超过2个ocr。
root用户使用下面的命令来添加ocr
ocrconfig -replace ocr destination_file or disk
使用下面的命令来添加ocr镜像
ocrconfig -replace ocrmirror destination_file or disk
替换ocr
1确认不需要替换的ocr是在线的
2确认你要操作的节点上的oracle集群是在运行的
3root运行下面的命令来替换ocr
ocrconfig -replace ocr destination_file or disk
运行下面的命令来替换ocr镜像
ocrconfig -replace ocrmirror destination_file or disk
4如果rac的一个节点停了,那么在停掉的节点上运行ocrconfig -repair来确保在节点重启后能重新添加到集群。
For example, if the OCR mirror device name is /dev/raw1, then use the command syntax ocrconfig -repair ocrmirror /dev/raw1 on this node to repair its OCR configuration.
删除ocr
为了移除一个ocr,至少有1个ocr是在线的。可以移除ocr来减少ocr相关的损耗,或是停止镜像你的ocr因为你移动ocr到一个冗余的存储上了。执行下面的命令来移除ocr:
1确保至少1个ocr在线
2运行下面的命令来移除ocr
ocrconfig -replace ocr
下面的命令式移除备份ocr
ocrconfig -replace ocrmirror
这个命令会更新所有oracle集群运行的节点上的配置。如果你移除主ocr,那么备份的ocr变成主ocr。
管理备份和使用备份来恢复ocr
这部分描述2个方法来拷贝ocr内容使用它们来恢复,第一个方法使用自动产生ocr文件拷贝,第二个方法使用手工创建ocr导出文件。
oracle集群每4个小时自动创建ocr备份,任意的时候,oracle总是保持至少3个备份拷贝,crsd进程每天和每周最后创建备份和维护ocr备份。你不能定制备份的频率,你可以使用任意的备份软件来拷贝主ocr到别的设备上。
在unix系统上生成的备份目录是CRS_home/cdata/cluster_name。
使用自动ocr备份来还原ocr
运行ocrcheck来检查,如果返回错误信息,那么主ocr和镜像ocr都损坏了,按下面的步骤来恢复
在unix系统上恢复ocr
1使用ocrconfig -showbackup命令来显示ocr备份,使用ocrdump -backupfile file_name来查看内容file_name是备份文件名字
2在所有的节点上停止集群软件 init.crs stop
3用下面的命令来还原ocr   ocrconfig -restore file_name file_name是你要还原的ocr名字
4重启集群 init.crs start
5使用下面的命令查看ocr一致性 cluvfy comp ocr -n all [-verbose]
使用ocrdump和ocrcheck工具来诊断ocr问题
ocrdump工具可以将ocr内容写到一个文件,这样可以检查ocr内容
ocrcheck来检验ocr一致性。
使用ocr exports来管理ocr
除了使用自动创建的ocr备份,你也可以导出ocr内容在做出重大配置改变的时候,比如添加,删除节点,修改集群资源,或创建数据库,使用ocrconfig -export命令,如果你配置的改变导致了错误,那么使用-import来恢复。
在unix系统上导入ocr
1停止集群
2使用ocrconfig -import file_name
3重启集群
5检查ocr一致性 cluvfy comp ocr -n all [-verbose]