Oracle CRS简介








从Oracle 10gR1 RAC 开始,Oracle推出了自身的集群软件,这个软件的名称叫做Oracle Cluster Ready Service(Oracle集群就绪服务),简称CRS。从Oracle 10gR2开始,包括最新的11g,Oracle将其更名为Clusterware(集群件),但通常意义上我们认为CRS = Clusterware = Oracle Cluster Ready Service = Oracle Cluster Software.

CRS一般用来搭建Oracle的并行数据库,即RAC,但除了与RAC的接口之外,CRS还提供了一组高可用性的应用程序接口(API),用来搭建一般应用程序的高可用集群,即一般我们常说的双机热备,比如使用CRS实现MySQL的双机热备。

Oracle10g New Feature:CRS(Cluster Ready Services)

作者:eygle |English Version【转载时请以超链接形式标明文章出处和作者信息及本声明
链接:http://www.eygle.com/archives/2005/10/oracle10g_new_feature_crs.html

Oracle10g CRS(Cluster Ready Services)是Oracle10g RAC的一个新特性,用以提供标准的群集服务接口。
在以前的版本中,Oracle RAC必须借助第三方Cluster软件,但是从Oracle10g开始,我们有了新的选择。
CRS就是这样一个替代产品,用以提供RAC环境中的群集服务。

CRS是一个单独的产品,在构建RAC环境中,需要单独安装。

(在Oracle刚推出CRS时,Oracle还没发明ClusterWare这个词。
所以最初的CRS就是指现在的Clusterware,如果你注意过的话最初Oracle的安装盘上装Clusterware的时候,都说的是CRS。

所以提到Cluster Ready Services,大家都知道指的是Oracle的Clusterware而不是crs daemon.

只不过从10gR2开始,ClusterWare被引入,CRS这个词的含义被Oracle偷偷的缩小了。)

系统启动以后,CRS会自动启动,启动主要由/etc/init.d中的几个脚本完成:


 

[eygle@raclinux1 init.d]$ ll init*
-r-xr-xr-x  1 root root  1951 Jun 27 13:27 init.crs
-r-xr-xr-x  1 root root  4735 Jun 27 20:32 init.crsd
-r-xr-xr-x  1 root root 35401 Jun 27 13:27 init.cssd
-r-xr-xr-x  1 root root  3197 Jun 27 13:27 init.evmd



CRS启动的三个主要的后台进程为:

[oracle@raclinux1 bin]$ ps -ef|grep d.bin
root      3140     1  0 23:13         00:00:00 /u01/app/oracle/product/10.2.0/crs/bin/crsd.bin
oracle    3884  3062  0 23:14         00:00:00 /u01/app/oracle/product/10.2.0/crs/bin/evmd.bin
oracle    4017  3983  0 23:14         00:00:00 /u01/app/oracle/product/10.2.0/crs/bin/ocssd.bin
oracle   21117 13799  0 23:29 pts/1   00:00:00 grep d.bin




这几个进程的主要作用如下:

CRSD:
- Engine for HA operation 
- Manages 'application resources'
- Starts, stops, and fails 'application resources' over
- Spawns separate 'actions' to start/stop/check application resources
- Maintains configuration profiles in the OCR (Oracle Configuration Repository)
- Stores current known state in the OCR.
- Runs as root
- Is restarted automatically on failure

OCSSD:
- OCSSD is part of RAC and Single Instance with ASM
- Provides access to node membership
- Provides group services
- Provides basic cluster locking
- Integrates with existing vendor clusteware, when present
- Can also runs without integration to vendor clustware
- Runs as Oracle.
- Failure exit causes machine reboot.  
--- This is a feature to prevent data corruption in event of a split brain.

注意,ocssd进程在单实例ASM系统中也可以见到,以下是我的一个单实例ASM系统,ocssd进程同样存在:

bash-2.03# ps -ef|grep _+ASM
  oracle  3264     1  0   Aug 25 ?        0:01 asm_lgwr_+ASM
    root 12669  8167  0 11:58:56 pts/1    0:00 grep _+ASM
  oracle  3270     1  0   Aug 25 ?        0:00 asm_rbal_+ASM
  oracle  3266     1  0   Aug 25 ?        0:05 asm_ckpt_+ASM
  oracle  3268     1  0   Aug 25 ?        0:00 asm_smon_+ASM
  oracle  3262     1  0   Aug 25 ?        0:00 asm_dbw0_+ASM
  oracle  3258     1  0   Aug 25 ?        0:00 asm_pmon_+ASM
  oracle  3260     1  0   Aug 25 ?        0:00 asm_mman_+ASM
bash-2.03# ps -ef|grep ocssd
    root 12672  8167  0 11:59:01 pts/1    0:00 grep ocssd
  oracle  5374     1  0   Apr 07 ?        0:01 /opt/oracle/product/10.1.0/bin/ocssd.bin
bash-2.03#


ocssd进程非常重要,如果该进程异常中止,会导致系统crash。
在某些极端情况下,如果ocssd无法正常启动,会导致操作系统循环重启。这时候需要DBA介入进行一些特殊处理。(解决循环重启的问题是修改/etc/init.d/init.cssd文件,注释掉其中FAST_REBOOT语句)

EVMD:
- Generates events when things happen
- Spawns a permanent child evmlogger
- Evmlogger, on demand, spawns children
- Scans callout directory and invokes callouts.
- Runs as Oracle.
- Restarted automatically on failure



我们可以通过CRS工具来查看CRS状态:

[oracle@raclinux1 ~]$ cd $ORA_CRS_HOME/bin
[oracle@raclinux1 bin]$ pwd
/u01/app/oracle/product/10.2.0/crs/bin
[oracle@raclinux1 bin]$ ./crs_stat
NAME=ora.RACDB.RACDB1.inst
TYPE=application
TARGET=ONLINE
STATE=ONLINE on raclinux1

NAME=ora.RACDB.RACDB2.inst
TYPE=application
TARGET=ONLINE
STATE=ONLINE on raclinux1

NAME=ora.RACDB.db
TYPE=application
TARGET=ONLINE
STATE=ONLINE on raclinux1

NAME=ora.raclinux1.ASM1.asm
TYPE=application
TARGET=ONLINE
STATE=ONLINE on raclinux1

NAME=ora.raclinux1.LISTENER2_RACLINUX1.lsnr
TYPE=application
TARGET=ONLINE
STATE=ONLINE on raclinux1

NAME=ora.raclinux1.LISTENER_RACLINUX1.lsnr
TYPE=application
TARGET=ONLINE
STATE=ONLINE on raclinux1

NAME=ora.raclinux1.gsd
TYPE=application
TARGET=ONLINE
STATE=ONLINE on raclinux1

NAME=ora.raclinux1.ons
TYPE=application
TARGET=ONLINE
STATE=ONLINE on raclinux1

NAME=ora.raclinux1.vip
TYPE=application
TARGET=ONLINE
STATE=ONLINE on raclinux1

[oracle@raclinux1 bin]$