+查看主节点和副节点

oclumon manage -get MASTER REPLICA

+查看当前的统计信息和保存的时间段

oclmon manage -get repsize

+收集时间段内的节点统计信息

ocalumon dumpnodeview -allnodes -v -s "2019-3-25 16:26:22" -e "2019-3-25 16:26:23" >/tmp/logs.log

+访问CHM数据 的进程

ps -elf|grep osysmond

ps -elf|grep ologgerd


+案例分析 OLR 导致节点无法启动

ps -ef|grep has

root 1117 1 0 Mar14 ? 00:00:00 /bin/sh /etc/init.d/init.ohasd run

root 2313 1 0 Mar14 ? 00:48:57 /oracle/11.2.0/grid/crs/bin/ohasd.bin reboot

grid 2490 1736 0 16:31 pts/0 00:00:00 grep has

+日志查看确定问题位置

[root@node1 ~]# find / -name "ohasd.log"

/oracle/11.2.0/grid/crs/log/node1/ohasd/ohasd.log

+确定存放位置

[root@node1 ~]# ll /oracle/11.2.0/grid/crs/cdata/

total 2904

drwxrwxr-x 2 grid oinstall 4096 Mar 25 15:06 dbcluster

drwxr-xr-x 2 grid oinstall 4096 Mar 5 15:16 localhost

drwxr-xr-x 2 grid oinstall 4096 Mar 5 15:31 node1

-rw------- 1 grid oinstall 272756736 Mar 25 15:11 node1.olr <<<-----这个文件

恢复操作略 ... 备份恢复可以完成 备份路径在node1位置,即当前目录


root.sh脚本 运行出错,详细日志查看位置

[root@node1 ~]# find / -name "rootcrs_*"

/oracle/11.2.0/grid/crs/cfgtoollogs/crsconfig/rootcrs_node1.log

根据日志来分析问题


了解ocssd.bin如何控制RAC节点重启

查看 节点情况

crsctl stat res -t

提升日志等级获取更多日志

crsctl debug log css CSSD:2 ------>11G 操作 crsctl set log css CSSD:2 这个代替了debug

[root@node1 ~]# crsctl get log css CSSD

Get CSSD Module: CSSD Log Level: 2

查看

进程情况

[root@node1 ~]# ps -ef|grep cssd.bin

grid 2823 1 0 Mar14 ? 00:20:36 /oracle/11.2.0/grid/crs/bin/ocssd.bin

root 11154 2632 0 17:02 pts/0 00:00:00 grep cssd.bin

[root@node1 ~]#

[root@node1 ~]# ll -h /oracle/11.2.0/grid/crs/log/node1/cssd/ocssd.log

-rw-r--r-- 1 grid oinstall 29M Mar 25 17:03 /oracle/11.2.0/grid/crs/log/node1/cssd/ocssd.log

节点日志分析