正所谓“福无双至,祸不单行”,生产上有套2节点Oracle11.2.0.4数据库,其中2节点因硬件故障宕机,1节点去HANG住了。我们一起来分析这起故障。凌晨4点半,值班同时电话说一套生产库节点2宕机了,机房的同事看机器正在启动,估计是硬件原因导致的。心想节点2宕了还有一个节点1在跑,应该问题不大,于是继续睡觉,离公司近的另一位DBA同事赶往现场支持。可是没有过多长时间,到现场的DBA反馈信息:活
最近生产上出了很多“奇怪”的问题,比如下面要分享的一个故障,一套11.2.0.4 两节点RAC数据库,2节点的集群组件会不定日期的重启,但重启的时间段比较固定,都是凌晨4:50左右。而且几分钟就会恢复。废话不多说,直接上整个问题的处理思路及过程。
Copyright © 2005-2023 51CTO.COM 版权所有 京ICP证060544号