数据库巡检

每个公司的数据库巡检不一样,但是巡检的内容是一样的。
检查的内容:
1.操作系统 (运维工程师)
内存的使用情况,磁盘的使用情况,swap空间的大小
2.存储的可用性(出了问题,赶快找厂商) (存储工程师)
3.网络通不通,网络的带宽够不够用。一般使用监控软件(网络工程师)
4. DBA

1>每天查看告警日志
 ORA--- //数据库已经存在错误,应用或者系统有问题需要立即解决
 WARING-- //数据库存在告警,需要关注和解决
 windows系统中放到审计路径下
 linux默认路径:10g---- $ORALCE_HOME/admin/alter/alter_SID.log
 11g-----$OARACL_BASE/diag/rdbms/db_unique_name/instance_name/trace/alter_sid.log
 background_dump_dest:
 2>datafile
 数据库中有哪些数据文件,状态是否正常(online|offline|recovery ),文件是否存在
 表空间的大小,表空间的状态,空间使用情况(没有使用自动扩容,80%以上就需要扩容)
 3>redo logfile 日志文件
 项目中至少3个组,每个组至少2个成员,系统文件中是否有查看物理文件是否存在,状态是否正常。日志切换频率,如果日志切换的时间少于15分钟,用视图v$log_history
 SQL> select FIRST_CHANGE#,FIRST_TIME from v$log_history;4>控制文件的大小一般控制在100M,如果超过100M我们需要清空控制文件,即重建日志文件。三个月到半年巡检一次,重建
 5>归档,密码文件,参数文件
 6>备份,每天都要检查 检测备份的有效性,过期的备份可删除,备份都不要删
 crosscheck backup //检查备份是否可用
 list failure //检查备份文件是否存在坏块,列出有问题的文件,可以用repair failure 去修复坏块
 7>检查DG日志的应用情况,状态是否正常。
 v$archived_log //查看主备的seq,apply 两边是否同步
 8>rac 关注实例运行状态是否正常,
 srvctl status database -d db_unique_name //查看实例是否正常
 网络是否正常,磁盘是否都mount9>数据库的性能,cpu ,内存的使用 需要用报表 awr---- 或者 addm 或者v$sga_advice 需要在业务高峰期的情况下

巡检过程必须形成报告:
1.检查目的
2.巡检的内容,指出存在问题,给出问题解决的建议
3.dblink是否能正常连建,tnsname文件
4.网络是否存在问题,系统是否存在问题
5.发给领导